1樓:匿名使用者
都任意字元了那還匹配什麼啊,沒有匹配的依據了麼。要就是 .* ,所有字元均匹配,不如直接引用原字串。
或者是以換行為依據?那隻要順序讀每個字元看看是不是\r或\n的回車換行符就可以了。
2樓:
你的意思應該是提取 每樓帖子的內容吧。
下面的正則你試下
.*.*
我測試是可以提取出來的
oracle正規表示式如何查詢一個字串裡面包含了任意標點符號的所有記錄。
3樓:匿名使用者
用 regexp_like這個函式來解決,正規表示式為:[[:punct:]]+這個正則可以找出任何標點符號。
查詢value中包含任何標點符號的記錄如下:
select * from *** where regexp_like(value,'[[:punct:]]+');
posix 正規表示式由標準的元字元(metacharacters)所構成: '$' 匹配輸入字串的結尾位置。如果設定了 regexp 物件的 multiline 屬性,則 $ 也匹配 '\n' 或 '\r'。
'?' 匹配前面的子表示式零次或一次。 '*' 匹配前面的子表示式零次或多次。
'|' 指明兩項之間的一個選擇。例子'^([a-z]+|[0-9]+)$'表示所有小寫字母或數字組合成的 '( )' 標記一個子表示式的開始和結束位置。 '' 一個精確地出現次數範圍,m=《出現次數<=n,''表示出現m次,''表示至少出現m次。
\num 匹配 num,其中 num 是一個正整數。對所獲取的匹配的引用。 [[:alpha:]] 任何字母。
[[:digit:]] 任何數字。
[[:alnum:]] 任何字母和數字。
[[:space:]] 任何白字元。
[[:upper:]] 任何大寫字母。
[[:lower:]] 任何小寫字母。
[[:punct:]] 任何標點符號。
[[:xdigit:]] 任何16進位制的數字,相當於[0-9a-fa-f]。
\轉義符 *, +, ?, , , 限定符^, $, anymetacharacter 位置和順序。
4樓:匿名使用者
[[:punct:]]
匹配標點
再全表minus一次regexp_like出來的結果
5樓:匿名使用者
select * from recommendation where regexp_like(recocontent, '/\w[a-za-z0-9]*/');
求一個正規表示式6-16位字元(英文/數字/符號)至少兩種組合的正規表示式啊高分回報!
正規表示式如何匹配漢字?
6樓:匿名使用者
去掉 ^ 和 $ 試試 [\u4e00-\u9fa5]
\u數字,在perl、pcre中要改為:
[\x-\x]
7樓:匿名使用者
按.net的標準,\w本來就是可以匹配:漢字,字母,數字,下劃線。的所以一般\w可以滿足需求了。
如果需要排除字母數字的話,可以這樣:
(?![a-za-z0-9_])\w
>_>這樣寫估計效率不高
所以一般來說還是直接匹配指定的unicode碼\unnnn unicode**中十六進位制**為nnnn的字元漢字(字元) [\u4e00-\u9fa5]中文及全形標點符號(字元) [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]
怎樣獲取正規表示式匹配字串的一部分
8樓:匿名使用者
使用正規表示式獲取匹配字串時
pattern mpattern = pattern.compile("(.*?)");
matcher mmatcher = mpattern.matcher(xml);
arraylistarraylist_title = new arraylist();
while(mmatcher.find())
arraylist_title.add(mmatcher.group());
2.1 元字元
在正規表示式中,元字元(metacharacter)是一類非常特殊的字元,它能夠匹配一個位置或字符集合中的一個字元,如:、 \w等。根據功能,元字元可以分為兩種型別:
匹配位置的元字元和匹配字元的元字元。
2.1.1 匹配位置的元字元
包括:^、$、和\b。其中^(脫字元號)和$(美元符號)都匹配一個位置,分別匹配行的開始和結尾。
比如,^string匹配以string開頭的行,string$匹配以string結尾的行。^string$匹配以string開始和結尾的行。單個$匹配一個空行。
單個^匹配任意行。\b匹配單詞的開始和結尾,如:\bstr匹配以str開始的單詞,但\b不匹配空格、標點符號或換行符號,所以,\bstr可以匹配string、string fomat等單詞。
\bstr正規表示式匹配的字串必須以str開頭,並且str以前是單詞的分界處,但此正規表示式不能限定str之後的字串形式。以下正規表示式匹配以ing結尾的字串,如string、this is a string等
ing\b
正規表示式ing\b匹配的字串必須以ing結尾,並且ing後是分界符,以下正規表示式匹配一個完整的單詞:\bstring\b。
2.1.2 匹配字元的元字元
匹配字元的元字元有7個:.(點號)、\w、\w、、s\、\s、\d和\d。其中點號匹配除換行之外的任意字元;\w匹配單詞字元(包括字母、漢字、下劃線和數字);\w匹配任意非單詞字元、\s匹配任意的空白字元,如空格、製表符、換行等;\s匹配任意的非空白字元;\d匹配任意數字字元;\d匹配任意的非數字字元。
如:^.$匹配一個非空行,在該行中可以包含除了換行符以外的任意字元。
^\w$匹配一個非空行,並且該行中只能包含字母、數字、下劃線和漢字中的任意字元。
\ba\w\w\w\w\w\w\\b匹配以字母a開頭長度等於7的任意單詞
2.2 字元類
字元類是一個字符集合,如果該字符集合中的任何一個字元被匹配,則它會找到該匹配項。字元類可以在(方括號)中定義。如:
[012345]可以匹配數字0到5中的任意一個。
可以匹配html標籤中的h1到h6。
[jj]ack可以匹配字串jack或jack。
求一個正規表示式可以匹配:中文字元,中文標點符號,英文,數字,下劃線。但不能輸入@、# 等特殊字元.
9樓:
\w+|[,。《》()、—]+
\w匹配:中文字元,英文,數字,下劃線
至於中文標點符號,看你需要了,如果有另外的就新增在中括號裡面。
10樓:匿名使用者
\w不匹配中文字元的
11樓:
[^%&',;=?$\x22]+
12樓:匿名使用者
/^(?: [^[:punct:]] | \_ )+$/x
13樓:匿名使用者
^[^!@#$%^&*()-=+]+$
正規表示式如何匹配除某些字串以外的所有字元
14樓:
你對正規表示式的理解可能存在誤區,用[ ]括起來的是匹配任意字元,根據你的要求,應該是想要匹配所有以abc開始,以.zip結束的字元,寫法應該是這樣(abc).+(\.
zip)。
在方括號[ ]中,除了^,-,一切特殊符號全部失效,你的[^abc.*?.zip]這個正規表示式,實際意思是,匹配除了a,b,c,.,*,?,z,i,p之外的一切字元
c++正規表示式如何匹配漢字
15樓:緋彈亞絲娜
按.net的標準,\w本來就是可以匹配:漢字,字母,數字,下劃線。的所以一般\w可以滿足需求了。
如果需要排除字母數字的話,可以這樣:
(?![a-za-z0-9_])\w
>_>這樣寫估計效率不高
所以一般來說還是直接匹配指定的unicode碼\unnnn unicode**中十六進位制**為nnnn的字元漢字(字元) [\u4e00-\u9fa5]中文及全形標點符號(字元) [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]
正規表示式如何匹配出最短字串,正規表示式如何匹配除某些字串以外的所有字元
當正規表示式中包含能接受重複的限定符時,通常的行為是 在使整個表示式能得到匹配的前提下 匹配儘可能多的字元。考慮這個表示式 a.b,它將會匹配最長的以a開始,以b結束的字串。如果用它來搜尋aabab的話,它會匹配整個字串aabab。這被稱為貪婪匹配。有時,我們更需要懶惰匹配,也就是匹配儘可能少的字元...
正規表示式如何匹配excel檔案
對應的正規表示式 xls xl xla xlt xlm xlc xlw 如果匹配上面的表示式,則檔案是excel檔案 我在kettle 用 xl?判斷是否是excel檔案的正規表示式 xls.驗證這樣形式的 xls?或者 xlsx?匹配所有.xls結尾的檔案或.xlsx的檔案 對應的正規表示式 xl...
lua正規表示式,LUA 正規表示式
lua中修飾符 和 都表示匹配前一字元0次或多次,但 進行的是最短匹配,類似傳統正則中的非貪婪匹配,而 則是最長匹配,即貪婪匹配 由於你正則中最後一個 d 後面沒有任何東西了,那這個 進行了最短匹配,即什麼都不匹配,所以沒有捕獲到1999,而加上 後,由於有了結尾標識位,就必須匹配1999才能使整個...