請賜教 正則執行步驟怎麼看

請教 正則執行步驟怎麼看

a?? 去匹配 aaaa

為何是匹配了9次, 這匹配的次數怎麼算

a? Zero or one a’s (greedy)
a?? Zero or one a’s (lazy)
a* Zero or more a’s (greedy)
a*? Zero or more a’s (lazy)
a+ One or more a’s (greedy)
a+? One or more a’s (lazy)

貪婪和懶墮模式…看不太懂
Regex101的執行步驟數和位置都看不懂…我想這對於匹配應該是蠻重要的…

浅析正则表达式—(原理篇)这个原理篇有图,很直观

感謝 endnote 兄指點迷津… Thanks a lot
但還是一個問題…匹配的步驟數找不到有解釋的
也就是對每個步驟的解析似乎都沒有深入探討和解釋

5个“间隙”,加上4个 “a”,不就等于9次匹配么?

“a?” 匹配的是0个或者1个 “a”,后面的那个 “?”,代表非贪婪模式,也是说优先匹配0个 “a"(间隙),退而求其次匹配1个 “a”。正则表达式能匹配“间隙”,比如 “\b” 和 “\B” 就匹配与 “\w”、“\W” 有关的“间隙”。

regex101 网站,点击右上角“汉堡”图标可以看说明的。

2 个赞

耐心看,实在不懂就下一段。大和尚太过于花心。。。。

控制权和传动

正则表达式由左到右依次进行匹配,通常情况下是由一个表达式取得控制权,从字符串的的某个位置进行匹配,一个子表达式开始尝试匹配的位置,是从前一子表达匹配成功的结束位置开始的(例如:(表达式一)(表达式二)意思就是表达式一匹配完成后才能匹配表达式二,而匹配表达式二的位置是从表达式一的位置匹配结束后的位置开始)。如果表达式一是零宽度,那表达式一匹配完成后,表达式二匹配的位置还是原来表达式以匹配的位置。也就是说它匹配开始和结束的位置是同一个。
举一个简单的例子进行说明:正则表达式:123

源数据:123

讲解:首先正则表达式是从最左侧开始进行匹配,也就是位置0处进行匹配,首先得到控制权的是正则表达式中的“1”,而不是源数据中的“1”,匹配源数据中的“1”,匹配成功,将源数据的“1”进行保存到匹配的结果当中,这就表明它占有了一个字符,接下来就将控制权传给正则表达式中的“2”,匹配的位置变成了位置1,匹配源数据中的“2”,匹配成功,将控制权又传动给了正则表达式的“3”,这时候匹配的位置变成了位置2,这时候就会将源数据中的“3”进行匹配。又有正则表达式“3”进行传动控制权,发现已经到了正则表达式的末尾,正则表达式结束。

1 个赞

哇!luker 兄,一語點出重點觀念…現在才知道間隙也能匹配…讚!…
找不到你說的漢堡是哪個

endnote 兄,謝謝你,讚!漂亮了!解釋好詳細…我得好好看看研究一下

网站右上位置,图标是“三根横线”,点进去之后,前两个选项就是对匹配结果的解释。

哈哈,也许吧。各花入各眼。这篇文章阅读量- 33万,比较适合我。

看看大和尚的机缘如何,不过烦恼即菩提,我猜他马上就要初窥门径了。但最首要的,需要让方丈棒喝一下,罚他面壁十年不得近酒色,方能登堂入室。


老哥…找不到右上角有3條線的…

Endnote 兄,小弟已關機很久了!已快要不能人道了…哈!哈哈哈哈哈!

喔!理解了…嗯嗯…謝謝老哥指點…

endnote 兄,謝謝你詳細地說明,終於搞懂匹配和位置,和你說的控製權和傳動了… thanks again

1 个赞

位置是行首行尾之类的信息,匹配是字符内容。程序其实很笨,你说不清楚它就会乱七八糟的找。

明白这些概念虽然才算刚入门径,但却是至关重要的基础概念。

继续找例子来揣摩,熟能生巧

1 个赞

endnote 兄
另一位高人給出的 等式
執行步驟一樣9步,但似乎略有不同,差異在第幾步完成
a? == a|
a?? == |a

贪婪与懒惰的理解,首先要知道

当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。

有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。

表达式怎么写,是基于充分认识你所需处理的文本之上的。

如果所需处理的文本变的更复杂了,表达式可能需要调整。
多看别人的例子体会,然后自己动手试错。或者上bilibili找一些视频教程来看

1 个赞

再次感謝 老哥帶路指引,都不知道有這麼多教學…比YouTube還多…謝謝啦!

1 个赞

给大和尚再推荐一个正则Interactive Tutorial
https://www.regexone.com/

1 个赞

謝謝啦!最近看的頭好暈…

①一個問題請較,若是要替換的字串很長,已超過 emeditor or ultraedit 替代框內的長度,該如何處理
是否有其它的工具來處理類似這種狀況呢
②另外還有一個疑問,若是想在整部詞典內的內容中加入 <p><a id="0001" href="entry://C4">Jump to Chapter 4</a></p>
但這 id 是需要自動的去增碼…因若要唯一的跳轉應該是只能用 id 編碼…請問類似此問題,正則能解嗎?,還是說有其它的工具能完成
@endnote @lurker