转载

正则表达式 /b

引用网上一段话：

/b 是正则表达式规定的一个特殊代码（好吧，某些人叫它元字符，metacharacter），代表着单词的开头或结尾，也就是单词的分界处。虽然通常英文的单词是由空格，标点符号或者换行来分隔的，但是 /b 并不匹配这些单词分隔字符中的任何一个，它只匹配一个位置。

如果需要更精确的说法，/b 匹配这样的位置：它的前一个字符和后一个字符不全是(一个是,一个不是或不存在) /w。

很多人不怎么理解正则中的 /b 含义，看到上面一段话后，很多人还是不怎么理解 /b 究竟是怎样的一个“位置”。

今天就来说说我的理解。

什么是位置

It's a nice day today.

'I' 占一个位置，'t' 占一个位置，所有的单个字符（包括不可见的空白字符）都会占一个位置，这样的位置我给它取个名字叫“显式位置”。

注意：字符与字符之间还有一个位置，例如 'I' 和 't' 之间就有一个位置（没有任何东西），这样的位置我给它取个名字叫“隐式位置”。

“隐式位置”就是 /b 的关键！通俗的理解，/b 就是“隐式位置”。

此时，再来理解一下这句话：

如果需要更精确的说法，/b 匹配这样的位置：它的前一个字符和后一个字符不全是(一个是,一个不是或不存在) /w。

我用我的话来翻译一下这句话：

“隐式位置” /b，匹配这样的位置：它的前一个“显式位置”字符和后一个“显式位置”字符不全是 /w。

此刻，有没有一种豁然开朗的感觉？有么有？有么有？有么有？

实例讲解

就用 "It's a nice day today." 举例说明：

正确的正则：/bnice/b

分析：第一个 /b 前面一个字符是空格，后面一个字符是 'n'，不全是 /w，所以可以匹配出 'n' 是一个单词的开头。第二个 /b 前面一个字符是 'e'，后面一个字符是空格，不全是 /w，可以匹配出 'e' 是一个单词的结尾。所以，合在一起，就能匹配出以 'n' 开头以 'e' 结尾的单词，这里就能匹配出 "nice" 这个单词。

错误的正则：a/bnice

分析：我见过有人类似于这样来写正则，想要达到的目的是匹配出上一个单词以 'a' 结尾，下一个单词以 'n' 开头的部分，这里想匹配出 "a nice"。但是这个正则表达的可不是这个目的，/b 前面是字符 'a'，后面是字符 'n'，两个都是“显式字符”，显然违背了 /b 的含义，所以这就是个错误的表达式，匹配不出任何东西。想要匹配出 "a nice"，正确的正则写法是：a/b./bnice（不能换行）

正文到此结束