详解notepad++的搜索功能

notepad++的搜索功能(正则表达式)

我们知道notepad++是一个非常强大的编辑器,相信同学们一定是装机必备的一个工具。它对文本的编辑和查看有着非常友好的支持能力,对较大文件的处理也非常的不错。例如,我们系统运行的过程中生成的文本格式的日志,它通常是一个比较大的文件,一般我们可以使用notepad++快速打开日志文件。不过,对于日志文件来说,里面会记录各种来个不同地方的信息,比如,各种服务,各种进程,各种线程,各种模块等等。在我们分析日志文件是,有时要快速定位到问题或者某个相关模块的问题,就需要用到它的搜索功能,我们需要匹配特定的关键字进行搜索有用信息,查看相关的日志内容。关于notepad++搜索功能,直接快捷键Ctrl+F就可以直接调出搜索窗口了。

看到这里你一定会觉得这个有什么好学习的呀!哈哈,没错,上面这些内容大家都是知道的常识。不过,从上面的图上大家可以发现,notepad++支持三种搜索模式:

 

  • 正常模式
  • 扩展模式
  • 正则表达式模式

notepad++的正则表达模式,就像他的名字一样,这个模式支持使用正则表达式搜索,当我们熟悉了正则表达式的使用后,相信你就会爱上使用notepad++的这个功能。

常用表达式
下面列出了一些常用的正则表达式匹配符号,便于各位同学查找和学习。

 

字符 说明
. 匹配任意一个字符
* 匹配前面的字符0或多次,比如,ab*匹配“a”,“ab”或“abb”
+ 匹配前面的字符1次或多次,比如,ab+匹配“ab”或“abb”,但不匹配“a”
? 匹配前面的字符0或者1次,比如,ab?匹配“a”或“ab”,但不匹配“abb”
{n} 匹配前面的字符或分组 n 次,比如,ab{2}c 匹配 “abbc”.
{m,n} 匹配前面的字符或分组,最少m次,最多n次(若n为空,则代表任意次),比如,ab{2,3}c 匹配 “abbc” 或 “abbbc”
^ 右侧的表达式匹配在一行的开始,比如,^a匹配以“a”开头的行
$ 左侧的表达式被匹配在一行的结尾,比如,z$匹配以“z”结尾的行
[] 匹配列表中任意单个字符,比如,[ab]匹配“a”或“b”;[0-9]匹配任意单个0-9的数字
[^] 匹配列表外任意单个字符,比如,[^ab]匹配“a”和“b”以外的单个字符
\w 匹配单个字符,包括下划线,相当于[A-Za-z0-9_]
\W 匹配非单个字符,相当于[^A-Za-z0-9_]
\d 匹配数字字符,相当于[0-9]
\D 匹配非数字字符,相当于[^0-9]
\b 匹配单词边界(开头或结尾),比如,\bhe匹配“hello”,但不匹配“ahello”
\B 匹配非单词边界
| 或运算符,匹配左边或者右边的表达式
\s 匹配空白格
\S 匹配非空白格
\\ 匹配字符\
\t 匹配Tab制表符
\r 匹配回车符号
\n 匹配换行符号
\r\n 匹配回车换行

标记和分组

 

上面的符号是对一个字符或重复一个字符的情况,但是,如果是多个字符怎么办呢?我们就需要用到分组了,关于分组可以使用小括号()来指定分组表达式,例如:(abc)? 表示匹配0个或1个abc, 这里一个括号的表达式就是一个分组 。分组可以分为两种形式,捕获组和非捕获组。捕获组可以通过从左到右计算其开括号来编号;而非捕获组是以 (?) 开头的组,它不捕获文本。

字符 说明
(…) 一组捕获. 可以通过\1 访问第一个组, \2 访问第二个.
(?:…) 非捕获组.
(?=…) 非捕获组 – 向前断言. 例如(.*)(?=ton) 表达式,当 遇到’Appleton’字符串时,会匹配为’Apple’.
(?<=…) 非捕获组 – 向后断言. 例如(?<=sir) (.*) 表示式,当遇到’sir William’ 字符串时,匹配为’ William’.
(?!…) 非捕获组 – 消极的向前断言. 例如(?!e) 表达式,当遇到’Apple’时,会找到每个字母除了 ‘l’,因为它紧跟着 ‘e’.
(?<!...) 非捕获组 – 消极向后断言. 例如, (?<!sir) (.*)(?=ton), 当遇到 ‘sir William’ 时,会匹配 ’ William’.
(?P<name>…) 命名所捕获的组. 提交一个名称到组中供后续使用,例如(?PA[^\s]+)\s(?P=first) 会匹配 ‘Apple Apple’. 类似于 (A[^\s]+)\s\1 ,不过使用的是组名而不是数字.
(?=name) 匹配名为name的组.
(?#comment) 批注 –括号中的内容在匹配时将被忽略。

细心的同学一定会发现,除了搜索功能支持正则表达在外,notepad++的替换功能同样也是支持正则表达式的。上面的这些符号在替换中也是同样适用的。