runsly 技术分享 2022-02-15

详解notepad++的搜索功能

notepad++的搜索功能（正则表达式）

我们知道notepad++是一个非常强大的编辑器，相信同学们一定是装机必备的一个工具。它对文本的编辑和查看有着非常友好的支持能力，对较大文件的处理也非常的不错。例如，我们系统运行的过程中生成的文本格式的日志，它通常是一个比较大的文件，一般我们可以使用notepad++快速打开日志文件。不过，对于日志文件来说，里面会记录各种来个不同地方的信息，比如，各种服务，各种进程，各种线程，各种模块等等。在我们分析日志文件是，有时要快速定位到问题或者某个相关模块的问题，就需要用到它的搜索功能，我们需要匹配特定的关键字进行搜索有用信息，查看相关的日志内容。关于notepad++搜索功能，直接快捷键Ctrl+F就可以直接调出搜索窗口了。

看到这里你一定会觉得这个有什么好学习的呀！哈哈，没错，上面这些内容大家都是知道的常识。不过，从上面的图上大家可以发现，notepad++支持三种搜索模式：

正常模式
扩展模式
正则表达式模式

notepad++的正则表达模式，就像他的名字一样，这个模式支持使用正则表达式搜索，当我们熟悉了正则表达式的使用后，相信你就会爱上使用notepad++的这个功能。

常用表达式
下面列出了一些常用的正则表达式匹配符号，便于各位同学查找和学习。

字符	说明
`.`	匹配任意一个字符
`*`	匹配前面的字符0或多次，比如，`ab*`匹配“a”,“ab”或“abb”
`+`	匹配前面的字符1次或多次，比如，`ab+`匹配“ab”或“abb”，但不匹配“a”
`?`	匹配前面的字符0或者1次，比如，`ab?`匹配“a”或“ab”，但不匹配“abb”
`{n}`	匹配前面的字符或分组 n 次，比如，`ab{2}c` 匹配 “abbc”.
`{m,n}`	匹配前面的字符或分组，最少m次，最多n次（若n为空，则代表任意次），比如，`ab{2,3}c` 匹配 “abbc” 或 “abbbc”
`^`	右侧的表达式匹配在一行的开始，比如，`^a`匹配以“a”开头的行
`$`	左侧的表达式被匹配在一行的结尾，比如，`z$`匹配以“z”结尾的行
`[]`	匹配列表中任意单个字符，比如，`[ab]`匹配“a”或“b”；`[0-9]`匹配任意单个0-9的数字
`[^]`	匹配列表外任意单个字符，比如，`[^ab]`匹配“a”和“b”以外的单个字符
`\w`	匹配单个字符，包括下划线，相当于`[A-Za-z0-9_]`
`\W`	匹配非单个字符，相当于`[^A-Za-z0-9_]`
`\d`	匹配数字字符，相当于`[0-9]`
`\D`	匹配非数字字符，相当于`[^0-9]`
`\b`	匹配单词边界（开头或结尾），比如，`\bhe`匹配“hello”，但不匹配“ahello”
`\B`	匹配非单词边界
`\|`	或运算符，匹配左边或者右边的表达式
`\s`	匹配空白格
`\S`	匹配非空白格
`\\`	匹配字符`\`
`\t`	匹配Tab制表符
`\r`	匹配回车符号
`\n`	匹配换行符号
`\r\n`	匹配回车换行

标记和分组

上面的符号是对一个字符或重复一个字符的情况，但是，如果是多个字符怎么办呢？我们就需要用到分组了，关于分组可以使用小括号()来指定分组表达式，例如：(abc)? 表示匹配0个或1个abc，这里一个括号的表达式就是一个分组。分组可以分为两种形式，捕获组和非捕获组。捕获组可以通过从左到右计算其开括号来编号；而非捕获组是以 (?) 开头的组，它不捕获文本。

字符	说明
`(…)`	一组捕获. 可以通过`\1` 访问第一个组, `\2` 访问第二个.
`(?:…)`	非捕获组.
`(?=…)`	非捕获组 – 向前断言. 例如`(.*)(?=ton)` 表达式，当遇到’Appleton’字符串时，会匹配为’Apple’.
`(?<=…)`	非捕获组 – 向后断言. 例如`(?<=sir) (.*)` 表示式，当遇到’sir William’ 字符串时，匹配为’ William’.
`(?!…)`	非捕获组 – 消极的向前断言. 例如`(?!e)` 表达式，当遇到’Apple’时，会找到每个字母除了 ‘l’，因为它紧跟着 ‘e’.
`(?<!...)`	非捕获组 – 消极向后断言. 例如， `(?<!sir) (.*)(?=ton)`, 当遇到 ‘sir William’ 时，会匹配 ’ William’.
`(?P<name>…)`	命名所捕获的组. 提交一个名称到组中供后续使用，例如`(?PA[^\s]+)\s(?P=first)` 会匹配 ‘Apple Apple’. 类似于 `(A[^\s]+)\s\1` ，不过使用的是组名而不是数字.
`(?=name)`	匹配名为name的组.
`(?#comment)`	批注 –括号中的内容在匹配时将被忽略。