网站首页 > 建站教程 > PHP编程教程 > 正文

Notepad++ 使用正则表达式

学技巧网站制作 PHP编程教程

2019-08-31 10:24:00 108

最近在写论文，使用notepad++处理一些文本数据，想要匹配一些特定的汉字，但是人工去看太麻烦了，于是想到了用正则表达式。

notepad++中正则表达式的语法如下：

\ 转义字符如：要使用 “\” 本身, 则应该使用“\”

\t Tab制表符注：扩展和正则表达式都支持

\r 回车符CR 注：扩展支持，正则表达式不支持

\n 换行符LF 注：扩展支持，正则表达式不支持

. 匹配任意字符

^ 其右边的表达式被匹配在行首。如：^A匹配以“A”开头的行

其左边的表达式被匹配在行尾。如：e其左边的表达式被匹配在行尾。如：e匹配以“e”结尾的行

| 或运算符，匹配表达式左边和右边的字符串。如：ab|bc匹配“ab”或“bc”

[] 匹配列表中任意单个字符。如：[ab]匹配“a”或“b”；[0-9]匹配任意单个数字

[^] 匹配列表之外的任意单个字符。如：[^ab]匹配“a”和“b”以外的单个字符；[^0-9]匹配任意单个非数字字符

其左边的字符被匹配任意次(0次或多次)。如：be*匹配“b”,“be”或“bee”

其左边的字符被匹配至少一次(1次或多次)。如：be+匹配“be”或“bee”，但不匹配“b”

? 其左边的字符被匹配0次或者1次。如：be?匹配“b”或“be”，但不匹配“bee”

() 影响表达式匹配的顺序(类似C++的小括号会影响表达式运算顺序)，并且用作表达式的分组标记（标记从1开始）注：看下文的示例

\d 匹配一个数字字符。等价于：[0-9]

\D \d取反，匹配一个非数字字符。等价于：[^0-9]

\s 匹配任意单个空白字符：包括空格、制表符等（注：不包括换车符和换行符）。等价于：[ \t]

\S \s取反的任意单个字符。

\w 匹配包括下划线的任意单个字符。等价于：[A-Za-z0-9_]

\W \w取反的任意单个字符。等价于：[^A-Za-z0-9_]

跟JavaScript中的一样。

今天我想要得到的是，某两个词在同一行出现的频次，比如 “世界”和“和平”在1000行文本中共同出现的频次，做法如下：

ctrl+F，打开如下界面：

选中正则表达式，然后写匹配字符串就可以了

要匹配世界和平则匹配字符串如下：

世界[\x{4e00}-\x{9fa5} ]*和平

这样，世界和平，世界是和平的，世界真的是和平的，就都能匹配出来了