可以读取指定网址的源码,并自动判断网页编码类型进行转码,有效避免出现读取的源码为乱码(如果发现读取的网址有乱码可以反馈给我),使用查找文本功能可以查找出源码中所有符合查找条件的字符,并依次定位,还可以测试编写正则表达式,本工具使用易语言正则表达式支持库,不同于其他正则测试工具编写出的正则表达式必须使用专有模块才可以匹配出指定内容,本工具测试出的正则表达式可以直接调用易语言支持库中的命令匹配出测试结果。
什么是多行模式:
如果开启多行模式,字符“^”不仅匹配目标文本的开头,而且匹配目标文本中换行符(字符(10),字符(13)或 #换行符)的后面;字符“$”不仅匹配目标文本的结尾,而且匹配目标文本中换行符的前面。否则字符“^”仅仅匹配目标文本的开头,“$”也仅仅匹配目标文本的结尾。
正则表达式符号:
* 前面元素出现0次以上
. 匹配任何单个字符
? 前面元素出现0次或1次
+ 前面元素出现1次以上
^ 表示开头。
$ 表示结尾。
.* 表示0个以上的任意字符。
[ ] 范围描述符。[a-z]表示从a到z之间的任意一个。
\w 英文字母和数字。即[0-9 A-Z a-z]。
\W 非英文字母和数字
\s 空字符,即[\t\n\r\f]。
\S 非空字符。
\d 数字,即[0-9]。
\D 非数字。
\b 词边界字符(在范围描述符外部时)
\B 非词边界字符
\b 退格符(0x08)(在范围描述符内部时)
{m,n} 前面元素最少出现m次,最多出现n次
| 选择
( ) 群组
其他字符 该字符本身
. 匹配任何单个字符
? 前面元素出现0次或1次
+ 前面元素出现1次以上
^ 表示开头。
$ 表示结尾。
.* 表示0个以上的任意字符。
[ ] 范围描述符。[a-z]表示从a到z之间的任意一个。
\w 英文字母和数字。即[0-9 A-Z a-z]。
\W 非英文字母和数字
\s 空字符,即[\t\n\r\f]。
\S 非空字符。
\d 数字,即[0-9]。
\D 非数字。
\b 词边界字符(在范围描述符外部时)
\B 非词边界字符
\b 退格符(0x08)(在范围描述符内部时)
{m,n} 前面元素最少出现m次,最多出现n次
| 选择
( ) 群组
其他字符 该字符本身