西西软件园多重安全检测下载网站、值得信赖的软件下载站!
软件
软件
文章
搜索

首页编程开发其它知识 → EmEditor 正则表达式使用实例教程

EmEditor 正则表达式使用实例教程

相关软件相关文章发表评论 来源:西西整理时间:2013/6/20 10:48:39字体大小:A-A+

作者:西西点击:103次评论:0次标签: EmEditor 正则表达式

  • 类型:滤镜插件大小:7.6M语言:中文 评分:6.6
  • 标签:
立即下载

一、基础篇

1.

[cpp] view plaincopy

^  匹配行首,比如说查找^s, 就是查位于行首的 s  

2.

[cpp] view plaincopy

.*?$  这个用处比较大,但一般不单独使用,比如与上面的结合  

比如 ^s.*?$,就是查以 s 为行首的行,其中 .* 是匹配任意字符,$ 代表行尾,?$ 是告诉程序你要定位到行尾。  

专业文本编辑器(EmEditor Pro)
4.9
类别: 文本编辑    大小:11.6M    语言: 中文
查看详细信息 >>

3.

[cpp] view plaincopy

\n  这个很简单,就是换行符,用得也非常多,  

比如 “\n\n”,替换成“\n”,就是把2个换行符替换成1个。  

练习:

[cpp] view plaincopy

bas,bat =to,go(走)  

chlor =green or chlorine(绿,氯)  

chol =gallbladder(胆)  

chondrio =cartilage(软骨)  

erg =energe(能量)  

err =to wander(流浪;漂泊),to err(偏离正道,犯错,犯罪)  

ess,est =to be(存在)  

est,ess =to be(存在)  

a. 查找行首的a、e、c等字符;

^a|^e|^c

b. 查找以c开头的行,不包括换行符;

^c.*?$

c. 查找以e开头的行,包括换行符;

^e.*\n

d. 查找两个相连的换行符,将它替换成一个;

\n\n
\n
4.

[cpp] view plaincopy

\s 是表示一个半角空格(半角和全角看不懂的请先google一下),  

\t 指的是一个TAB空格,不清楚的话在Emeditor里敲一次TAB键,出来的就是它了。  

查 \s 的时候是包括TAB空格的,但查 \t 的时候却不能包括半角空格,其实这两个都非常有用。  

\s 与 \n 连用,那就是非常实用的查行尾空格的表示法了  

5.

[cpp] view plaincopy

{1,n} 大括号内的数字是表示数量的范围,它的前面必须有个东西,比如说“\s{1,3}”就表示1到3个空格通吃,  

如果用“\s{3}”呢,就意味着3个空格  

6.

[cpp] view plaincopy

[a-z]  表示26个字母中的任一个,如果在替换窗口内勾选“区分大小写”则表示26个小写字母,否则大小写通吃。  

练习:

[cpp] view plaincopy

acousto =sound(声音)  

acro = high(高)  

act =do(行动)  

  acuti = acuate (尖的,尖锐的)   

acousto = sound(声音)   

  aer,aero,ar,aro=air(空气)    

after =(在……之后)    

1)删除下列文本中的行首空格(请结合上一练习);

^\s*

2)删除行尾空格;

\s*$

3)将文本中的TAB空格替换成半角空格;

4)查找任意相连的四个字母;

[a-z]{4}

5)查找位于行首的长度为3-5个字母的单词(注意必须是完整单词,这题稍微要动动脑筋,找一下规律)。

^[a-z]{3,5}

小结:使用正则表达式来处理文档,最大的关键在于仔细去分析文档中的规律,只要有规律可以利用,我们就能进行批量处理,工作效率就是这么提高的。一定要多想,更重要的是多试,有时候想半小时还不如实际动手操作5分钟。

7.

[cpp] view plaincopy

[] 就是上面的[a-z]往下讲,用中括号括起来表示括号某一个字符,你也可以这样表示:[abc],意思是a、b、c三个字母中任一个都行。  

但[] 与^结合有一个非常实用的用法,比如^[^c],这表示位于行首的除 c 之外的字母。  

8.

[cpp] view plaincopy

() 单独使用的话没有什么意义,用了它就表示引用括号里的内容,然后用\1\2\3…… 来一一调用  

\1 是第一个小括号里的内容,\2 是第二个小括号里的内容,依此类推。  

9.

[cpp] view plaincopy

[[:unicode:]]  用它来将中文字符和英文字符区分开来。  

练习:

[cpp] view plaincopy

document.selection.Replace("瑞秋","Rachel",eeFindNext | eeReplaceAll | eeFindReplaceRegExp);  

document.selection.Replace("钱德勒","Chandler",eeFindNext|eeReplaceAll|eeFindReplaceRegExp);  

document.selection.Replace("钱德","Chandler",eeFindNext | eeReplaceAll|eeFindReplaceRegExp);  

document.selection.Replace("乔伊","Joey",eeFindNext | eeReplaceAll | eeFindReplaceRegExp);  

document.selection.Replace("菲比","Phoebe",eeFindNext | eeReplaceAll | eeFindReplaceRegExp);  

然后分别执行下述操作:

1.将  ("瑞秋","Rachel", 改为 ("Rachel","瑞秋", 

其它各行参照此格式进行修改;

查找:(".*?"),(".*?")

替换:\2,\1

2.删除所有中文字符;

[[:unicode:]]

10.特殊字符:

[cpp] view plaincopy

^  

$  

( )  

[ ]  

{ }  

.  

?  

+  

*  

|   

这些字符都是在正则表达式中被“征用”了,称之为特殊字符,引用的时候,必须前面加 "\" 进行区分,比如你要用到 "$" 字符的时候,必须使用 "\$",这样程序才不会以为你是在匹配行尾。

练习:

[cpp] view plaincopy

[00:53.90][Monica]:There's nothing to tell!  

[00:55.60][Monica]:He's just some guy I work with!  

[00:57.90][Joey]:C'mon, you're going out with the guy!  

[00:59.10][Joey]:There's gotta be something wrong with him!  

[01:02.70][Chandler]:All right Joey, be nice.  

[01:04.80][Chandler]:So does he have a hump? A hump and a hairpiece?  

然后分别执行下述操作:
1.删除带"[]"的内容;
\[.*\]

2.做完上一步后,删除位于行首的 ":"。

二、实战篇

练习1:

[cpp] view plaincopy

首先,把以下五个小零件翻译出来,这一定很简单,它们是:  

第一个零件:这项计划提供机会,翻成英语是This plan providedopportunities。  

第二个零件:为研究者,翻成英语是forresearchers。  

第三个零件:从印度和外国来的,翻成英语是from India andabroad。  

第四个零件:研究老虎,翻成英语是to studytigers。  

第五个零件:在保护区里,翻成英语是in thereserves。  

然后将这段文本替换成如下格式:

[cpp] view plaincopy

首先,把以下五个小零件翻译出来,这一定很简单,它们是:  

第一个零件:这项计划提供机会,翻成英语是This plan providedopportunities。  

第二个零件:为研究者,翻成英语是forresearchers。  

第三个零件:从印度和外国来的,翻成英语是from India andabroad。  

第四个零件:研究老虎,翻成英语是to studytigers。  

第五个零件:在保护区里,翻成英语是in thereserves。  

提示:删除多余的换行符。
\n\n

练习2:

[cpp] view plaincopy

And bigger boobs!   大笨蛋!  

"Yeah, see.. you took mine. Chandler, what about you?"  你知道我的了。钱德,你呢?  

"Uh, if I were omnipotent for a day, I'd.. make myself omnipotent forever." 如果有一天我变得全能,我要让自己变得永远全能。  

"See, there's always one guy."  看吧,这儿总是有一个家伙。  

"If I had a wish, I'd wish for three more wishes."  如果我有愿望的话,我希望我还能多有三个愿望。  

然后将这段文本替换成如下格式:

[cpp] view plaincopy

Q: And bigger boobs!  

A: 大笨蛋!  

Q: "Yeah, see.. you took mine. Chandler, what about you?"  

A: 你知道我的了。钱德,你呢?  

Q: "Uh, if I were omnipotent for a day, I'd.. make myself omnipotent forever."  

A: 如果有一天我变得全能,我要让自己变得永远全能。  

Q: "See, there's always one guy."  

A: 看吧,这儿总是有一个家伙。  

Q: "If I had a wish, I'd wish for three more wishes."  

A: 如果我有愿望的话,我希望我还能多有三个愿望。  

要求:使用一个查找和替换语句完成。
友情提示:这段文本是将EXCEL文件另存为"制表符分隔”的文本文件得到的。

参考答案:
查找:(^.*?)\t(.*?$)
替换:Q: \1\nA: \2

练习3:

[cpp] view plaincopy

4 And bigger boobs! 大笨蛋!  

5 "Yeah, see.. you took mine. Chandler, what about you?"    你知道我的了。钱德,你呢?  

6 "Uh, if I were omnipotent for a day, I'd.. make myself omnipotent forever."   如果有一天我变得全能,我要让自己变得永远全能。  

7 "See, there's always one guy."""  看吧,这儿总是有一个家伙。  

8 "If I had a wish, I'd wish for three more wishes."""  如果我有愿望的话,我希望我还能多有三个愿望。  

然后将这段文本替换成如下格式:

[cpp] view plaincopy

Q: And bigger boobs!   

A: 大笨蛋!  

Q: Yeah, see.. you took mine. Chandler, what about you?   

A: 你知道我的了。钱德,你呢?  

Q: Uh, if I were omnipotent for a day, I'd.. make myself omnipotent forever.   

A: 如果有一天我变得全能,我要让自己变得永远全能。  

Q: See, there's always one guy.   

A: 看吧,这儿总是有一个家伙。  

Q: If I had a wish, I'd wish for three more wishes.   

A: 如果我有愿望的话,我希望我还能多有三个愿望。  

要求:使用一个查找和替换语句完成。

友情提示:""是固定的,变的只是原先位于行首的数字。

参考答案:

查找:(^\d.*?)\t(.*?\t)(.*?$)

替换:Q: \2\nA: \3

练习4:

[cpp] view plaincopy

valedictory "a.告别的  

n.告别演讲"  

close-hauled    a.张满帆的,迎风航行的  

mean    "a.吝啬的,卑鄙的,简陋的,不舒服的,平庸的,低劣的,中间的,中等的,平均的,普通的  

n.中间,中部,中庸"  

bumper-to-bumper    a.前后紧接且行进缓慢的车队的  

between a rock and a hard place ph.左右为难,进退两难  

have one's head screwed on the right way    ph.头脑清醒  

mimic   "v.(通过学养)戏弄,模仿,与。。。极相似  

n.善于模仿的人,能模仿人的动物,滑稽剧演员  

a.模仿的,好模仿的,模拟的,假装的"  

1.将它转换成下面这样的格式:

[cpp] view plaincopy

valedictory "a.告别的n.告别演讲"  

close-hauled a.张满帆的,迎风航行的  

mean "a.吝啬的,卑鄙的,简陋的,不舒服的,平庸的,低劣的,中间的,中等的,平均的,普通的n.中间,中部,中庸"  

bumper-to-bumper a.前后紧接且行进缓慢的车队的  

between a rock and a hard place ph.左右为难,进退两难  

have one's head screwed on the right way ph.头脑清醒  

mimic "v.(通过学养)戏弄,模仿,与。。。极相似n.善于模仿的人,能模仿人的动物,滑稽剧演员a.模仿的,好模仿的,模拟的,假装的"  

2.处理成Q&A格式的词库:

[cpp] view plaincopy

Q: valedictory  

A: "a.告别的n.告别演讲"  

Q: close-hauled  

A: a.张满帆的,迎风航行的  

Q: mean  

A: "a.吝啬的,卑鄙的,简陋的,不舒服的,平庸的,低劣的,中间的,中等的,平均的,普通的n.中间,中部,中庸"  

Q: bumper-to-bumper  

A: a.前后紧接且行进缓慢的车队的  

Q: between a rock and a hard place  

A: ph.左右为难,进退两难  

Q: have one's head screwed on the right way  

A: ph.头脑清醒  

Q: mimic  

A: "v.(通过学养)戏弄,模仿,与。。。极相似n.善于模仿的人,能模仿人的动物,滑稽剧演员a.模仿的,好模仿的,模拟的,假装的"  

提示:题1需要多动动脑筋,要注意观察材料的特点,利用好TAB符号,需要搭一个跳板。题2则与练习1是一样的解决方法。
参考答案:
1.分三步走
A、查找:^(.*?\t.*?$)
替换:#\1
因为不能直接找出不带\t的行,那就先给带\t的行做个标记;
B、查找:\n([^#])
替换:\1
注意\n([^#])与(^[^#])的细微区别
C、查找:^#
替换:

删除掉行首多余的#号

2.参看练习2的解答,大部分用EXCEL另存的带制表符分隔的文本都可以照这样的方式处理。

    3d模型
    (13)3d模型
    如今电子商务发展势头迅猛,各种商品广告在网络上铺天盖地,怎样让自己的商品能更全面更显眼的展现给消费者成了所有商家宣传展示自己商品的重中之重。传统的二维照片显然已经无法满足这一要求,于是商品展示技术便开始步入人们的视野。模型的展示,用户不仅仅可以更为清晰直观地浏览广告内容,其互动性以用户为核心,任意视角全方位浏览欣赏,同时根据要求制作用户可直观地参与内容,其广告效果可想而知。这里给大家收集整理了很多...更多>>
    3dmax插件大全
    (19)3dmax插件大全
    除了能够制作出精细的模型外,其中最大的一个亮点就是它的插件功能强大,只要你能够想到的效果,都有相应的插件可以替你实现。这里西西给大家收集了很多非常实用的插件。插件后缀名介绍.位于建立命令面板中,可创建包括建模增加辅助物等的新对象。.位于变动命令面板中,增加新的修改命令,可在中找到。.属于大气效果灯或渲染类插件,位于的环境编辑器中,也可在菜单的面板中找到。.属于特殊用途的插件,位于程序命令面板。.属于后期...更多>>

    相关评论

    阅读本文后您有什么感想? 已有人给出评价!

    • 8 喜欢喜欢
    • 3 顶
    • 1 难过难过
    • 5 囧
    • 3 围观围观
    • 2 无聊无聊

    热门评论

    最新评论

    发表评论 查看所有评论(0)

    昵称:
    表情: 高兴 可 汗 我不要 害羞 好 下下下 送花 屎 亲亲
    字数: 0/500 (您的评论需要经过审核才能显示)