- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用正则表达式进行查找/替换
1,2) 1,2) 收稿日期:20071015
翟自洋 林昌东
修回日期:20080829
1)《浙江大学学报(英文版)》编辑部,310027 杭州市浙大路38号,Email:jzus_zzy@zju.edu.cn
2)浙江大学出版社,310028 杭州市天目山路148号
摘 要 查找/替换在文本编辑中常会用到,看似简单,实则内涵丰富。正则表达式(RegularExpression)的采用,实现了对
TM
复杂文本的匹配,极大地增强了查找/替换的功能。正则表达式与文本编辑软件(如EmEditor等)所支持的“在多个文件中
查找/替换”相结合,使编辑人员可对各种纯文本文档(如 txt,xml,tex,htm,等)同时进行批量查找/替换,大大提高了工作效
率。本文从笔者编辑工作的典型实例出发,简要介绍了正则表达式的基本概念,部分展现了其应用于查找/替换的巨大潜力。
指出结合正则表达式的查找/替换还可用于数据验证,作为人工审校的补充。针对英文期刊总结了一些验证表达式。并指
出,对中文或中英文混排的书刊同样大有用武之地。
TM
关键词 查找/替换 正则表达式(RegularExpression) 在多个文件中查找/替换 数据验证 EmEditor
查找/替换(以下简称“查/替”)是编辑软件的一项基本 别表示任意单个字符和任意字符串,例如命令“dir .doc”
功能。一般编辑软件只能处理简单的查/替,但目前越来越 将列出当前目录下所有Word文档。这两个符号可看作正则
多的编辑软件在查/替功能中实现了正则表达式(Regular 表达式最简单的子集。
Expression),其内涵丰富,功能极为强大,可使一些烦琐费时 MicrosoftWord定义了一套通配符,在其帮助文件给出
且容易出错的工作变得轻松有趣。 [2]
了说明 。对通配符的支持使得Word的查/替功能大大增
笔者在将《浙江大学学报(英文版)》B辑的Word文档 强。但Word所支持的通配符同样只是完整正则表达式体系
[1]
转换成xml文件,提交PubMedCentral数据库 时,被查出一 的一个小的子集。
个全局性的问题:公式编号(1),(2),……误为 1,2,……括 限于篇幅,这里只对正则表达式作简要介绍,以文本编
号全部漏掉。 辑软件EmEditor采用的正则表达式体系为例。更详尽地了
总共15期数据、260多篇文档,如果手工逐一修改,至少 解正则表达式,请参见文献[3,4,5]。
得花几个小时,并且极可能错漏。 正则表达式是 由普通字符 (Literals)和元 字符
xml文件中,与公式编号相对应的内容为:<label>1 (Metacharacters)构成的文本模式。元字符表示特殊的含义,
</label>,<label>2</label>,……正确的应为 <label> 包括“\”,“^”,“ ”,“ ”,“+”,“?”,“.”,“(”,“)”,“{”,
(1)</label>,<label>(2)</label
文档评论(0)