找回密码
 注册
查看: 2084|回复: 0

perl语言正则表达式中的字符类的简写

[复制链接]
发表于 2011-11-14 20:34:30 | 显示全部楼层 |阅读模式
有一些字符类出现的非常频繁,因此提供了其简写形式。例如,任何数字的类,[0-9],可以被简写为:\d。因此,HAL 这
个例子可以被写作/HAL-\d+/。
\w 被称作“word’字符:[A-Za-z0-9_]。如果你的“words”由通常的字母,数字,下划线组成,那你将非常喜欢它。通常认
为“word”由字母,连接符(-),撇号(')◆组成,我们希望能改变这种定义◆。因此使用它,请记住我们对“word”的定义,
字母,数字,下划线组成。
◆至少,在英语中是这样。在其它语言中,其words 由不同的符号组成。查看perllocale 的帮助手册了解更多的信息。
◆当查看ASCII 编码的英语文本时,我们遇到单引号和撇号(')是相同字符的问题,因此很难说cat’是cat 和一个撇号( '),还是cat 后接单引
号。这可能是计算机还不能接管世界的一个原因。
当然,\w 不能匹配单词,而只能匹配单个字符。为了匹配整个单词,需要后接加号。模式/fred \w+ barney/将匹配fred,空
格,一个“单词(word)”,然后是空格和barney。因此,如果fred 和barney 之间有一个单词◆,由单个空格分隔开,它将
能匹配上。
◆我们将停止在word 上加引号;现在你已经知道其是由字母-数字-下划线组成的。
你可能已经注意到在前一例中,如果能更加灵活的匹配空白将很方便。\s 对于匹配空白(whitespace)将非常方便。它等价
于[\f\t\n\r ],其含5 个空白字符:格式符(form-feed);制表符(tab),换行符,回车,以及空格符。同其它简写符号一样,
\s 匹配此类中的单个字符,如果使用\s*将匹配任何个数的空白(包括没有),或者\s+匹配一个以上的空白(事实上,很少
见到单独使用\s,而不使用任何的数量词(*, +))。由于这些空白符看起来类似,因此可以使用这种简写形式,将它们统一处
理。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-11-24 04:16 , Processed in 0.020146 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表