正则表达式查找相似单词的方法

所属分类: 网络编程 / 正则表达式 阅读数: 1690
收藏 0 赞 0 分享

本文通过展示各种不同的正则表达式结构,以及在实际应用中会用到的技巧,熟悉掌握正则表达式的应用。

问题描述:

在这个实例中你要解决如下几个问题。

1、想要在一个字符串中找到所有的color和colour。

2、想要找到这3个以"at”结尾的单词中的任意一个:bat、cat或rat。

3、想要找到以phobia结尾的单词。

4、想要找的名字"Steven”的常见变形:Steve、Steven和Stephen。

5、想要匹配术语"regular expression”的所有常见形式。

解决方案:

下面按顺序列出用来解决这些问题的正则表达式。所有这些解决方案中都使用了不区分大小写的选项。

问题1:color和colour

\bcolou?r\b

正则选项:不区分大小写

正则流派:.NET、Java、JavaScript、PCRE、Perl、Python、Ruby

问题2:bat、cat或rat

\b[bcr]at\b

正则选项:不区分大小写

问题3:以"phobia"结尾的单词

\b\w*phobia\b

正则选项:不区分大小写

问题4:Steve、Steven和Stephen

\bSte(?:ven?|phen)\b

问题5:"regular expression”的变体

\breg(?:ular·expressions?|ex(?:ps?|e[sn])?)\b

正则选项:不区分大小写

正则流派:.NET、Java、JavaScript、PCRE、Perl、Python、Ruby

解析:

\b                            #判断一个单词边界位置

 reg                        #匹配"reg”

 (?:                         #分组但是不捕获

   ular\                    #        匹配"ular”

    expressions?        #       匹配"expression”或"expressions"

   |                           #  或者:

  ex                         #       匹配"ex”

  (?:                        #        分组但是不捕获

    ps?                     #            匹配"p”或"ps"

   |                           #       或者:

    e[sn]                   #            匹配"es”或"en"

  )?                          #         结束非捕获分组,整个分组为可选

 )                             # 非捕获分组的结束       

\b                            #判断一个单词边界位置

注:这5个正则表达式都使用了单词边界(<\b>)确保只会匹配整个单词。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

更多精彩内容其他人还在看

正则表达式匹配 非XXX的行

问题:如何匹配"非:.+123.123.123.10.+ " 行
收藏 0 赞 0 分享

正则表达式不包含属性

一个标签里不包含某个属性 的 正则表达式的写法
收藏 0 赞 0 分享

ASP正则函数替换分页后的参数

在分页系统里面用到的把page后面得东西都给丢掉
收藏 0 赞 0 分享

asp match正则函数使用Matchs实例

asp matchs函数提供了对正则表达式匹配的只读属性的访问。一直都用这个函数,没想到本站竟然没有这类文章,汗一个,最近我会多加一些这样的文章
收藏 0 赞 0 分享

asp 图片正则 替换,替换前检查图片是不是本地地址的方法

这个图片正则先检查图片的地址,不是本地的则用本地的asp突破盗链,方便使用,注意是答chinaz的朋友问的一个问题
收藏 0 赞 0 分享

java正则表达式彻底研究

从J2SE1.4起Java增加了对正则表达式的支持就是java.util.regex包
收藏 0 赞 0 分享

正则表达式口诀 正则表达式学习工具

正则表达式口诀 + 常用的正则表达式 + 正则表达式学习工具+正则处理工具 正则是每个程序员绕不开的堡垒,只有把它攻下来。我觉得正则之所以难,第一难是需要记忆,第二难是要求具备抽象逻辑思维。
收藏 0 赞 0 分享

比较实用的正则表达式学习笔记

最近在学习正则,一些比较有用的东西怕忘记,记下来,比较乱,想一条记录一条
收藏 0 赞 0 分享

asp只采集网站可见文本的正则

它可以过虑Js 可以过滤 CSS 过滤HTML标识,只采集页面的可见文本。
收藏 0 赞 0 分享

asp.net常用正则表达式

比较常用的多种语言支持的正则整理收集
收藏 0 赞 0 分享
查看更多