又一篇正则表达式学习笔记

所属分类: 网络编程 / 正则表达式 阅读数: 264
收藏 0 赞 0 分享
1. \b:表示单词的开头或者结尾,可能是空格、标点符号或者换行,但是\b不匹配其中的任何一个,这是指代这些元素中的任一个位置。
示例:\bhi\b:查找文本中所有的“hi”单词,但是不包括him、history等字样
1.1 ^:匹配字符串的开始,特指一个段落的起始。
1.2 $:匹配字符串的结束。特指一个段落的结尾,这两个都是\b的子集。
重复:
2. *:表示*前面的内容重复出现任意多次,".*"连在一起就表示任意数量的不包含换行符的字符。
示例:\bhi\b.*\bLucy\b:先是一个hi,然后任意多个字符(但不能有回车),最后是一个单独的单词Lucy。
2.1 +:同样表示数量,但是+必须是1次或以上,不包括0次,而*是指任意数量,包括0次重复。
2.2 {n}:数量控制,前方的字符精确重复n次。
2.3 {n,m}:数量控制,前方的字符重复n到m次,n<=m。
2.4 ?:重复0次或1次。
3. .: 表示任意字符,不包含回车换行。
4. \d:匹配任意的数字(0,1,2……9)
示例:0\d\d-\d{7}:查找以0开头,后两个是数字,然后是一个连字符"-",接着是7个数字的字符串,如:025-8224110。
5. \s:匹配任意的空白符,包括空格、制表符(tab键)、换行符、中文全角空格等。
6. \w:匹配字母、数字、下划等。
示例1:\ba\w*\b:匹配以字母"a"开头,然后是任意多个任意字符不包括空格等空白符,然后一个单词结束符。其意义就是以a开头的所有单词。
示例2:\b\w{6}\b:匹配正好是6个字符长度的单词。
7. []:任意匹配一个方括号中存在的字符。
示例:[abc]\w{4}\b:以a、b、c中的任意一个字符为开头,后面有4个字母的单词。
反义
8. \D \S \W \B 这些元字符的大写形式分别表示他们表示的集合的反义。
示例:\D:表示不是数字的所有字符,如:abced
8.1 [^x]:表示不是x字符的所有字符
8.2 [^xyz]:表示不是x、y、z中任一种的字符
9.替换
"|":使用"|"符号可以实现逻辑或运算,配合小括号"()"的使用,可以实现不同条件的或运算。
10分组
"()":用括号包围住已经实现的表达式,可以方便的继续使用重复、替换等操作。
示例:\b(\w+\b\s+)\1+\b:将第一次出现的括号表达式用\1表示,可以匹配go go go
自学到这里已经非常不错了,下面继续研究正则表达式的高级属性
断言:
(?=express)这是一种假定条件,可以放在表达式的后方,已验证前方的字符后面的表达式是否为express,但是并不包含后方的express。
示例:\b\w*(?=ing\b):取得后缀为ing的所有单词的前缀。
(?<=express)前置断言,放于表达式首部,已验证字符串前方的表达式是否符合express,同样也不包含express本身。
示例:(?<=\bre)\w*\b:取得所有前缀为re的单词的后面部分
注释:
(?#)以这种形式来注释正则表达式。
示例:2[0-4]\d(?#200-249)
懒惰模式匹配
*:匹配最多的字符
*?:匹配最少的字符
更多精彩内容其他人还在看

正则表达式匹配 非XXX的行

问题:如何匹配"非:.+123.123.123.10.+ " 行
收藏 0 赞 0 分享

正则表达式不包含属性

一个标签里不包含某个属性 的 正则表达式的写法
收藏 0 赞 0 分享

ASP正则函数替换分页后的参数

在分页系统里面用到的把page后面得东西都给丢掉
收藏 0 赞 0 分享

asp match正则函数使用Matchs实例

asp matchs函数提供了对正则表达式匹配的只读属性的访问。一直都用这个函数,没想到本站竟然没有这类文章,汗一个,最近我会多加一些这样的文章
收藏 0 赞 0 分享

asp 图片正则 替换,替换前检查图片是不是本地地址的方法

这个图片正则先检查图片的地址,不是本地的则用本地的asp突破盗链,方便使用,注意是答chinaz的朋友问的一个问题
收藏 0 赞 0 分享

java正则表达式彻底研究

从J2SE1.4起Java增加了对正则表达式的支持就是java.util.regex包
收藏 0 赞 0 分享

正则表达式口诀 正则表达式学习工具

正则表达式口诀 + 常用的正则表达式 + 正则表达式学习工具+正则处理工具 正则是每个程序员绕不开的堡垒,只有把它攻下来。我觉得正则之所以难,第一难是需要记忆,第二难是要求具备抽象逻辑思维。
收藏 0 赞 0 分享

比较实用的正则表达式学习笔记

最近在学习正则,一些比较有用的东西怕忘记,记下来,比较乱,想一条记录一条
收藏 0 赞 0 分享

asp只采集网站可见文本的正则

它可以过虑Js 可以过滤 CSS 过滤HTML标识,只采集页面的可见文本。
收藏 0 赞 0 分享

asp.net常用正则表达式

比较常用的多种语言支持的正则整理收集
收藏 0 赞 0 分享
查看更多