正则 捕获组(capture group)

所属分类: 网络编程 / 正则表达式 阅读数: 1993
收藏 0 赞 0 分享
捕获组有两种形式
一种是普通的捕获组,不产生歧义的情况下,后面简称捕获组,语法规则:(expression);
另一种是命名捕获组,语法规则:(?<name>expression)或者(?'name'expression),这两种写法是等价的。
 
1、编号规则
如果没有显式为捕获组命名,即没有使用命名捕获组,那么需要按数字顺序来访问所有捕获组
在只有普通捕获组的情况下,捕获组的编号是按照“(”出现的顺序,从左到右编号的 
 
(\d{4})-(\d{2}-(\d\d))
1        1 2          3    3 2
 
上面的正则表达式可以用来匹配格式为yyyy-MM-dd的日期,为了在下表中得以区分,采用了\d{2}和\d\d两种写法
还有一个默认编号为0的组,表示的是正则表达式的整体
用以上正则表达式匹配字符串:2008-12-31
匹配结果为:
编号 命名 捕获组 匹配内容
0   (\d{4})-(\d{2}-(\d\d)) 2008-12-31
1   (\d{4}) 2008
2   (\d{2}-(\d\d)) 12-31
3   (\d\d) 31
 
如果对组进行了显式命名,即命名捕获组,那么捕获的内容可以通过组名称来引用
但是如果正则表达式中既使用了普通捕获组,也使用了命名捕获组,那么捕获组的编号就要特别注意,编号的规则是先对普通捕获组进行编号,再对命名捕获组进行编号
 
(\d{4})-(?<date>\d{2}-(\d\d))
1        1 3                       2     23
 
用以上正则表达式匹配字符串:2008-12-31
匹配结果为:
编号 命名 捕获组 匹配内容
0   (\d{4})-(\d{2}-(\d\d)) 2008-12-31
1   (\d{4}) 2008
2   (\d\d) 31
3 date (?<date>\d{2}-(\d\d)) 12-31
 
 
2、捕获组的引用
对捕获组的引用一般有以下几种
a) 正则表达式中,对前面捕获组捕获的内容进行引用,称为反向引用
b) 正则表达式中,(?(表达式)true|false)的条件表达式
c) 在程序中,对捕获组捕获内容的引用
 
反向引用
对于普通捕获组的引用,语法规则为:\k<num>,通常简写为\num,其中num是十进制的数字,即捕获组的编号
对于命名捕获组的引用,语法规则为:\k<name>或者\k'name'
更多精彩内容其他人还在看

正则表达式——匹配规则介绍

这篇文章主要介绍了正则表达式——匹配规则介绍,需要的朋友可以参考下
收藏 0 赞 0 分享

JavaScript 中的正则表达式(推荐)

正则表达式通常用于在文本中查找匹配的字符串,js正则表达式在程序开发中应用非常广泛,本文给大家介绍JavaScript 中的正则表达式(推荐),感兴趣的朋友一起学习吧
收藏 0 赞 0 分享

Java正则表达式入门基础篇(新手必看)

这篇文章给大家介绍java正则表达式入门基础篇, 由于正则表达式是一个很庞杂的体系,所以我仅例举些入门的概念,更多的请参阅相关书籍及自行摸索。感兴趣的朋友一起跟着小编来看看吧
收藏 0 赞 0 分享

linux正则表达式awk详解

这篇文章主要介绍了linux正则表达式awk的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

notepad++ 等用正则表达式自动添加sql引号的技巧

本篇文章给大家介绍notepad用正则表达式自动添加sql引号的技巧,,需要的朋友可以参考下
收藏 0 赞 0 分享

常见的正则表达式问题

这篇文章主要介绍了常见的正则表达式问题,需要的朋友可以参考下
收藏 0 赞 0 分享

Linux正则表达式特性详解及BRE与ERE的异同点

本篇文章给大家介绍linux正则表达式特性及BRE与ERE的不同,Linux正则表达式(Regular Expression)主要遵从POSIX BRE或者POSIX ERE标准,对linux正则表达式感兴趣的朋友可以参考下本篇文章
收藏 0 赞 0 分享

Linux下如何使用grep命令查找带有tab(退格)的字符

本文给大家介绍linux下如何使用grep命令查找带有tab(退格)的字符,涉及到linux grep 查找带有tab的字符方面的知识,对linux grep tab感兴趣的朋友可以参考下本篇文章
收藏 0 赞 0 分享

WEB开发时常用的正则表达式(PHP和Javascript)

这篇文章主要介绍了WEB开发中最常用最实用的正则表达式及其用法,需要的朋友可以参考下
收藏 0 赞 0 分享

比较全面的C 、Java、JavaScript中的正则表达式详解

正则表达式(Regular Expression) 就是用某种模式去匹配一类字符串的公式。本篇文章给大家介绍C 、Java、JavaScript中的正则表达式,本文介绍的非常全面,感兴趣的朋友一起看看吧
收藏 0 赞 0 分享
查看更多