利用正则表达式将字符串分组示例代码

所属分类: 网络编程 / 正则表达式 阅读数: 345
收藏 0 赞 0 分享

前言

最近工作中遇到一个问题,需求是碰到'122333<<<<'这种字符串,要将其连贯的部分取出,得出['1', '22', '333', '<<<<']这样的列表,能想到的常规办法,遍历字符串,后一个与前一个逐个比较,这样真的很麻烦!又想到了另外两种方法,话不多说了,来一起看看详细的示例代码:

一、实际上可以借助itertools模块的groupby()方法来处理:

import itertools 
 
Str = '122333<<<<' 
Lst = [] 
for key,group in itertools.groupby(s): 
 Lst.append(list(group)) 
 
print map(lambda x: ''.join(x), Lst) 

上面的处理,还是比较有技巧,也能得到想要的输出结果

['1', '22', '333', '<<<<']

二、但更酷点,更技巧处理方式是用正则表达式来处理:

import re 
 
Str = '122333<<<<' 
Lst = [] 
 
Pat = re.compile(r'((.)\2*)') 
Rst = [x[0] for x in re.findall(Pat, Str)] 
 
print Rst 

备注:

      1. (.)                # .匹配任意字符;(.)做分组,方便后面反向引用

      2. \2*                # \2对里面括号的反向引用;*代表是0个到多个;

      3. ((.)\2*)           # 连起来就是任意一个或多个字符组成的分组;

      4. (.)\1*             # 这种方式则可以取出唯一的值['1', '2', '3', '<'];同样非常方便

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对脚本之家的支持。

更多精彩内容其他人还在看

js中过滤特殊字符的正则表达式

js中用正则表达式 过滤特殊字符 ,校验所有输入域是否含有特殊符号
收藏 0 赞 0 分享

简单的用js实现过滤多余字符的正则表达式

利用正则表达法除去字符串中的重复字符,一个简单的JavaScript正则表达式实例,将一串含有重复字符串中的多余字符滤除掉,请运行查看效果。
收藏 0 赞 0 分享

校验普通电话、传真号码的正则表达式(可以+开头,除数字外,可含有-)

校验普通电话、传真号码:可以“+”开头,除数字外,可含有“-”
收藏 0 赞 0 分享

正则表达式匹配中文与双字节的代码

匹配中文字符与匹配双字节字符的代码,需要的朋友可以参考下。
收藏 0 赞 0 分享

精通JS正则表达式(推荐)

精通JS正则表达式,讲的比较详细,学习正则表达式的朋友可以参考下。
收藏 0 赞 0 分享

用Java正则去掉字符串中重复出现的字符

abcde 顺序可以不一样,也就是去掉重复出现的字符
收藏 0 赞 0 分享

JavaScript常用的正则表达式表单验证代码

验证表单的不同内容用的是不同的正则表达式。客户端验证常用的几个。
收藏 0 赞 0 分享

JavaScript RegExp 正则表达式对象详细说明

RegExp 对象表示正则表达式,它是对字符串执行模式匹配的强大工具。
收藏 0 赞 0 分享

一个正则表达式的看法(?:)

下午和kindle聊天的时候,他让我看一个正则,问我知不知道其中?:的作用,以偶半瓶水的正则功力,不知道杂解释给他听了,单个一个还好理解,一起就不明白了,起码我是没用过..查了下资料,说说我的看法..
收藏 0 赞 0 分享

用于过滤空白字符的几种常见的js正则表达式pattern

用于过滤空白字符的几种常见的正则表达式pattern——在JavaScript中的表现形式
收藏 0 赞 0 分享
查看更多