正则表达式详解

所属分类: 网络编程 / 正则表达式 阅读数: 1741
收藏 0 赞 0 分享

正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。

正则表达式可以干嘛?

1、数据有效性验证,可以对一个字符串进行测试,看该字符串是否符合某种规定。

2、替换文本,可以在文档中将指定的文字删除,或替换为其他文字。

3、根据字符串提取一个子字符串,用来在文本或输入字段中查找特定文字。

正则表达式语法

一个正则表达式是由普通字符(a-z)和特殊字符(元字符)组成的文字模式,该模式作为一个模版,将某个字符模式与所搜索的字符串进行匹配。

元字符

具有特殊意义的专用字符。

基本元字符

   .  匹配除换行以外的任意字符,例如正则表达式 r.t 能够匹配 “rat、rut、r t”,但是不能匹配root 

    [] 匹配匹配一个出现在[]中的字符 

    |  或 敏感词 ab|cd|ed|df

    () 提高优先级 a(bc) 实现分组

限定元字符

    *     重复零次或多次

    +     重复一次或多次

    ?     重复零次或一次

    {n}   重复n次

    {n,}  重复n次或多次

    {n,m} 重复n到m次

首尾元字符

    ^ 匹配字符串开始 例如正则表达式 ^when 能够匹配到 ”when in the“ 的开始,但不能匹配到 ”what and when in the“ 

    $ 匹配字符串结束 例如正则表达式 food$ 能够匹配到 “he's  food” 的末尾

简写形式

    \b 单词的开始或结束

    \d 匹配0-9的数字  \D非数字

    \s 任意的空白符 包括tab和换行符 \S大写 非 空白之外的所有字符

    \w 匹配字母、数字或下划线 \W 非字母、数字下划线

转义字符

    如果想查找元字符本身的话,比如想查找.或者*就会出现问题,因为会解释成其他意思。这时就需要使用\来取消这些字符的特殊意义。

    因此需要使用\. \* 查找\本身应该写\\

在javascript中使用正则表达式

创建正则表达式

//字面值
var reg = /\d+/;
//构造函数
var regx = new RegExp(\\d+);

匹配

if(reg.test("45646515"))
{
  alert("OK");
}

if(regx.test("sd"))
{
  alert("ok")
}

提取

var str="853020304@qq.com";
var reg = /([a-zA-Z0-9]+)@([a-zA-Z0-9]+(\.[a-zA-Z0-9]+)+)/;

var match = reg.exec(str);
alert(match[0]); //853020304@qq.com 匹配到的对象
alert(match[1]); //853020304 [1][2]分别是各个组
alert(match[2]); //qq.com
alert(match[3]); //.com

循环提取

var str = "12345";
var r = /\d\d/g; //g global 全局匹配
var m = r.exec(str); //12
alert(m);
m = r.exec(str); //34
alert(m);
m = r.exec(str); //null 没有了返回null
alert(m);

var arr = [];
var m = null;
while((m=r.exec(str)) != null) //如果不等于null 继续循环
{
  arr.push(m); //添加到数组
}
alert(arr.length); //[0]=12 [1]=34

替换

string str = <string>.replace(正则表达式或字符串,替换为某字符串);

var str = "ab--c--d--e--f-g";
var result = str.replace(/-+/g,','); //如果不写g 则只替换第一个
alert(result); //ab,c,d,e,f,g

var date = "2015年8月24日";
var result = date.replace(/(\d+)年(\d+)月(\d+)日/,"$1-$2-$3");
alert(result);//2015-8-24

在c#中使用正则表达式

var regx = "^[a-zA-Z0-9]{6,20}$";
if ( ! Regex.IsMatch("abcdef;sd123",regex)
{
  //长度必须6-20,字母和数字
}

常用表达式

匹配身份证:\d{15}|\d{18}

匹配中国邮政编码:[1-9]\d{5}(?!\d)

匹配腾讯QQ号:[1-9][0-9]{4,}

匹配国内电话号码:\d{3}-\d{8}|\d{4}-\d{7}

匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$

匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*

匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配首尾空白字符的正则表达式:^\s*|\s*$

匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</\1>|<.*? />

匹配中文字符的正则表达式: [\u4e00-\u9fa5]

限制网页表单里的文本框输入内容

只能输入中文:

<input type="text" onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))" />

只能输入数字:

<input type="text" onkeyup="value=value.replace(/[^\d]/g,'') " onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" />

只能输入数字和英文:

<input type="text" onkeyup="value=value.replace(/[\W]/g,'') " onbeforepaste="clipboardData.setData('text',clipboardData.getData('text).replace(/[^\d]/g,''))" />

以上内容就是本文对正则表达式做的详解,希望大家喜欢

更多精彩内容其他人还在看

正则表达式验证IPV4地址功能实例分析

这篇文章主要介绍了正则表达式验证IPV4地址功能,结合实例形式分析了IPV4地址验证的原理及具体实现技巧,需要的朋友可以参考下
收藏 0 赞 0 分享

正则表达式教程之前后查找lookaround详解

这篇文章主要介绍了正则表达式教程之前后查找lookaround,结合具体问题分析了向前查找及向后查找功能的实现技巧与注意事项,需要的朋友可以参考下
收藏 0 赞 0 分享

正则匹配密码只能是数字和字母组合字符串功能【php与js实现】

这篇文章主要介绍了正则匹配密码只能是数字和字母组合字符串功能,涉及针对字符、数字等正则操作相关技巧,并给出了php与js实现示例,需要的朋友可以参考下
收藏 0 赞 0 分享

正则验证不能含有中文的实现方法【jQuery与java实现】

这篇文章主要介绍了正则验证不能含有中文的实现方法,结合jQuery与java两种实现方法分析了针对中文的正则验证操作技巧,需要的朋友可以参考下
收藏 0 赞 0 分享

JS 密码强度校验的正则表达式(简单且好用)

最近在做一个通行证的项目,在项目中有这样的需求,注册模块中输入密码需要显示密码强度,今天小编给大家分享JS 密码强度校验的正则表达式,简单好用,需要的朋友参考下
收藏 0 赞 0 分享

iOS 正则表达式判断纯数字及匹配11位手机号码的方法

这篇文章主要介绍了iOS 正则表达式判断纯数字及匹配11位手机号码的方法,判断手机号码是否正确的方法很多,我是用正则表达式来完成匹配的,具体方法,大家参考下本文
收藏 0 赞 0 分享

正则表达式(简单易懂篇)

正则表达式是一种可以用于模式匹配和替换的强大工具。这篇文章主要介绍了正则表达式(简单易懂篇),需要的朋友参考下
收藏 0 赞 0 分享

正则表达式实现匹配连续数字的方法

我这两天刚刚学正则表达式。我觉的正则对连续的字符匹配很简单,但是对连续的一段数字匹配就不是很好。正好最近有朋友问了匹配连续数字的正则,就帮忙写了一下,算是当作温习一下吧。下面这篇文章就主要介绍了正则表达式实现匹配连续数字的方法。
收藏 0 赞 0 分享

正则表达式简介及在C++11中的简单使用教程

正则表达式(regular expression)是计算机科学中的一个概念,又称规则表达式,通常简写为regex、regexp、RE、regexps、regexes、regexen。接下来通过本文给大家介绍正则表达式简介及在C++11中的简单使用教程,一起通过本文学习吧
收藏 0 赞 0 分享

正则表达式实现最小匹配功能的方法

这篇文章主要介绍了正则表达式实现最小匹配功能的方法,结合具体实例形式分析了正则表达式最小匹配功能的原理与实现技巧,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多