深入浅析正则表达式中的\B和\b

所属分类: 网络编程 / 正则表达式 阅读数: 1957
收藏 0 赞 0 分享

对于正则表达式的中\B和\b 有些地方会出现弄不懂的情况

或许你看了下面这篇博客 你就能够对\B和\b认识加深了

根据查看API可以知道 \B和\b都是边界匹配符

先说说\b这个单词边界吧!竟然想了解 首先必须清楚什么叫单词边界!我们可以以\b为分割来探究一下

单词边界

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class matcher1 {
 public static void main(String[] args) {
 String str="(中文问号?123???英文)问号?我是华丽[的制表符\t]我是华丽{的空格符 我是华丽}的换行符\n";
 String rex="\\b";

 Pattern pattern=Pattern.compile(rex);
 Matcher matcher=pattern.matcher(str);

 String [] result=pattern.split(str); 

 for(String string:result){
  System.out.println("分割的字符串:"+"["+string+"]");
 }
 }
}

运行结果

分割的字符串:[(]
分割的字符串:[中文问号]
分割的字符串:[?]
分割的字符串:[123]
分割的字符串:[???]
分割的字符串:[英文]
分割的字符串:[)]
分割的字符串:[问号]
分割的字符串:[?]
分割的字符串:[我是华丽]
分割的字符串:[[]
分割的字符串:[的制表符]
分割的字符串:[    ]]
分割的字符串:[我是华丽]
分割的字符串:[{]
分割的字符串:[的空格符]
分割的字符串:[ ]
分割的字符串:[我是华丽]
分割的字符串:[}]
分割的字符串:[的换行符]
分割的字符串:[
]

从这些分割的字符串中我们可以知道单词边界就是单词和符号之间的边界

这里的单词可以是中文字符,英文字符,数字;符号可以是中文符号,英文符号,空格,制表符,换行

下面我们看一个例子

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class matcher1 {
 public static void main(String[] args) {
 String str=" 2 ";
 String rex="\\b2\\b";

 Pattern pattern=Pattern.compile(rex);
 Matcher matcher=pattern.matcher(str);

 if(matcher.matches()){
  System.out.println("匹配成功");
 }else{
  System.out.println("匹配不成功");
 }
 }
}

在没有看上面分割的例子前估计很多人包括我都会认为这运行的结果是匹配成功

经过分割的例子后就知道了 空格并不是边界 空格与数字2之间的那个才叫边界  所以运行结果不言而喻 肯定是匹配不成功

当如果你这样写就运行出来就是匹配成功

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class matcher1 {
 public static void main(String[] args) {
 String str="2";
 String rex="\\b2\\b";

 Pattern pattern=Pattern.compile(rex);
 Matcher matcher=pattern.matcher(str);

 if(matcher.matches()){
  System.out.println("匹配成功");
 }else{
  System.out.println("匹配不成功");
 }
 }
}

\b的用法

一般来说\b不用来判断当前字符串是否符合某种规则

一般我们都用\b来进行获取

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class matcher1 {
 public static void main(String[] args) {
 String str=",,,,呵呵,,,,";
 String rex="\\b呵呵\\b";

 Pattern pattern=Pattern.compile(rex);
 Matcher matcher=pattern.matcher(str);

 if(matcher.find()){
  System.out.println(matcher.group());
 }
 }
}

运行结果

呵呵1

\B的用法

了解了\b的用法 我们再来说说\B \B是非单词边界

也就说\B=[^\b]//符号^是非的意思1

\b是单词与符号的边界 那非单词与符号的边界的其它都是\B

所以我们的猜想\B是符号与符号,单词与单词的边界

当然猜想需要认证!下面我们写一个例子来证明一个!

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class matcher1 {
 public static void main(String[] args) {
 String str="123456我是JAVA{,、;‘asd";
 String rex="\\B";

 Pattern pattern=Pattern.compile(rex);
 Matcher matcher=pattern.matcher(str);

 String [] result=pattern.split(str);

 for(String string:result){
  System.out.println("分割的字符串:"+string);
 }
 }
}

运行结果

分割的字符串:1
分割的字符串:2
分割的字符串:3
分割的字符串:4
分割的字符串:5
分割的字符串:6
分割的字符串:我
分割的字符串:是
分割的字符串:J
分割的字符串:A
分割的字符串:V
分割的字符串:A{      //单词与符号之间的边界不算\B的边界
分割的字符串:,
分割的字符串:、
分割的字符串:;
分割的字符串:‘a
分割的字符串:s
分割的字符串:d

事实证明\B作为非单词边界 确实是单词与单词,符号与符号之间的边界

\B一般也是用来获取字符串的

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class matcher1 {
 public static void main(String[] args) {
 String str=",,,,,和呵呵,,,,,";
 String rex="\\B呵\\B";

 Pattern pattern=Pattern.compile(rex);
 Matcher matcher=pattern.matcher(str);

 if(matcher.find()){
  System.out.println(matcher.group());
 }

 }
}

因为字符与字符之间的边界

所以运行的结果是

补充:

字符串:abcsdsadas abc asdsadasdabcasdsa

使用\sabc\s和\babc\b都能匹配中间的abc,这种方法不是重复了么,/s是匹配空格回车等得,/b网上教程说得不清楚什么字符边界什么意思。

不一样

\babc\b匹配的是"abc"
\sabc\s匹配的不是"abc", 前后还带空格" abc "
\b只是匹配字符串开头结尾及空格回车等的位置, 不会匹配空格符本身

例如"abc sdsadasabcasdsadasdabcasdsa",

\sabc\s不能匹配,\babc\b可以匹配到"abc" 

\b代表字与字中间那个看不见的东西,如

here is a word

那么,这句中有好几个\b, 每个单词的前后都有一个\b.

所以你用 \bhere\b 可以匹配上面这个here,但如果here 不是一个单词,而是一个单词的一部分,如 adheread, 这样的话,用here 可以匹配,用\bhere\b就不能区配了,因为ad后面没有\b. 所以 adhere 中的here 不会被匹配。

总结: \b 就是用在你匹配整个单词的时候。 如果不是整个单词就不匹配。 你想匹配 I 的话,你知道,很多单词里都有I的,但我只想匹配I,就是“我”,这个时候用 \bI\b

\B就是反过来,代表非字间。 类似\d代表数字, \D代表非数字。

总结

以上所述是小编给大家介绍的正则表达式中的\B和\b ,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!

更多精彩内容其他人还在看

正则表达式——匹配规则介绍

这篇文章主要介绍了正则表达式——匹配规则介绍,需要的朋友可以参考下
收藏 0 赞 0 分享

JavaScript 中的正则表达式(推荐)

正则表达式通常用于在文本中查找匹配的字符串,js正则表达式在程序开发中应用非常广泛,本文给大家介绍JavaScript 中的正则表达式(推荐),感兴趣的朋友一起学习吧
收藏 0 赞 0 分享

Java正则表达式入门基础篇(新手必看)

这篇文章给大家介绍java正则表达式入门基础篇, 由于正则表达式是一个很庞杂的体系,所以我仅例举些入门的概念,更多的请参阅相关书籍及自行摸索。感兴趣的朋友一起跟着小编来看看吧
收藏 0 赞 0 分享

linux正则表达式awk详解

这篇文章主要介绍了linux正则表达式awk的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

notepad++ 等用正则表达式自动添加sql引号的技巧

本篇文章给大家介绍notepad用正则表达式自动添加sql引号的技巧,,需要的朋友可以参考下
收藏 0 赞 0 分享

常见的正则表达式问题

这篇文章主要介绍了常见的正则表达式问题,需要的朋友可以参考下
收藏 0 赞 0 分享

Linux正则表达式特性详解及BRE与ERE的异同点

本篇文章给大家介绍linux正则表达式特性及BRE与ERE的不同,Linux正则表达式(Regular Expression)主要遵从POSIX BRE或者POSIX ERE标准,对linux正则表达式感兴趣的朋友可以参考下本篇文章
收藏 0 赞 0 分享

Linux下如何使用grep命令查找带有tab(退格)的字符

本文给大家介绍linux下如何使用grep命令查找带有tab(退格)的字符,涉及到linux grep 查找带有tab的字符方面的知识,对linux grep tab感兴趣的朋友可以参考下本篇文章
收藏 0 赞 0 分享

WEB开发时常用的正则表达式(PHP和Javascript)

这篇文章主要介绍了WEB开发中最常用最实用的正则表达式及其用法,需要的朋友可以参考下
收藏 0 赞 0 分享

比较全面的C 、Java、JavaScript中的正则表达式详解

正则表达式(Regular Expression) 就是用某种模式去匹配一类字符串的公式。本篇文章给大家介绍C 、Java、JavaScript中的正则表达式,本文介绍的非常全面,感兴趣的朋友一起看看吧
收藏 0 赞 0 分享
查看更多