c++字符串分割的方法

所属分类: 软件编程 / C 语言 阅读数: 131
收藏 0 赞 0 分享

C++ 中经常需要对字符串按照分隔符进行分割以获得子串序列,子串的顺序与其在原字符串中出现的顺序一致。一般有两种需求场景:
 (1)给定一个分隔符(单个字符或子串)分割字符串;
 (2)给定一个或多个分隔符(单个字符),分割字符串。

当给定的分隔符不在原字符串中,则原字符串不被分割,返回单个元素为原字符串的 vector。

注意,本文实现时,如果被分割后的子串为空串,则不计入最终的子串序列。比如原字符串是"a,b",分隔符为",",那么分割后的子串序列为 [“a”, “b”],而不是 [“a”, “”, “b”]。

1.单个分隔符(单个字符或子串)分割字符串

#include <iostream>
#include <vector>
#include <string>
using namespace std;

//@brief: 指定单个分隔符(单个字符或子串)分割字符串
//@param: src 原字符串;delimiter 分隔符,单个字符或子串
vector<string> splitStr(const string& src, const string& delimiter) {
	std::vector<string> vetStr;
	
	// 入参检查
	// 1.原字符串为空或等于分隔符,返回空 vector
	if (src == "" || src == delimiter) {
		return vetStr;
	}
	// 2.分隔符为空返回单个元素为原字符串的 vector
	if (delimiter == "") {
		vetStr.push_back(src);
		return vetStr;
	}

	string::size_type startPos = 0;
	auto index = src.find(delimiter);
	while (index != string::npos) {
		auto str = src.substr(startPos, index - startPos);
		if (str != "") {
			vetStr.push_back(str);
		}
		startPos = index + delimiter.length();
		index = src.find(delimiter, startPos);
	}
	// 取最后一个子串
	auto str = src.substr(startPos);
	if (str != "") {
		vetStr.push_back(str);
	}

	return vetStr;
}

测试如下:

int main(int argc, char* argv[]) {
	string str = "I,love,China";

	// 正常分割
	auto vetStr = splitStr(str, ",");
	cout << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}

	// 边界测试
	vetStr = splitStr(str, "I,");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}

	// 不包含分隔符
	vetStr = splitStr(str, "what");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}
	return 0;
}

输出结果:

vetStr.size() = 3
I love China
vetStr.size() = 1
love,China
vetStr.size() = 1
I,love,China

2.单个或多个分隔符(单个字符)分割字符串

实现和单个分隔符(单个字符或子串)分割字符串基本一致,关键地方是将获取分隔符下标的函数由 std::string::find(…) 改为 std::string::find_first_of(…)。二者的区别如下:

std::string::find(...)
 将分隔符看作一个整体在原字符串中查找并返回匹配的下标,比如 string("I love China").find("love") 返回 2。
std::string::find_first_of(...)
 在字符串中搜索分隔符中任意一个字符出现的第一个位置。与 std::string::find(...) 的区别是不需要整个分隔符匹配,只需要分隔符中的单个字符匹配即可。

具体实现如下:

//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 单个或多个分隔符(单个字符)
vector<string> splitStr(const string& src, const string& delimiter) {
	std::vector<string> vtStr;

	// 入参检查
	// 1.原字符串为空返回空 vector
	if (src == "") {
		return vtStr;
	}
	// 2.分隔符为空返回单个元素为原字符串的 vector
	if (delimiter == "") {
		vtStr.push_back(src);
		return vtStr;
	}

	string::size_type startPos = 0;
	auto index = src.find_first_of(delimiter);
	while (index != string::npos) {
		auto str = src.substr(startPos, index - startPos);
		if (str != "") {
			vtStr.push_back(str);
		}
		startPos = index + 1;
		index = src.find_first_of(delimiter, startPos);
	}
	// 取最后一个子串
	auto str = src.substr(startPos);
	if (str != "") {
		vtStr.push_back(str);
	}

	return vtStr;
}

测试如下:

int main(int argc, char* argv[]) {
	string str = "I,love,China";

	// 正常分割。按照 h 与逗号分割
	auto vetStr = splitStr(str, "h,");
	cout << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}

	// 边界测试
	vetStr = splitStr(str, "Ia");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}

	// 不包含分隔符
	vetStr = splitStr(str, "_:");
	cout << endl << "vetStr.size() = " << vetStr.size() << endl;
	for (auto v : vetStr) {
		cout << v << " ";
	}
	return 0;
}

输出结果:

vetStr.size() = 4
I love C ina
vetStr.size() = 1
,love,Chin
vetStr.size() = 1
I,love,China

3.反面实例

下面是我情急之下实现的单个或多个分隔符(单个字符)分割字符串的函数,有点“脏乱差”,作为反面教材,希望能够帮助大家时刻记住代码的简洁与优雅是多么可贵,大家可以对比感受一下。另外,适当的代码注释,对提高代码的可读性会有很大帮助。

脏乱差版本一:

//qsort函数需要的比较函数,按照升序排序
int comp(const void*a,const void*b) {
	return *(int*)a-*(int*)b;
}

//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 分隔符集合
vector<string> splitStr(const string& src,const string& delimiter) {
	vector<string> strRes;
	int maxSubstrNum=src.size();
	int* pos=new int[maxSubstrNum];
	memset(pos,0,maxSubstrNum*sizeof(int));
	
	int j=0;
	for(size_t i=0;i<delimiter.size();++i) {
		string::size_type index=src.find(delimiter[i]);
		while(index!=string::npos) {
			pos[j++]=index;
			index=src.find(delimiter[i],index+1);
		}		
	}
	//排序
	qsort(pos,j,sizeof(int),comp);
	//取出第一个子串
	string substrFir=src.substr(0,pos[0]);
	if(substrFir!="") 
		strRes.push_back(substrFir);
	//取出中间j-1个子串
	for(int i=0;i<j-1;++i) {
		string substr=src.substr(pos[i]+1,pos[i+1]-pos[i]-1);
		if(substr!="") {
			strRes.push_back(substr);
		}
	}
	//取出最后一个子串
	string substrLast=src.substr(pos[j-1]+1,src.size()-pos[j-1]-1);
	if(substrLast!="") {
		strRes.push_back(substrLast);
	}
	delete[] pos;
	return strRes;
}

代码主要说明:
 (1)利用 find() 和 substr() 函数实现分割功能;
 (2)代码中,需要对分割符出现的下标进行排序,这样才能顺序取出子串。

脏乱差版本二:

//@brief: 指定单个或多个分隔符(单个字符)分割字符串
//@param: src 原字符串;delimiter 分隔符集合
std::vector<std::string> splitStr(const std::string &sStr, const std::string &sSep) {
  std::vector<std::string> vt;

  std::string::size_type pos = 0;
  std::string::size_type pos1 = 0;
  int pos_tmp = -1;

  while(true) {
    std::string s;
    std::string s1;
    pos1 = sStr.find_first_of(sSep, pos);
    if(pos1 == std::string::npos) {
      if(pos + 1 <= sStr.length()) {
        s = sStr.substr(-1 != pos_tmp ? pos_tmp : pos);
        s1 = "";
      }
    } else if(pos1 == pos && (pos1 + 1 == sStr.length())) {
      s = "";
      s1 = "";
    } else {
      s = sStr.substr(-1 != pos_tmp ? pos_tmp : pos, pos1 - (-1 != pos_tmp ? pos_tmp : pos));
      s1 = sStr.substr(pos1 + 1);
      if (-1 == pos_tmp) {
        pos_tmp = pos;
      	}
      pos = pos1;
    }

    if(!s.empty()) {
      vt.push_back(s);
    }
    pos_tmp = -1;

    if(pos1 == std::string::npos) {
      break;
    }

    pos++;
  }

  return vt;
}

以上就是c++字符串分割的方法的详细内容,更多关于C++ 字符串分割的资料请关注脚本之家其它相关文章!

更多精彩内容其他人还在看

用标准c++实现string与各种类型之间的转换

这个类在头文件中定义, < sstream>库定义了三种类:istringstream、ostringstream和stringstream,分别用来进行流的输入、输出和输入输出操作。另外,每个类都有一个对应的宽字符集版本
收藏 0 赞 0 分享

C++如何通过ostringstream实现任意类型转string

再使用整型转string的时候感觉有点棘手,因为itoa不是标准C里面的,而且即便是有itoa,其他类型转string不是很方便。后来去网上找了一下,发现有一个好方法
收藏 0 赞 0 分享

C/C++指针小结

要搞清一个指针需要搞清指针的四方面的内容:指针的类型,指针所指向的类型,指针的值或者叫指针所指向的内存区,还有指针本身所占据的内存区
收藏 0 赞 0 分享

C++ 类的静态成员深入解析

在C++中类的静态成员变量和静态成员函数是个容易出错的地方,本文先通过几个例子来总结静态成员变量和成员函数使用规则,再给出一个实例来加深印象
收藏 0 赞 0 分享

C++类的静态成员初始化详细讲解

通常静态数据成员在类声明中声明,在包含类方法的文件中初始化.初始化时使用作用域操作符来指出静态成员所属的类.但如果静态成员是整型或是枚举型const,则可以在类声明中初始化
收藏 0 赞 0 分享

C++类静态成员与类静态成员函数详解

静态成员不可在类体内进行赋值,因为它是被所有该类的对象所共享的。你在一个对象里给它赋值,其他对象里的该成员也会发生变化。为了避免混乱,所以不可在类体内进行赋值
收藏 0 赞 0 分享

C++中的friend友元函数详细解析

友元可以是一个函数,该函数被称为友元函数;友元也可以是一个类,该类被称为友元类。友元函数的特点是能够访问类中的私有成员的非成员函数。友元函数从语法上看,它与普通函数一样,即在定义上和调用上与普通函数一样
收藏 0 赞 0 分享

static全局变量与普通的全局变量的区别详细解析

以下是对static全局变量与普通的全局变量的区别进行了详细的分析介绍,需要的朋友可以过来参考下,希望对大家有所帮助
收藏 0 赞 0 分享

C++ explicit关键字的应用方法详细讲解

C++ explicit关键字用来修饰类的构造函数,表明该构造函数是显式的,既然有"显式"那么必然就有"隐式",那么什么是显示而什么又是隐式的呢?下面就让我们一起来看看这方面的知识吧
收藏 0 赞 0 分享

教你5分钟轻松搞定内存字节对齐

随便google一下,人家就可以跟你解释的,一大堆的道理,我们没怎么多时间,讨论为何要对齐.直入主题,怎么判断内存对齐规则,sizeof的结果怎么来的,请牢记以下3条原则
收藏 0 赞 0 分享
查看更多