C语言中判断一个char*是不是utf8编码

所属分类: 软件编程 / C 语言 阅读数: 38
收藏 0 赞 0 分享

C语言中判断一个char*是不是utf8编码

里我修改了一下, 纯ASCII编码的字符串也返回true, 因为UTF8和ASCII兼容

实例代码:

int utf8_check(const char* str, size_t length) { 
  size_t i; 
  int nBytes; 
  unsigned char chr; 
 
  i = 0; 
  nBytes = 0; 
  while (i < length) { 
    chr = *(str + i); 
 
    if (nBytes == 0) { //计算字节数 
      if ((chr & 0x80) != 0) { 
        while ((chr & 0x80) != 0) { 
          chr <<= 1; 
          nBytes++; 
        } 
        if ((nBytes < 2) || (nBytes > 6)) { 
          return 0; //第一个字节最少为110x xxxx 
        } 
        nBytes--; //减去自身占的一个字节 
      } 
    } else { //多字节除了第一个字节外剩下的字节 
      if ((chr & 0xC0) != 0x80) { 
        return 0; //剩下的字节都是10xx xxxx的形式 
      } 
      nBytes--; 
    } 
    i++; 
  } 
  return (nBytes == 0); 
} 

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

更多精彩内容其他人还在看

C 语言基础教程(我的C之旅开始了)[三]

C 语言基础教程(我的C之旅开始了)[三]
收藏 0 赞 0 分享

C 语言基础教程(我的C之旅开始了)[四]

C 语言基础教程(我的C之旅开始了)[四]
收藏 0 赞 0 分享

C 语言基础教程(我的C之旅开始了)[五]

C 语言基础教程(我的C之旅开始了)[五]
收藏 0 赞 0 分享

C 语言基础教程(我的C之旅开始了)[六]

C 语言基础教程(我的C之旅开始了)[六]
收藏 0 赞 0 分享

C 语言基础教程(我的C之旅开始了)[七]

C 语言基础教程(我的C之旅开始了)[七]
收藏 0 赞 0 分享

C 语言基础教程(我的C之旅开始了)[八]

C 语言基础教程(我的C之旅开始了)[八]
收藏 0 赞 0 分享

C 语言基础教程(我的C之旅开始了)[九]

C 语言基础教程(我的C之旅开始了)[九]
收藏 0 赞 0 分享

C 语言基础教程(我的C之旅开始了)[十]

C 语言基础教程(我的C之旅开始了)[十]
收藏 0 赞 0 分享

tc编译的dos程序和vc编译的win32控制台程序的异同

tc编译的dos程序和vc编译的win32控制台程序的异同
收藏 0 赞 0 分享

C语言WinSock学习笔记第1/2页

本篇文章主要介绍了C语言WinSock学习笔记,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
收藏 0 赞 0 分享
查看更多