使用C语言解决字符串匹配问题的方法

所属分类: 软件编程 / C 语言 阅读数: 83
收藏 0 赞 0 分享

最常想到的方法是使用KMP字符串匹配算法:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int get_nextval(char *pattern, int next[])
{
  //get the next value of the pattern 
  int i = 0, j = -1;
  next[0] = -1;
  int patlen = strlen(pattern);
  while ( i < patlen - 1){
    if ( j == -1 || pattern[i] == pattern[j]){
      ++i;
      ++j;
      if (pattern[i] != pattern[j])
        next[i] = j;
      else
        next[i] = next[j];
    }
    else
      j = next[j];
    }

  return(0);
}

int kmpindex(char *target, char *pattern, int pos)
{
  int tari = pos, pati = 0; 
  int tarlen = strlen(target), patlen = strlen(pattern);
  int *next = (int *)malloc(patlen * sizeof(int));
  get_nextval(pattern, next);
  while ( tari < tarlen && pati < patlen ){
    if (pati == -1 ||target[tari] == pattern[pati]){
      ++tari;
      ++pati;
      }else{
        pati = next[pati];
      }
  }  
if(next != NULL) free(next);
next = NULL;
if (pati == patlen)
  return tari - pati;
else
  return -1;
}


int main()
{
  char target[50], pattern[50];
  printf("imput the target:\n" );
  scanf("%s",target);
  printf("imput the pattern:\n" );
  scanf("%s",pattern);
  int ans = kmpindex(target,pattern,0);
  if (ans == -1)
    printf("error\n");
  else
    printf("index:%d\n",ans);
  return 0;
}


练习题
    题目描述: 
        读入数据string[ ],然后读入一个短字符串。要求查找string[ ]中和短字符串的所有匹配,输出行号、匹配字符串。匹配时不区分大小写,并且可以有一个用中括号表示的模式匹配。如“aa[123]bb”,就是说aa1bb、aa2bb、aa3bb都算匹配。 
    输入: 
    输入有多组数据。 
    每组数据第一行输入n(1<=n<=1000),从第二行开始输入n个字符串(不含空格),接下来输入一个匹配字符串。 
    输出: 
    输出匹配到的字符串的行号和该字符串(匹配时不区分大小写)。 
    样例输入: 
    4 
    Aab 
    a2B 
    ab 
    ABB 
    a[a2b]b 
    样例输出: 
    1 Aab 
    2 a2B 
    4 ABB 


ac代码

 

  #include <stdio.h> 
  #include <stdlib.h> 
  #include <string.h> 
    
  #define MAX 1001 
  #define LEN 101 
    
  struct str 
  { 
    char name[101]; 
  }; 
    
  int main() 
  { 
    struct str strs[MAX]; 
    struct str t[LEN]; 
    int i, n, len, j, k, left, right, count, flag; 
    char text[LEN], newtext[LEN]; 
    
    while (scanf("%d", &n) != EOF) { 
      // 接收数据 
      getchar(); 
      for (i = 0; i < n; i ++) { 
        scanf("%s", strs[i].name); 
      } 
    
      // 接收文本串 
      getchar(); 
      gets(text); 
      len = strlen(text); 
    
      for (i = left = right = 0; i < len; i ++) { 
        if (text[i] == '[') { 
          left = i; 
        } else if (text[i] == ']') { 
          right = i; 
          break; 
        } 
      } 
      count = right - left - 1; 
    
      if (count <= 0) {  // 没有正则匹配 
        for (i = j = 0; i < len; i ++) { 
          if (text[i] != '[' && text[i] != ']') { 
            newtext[j ++] = text[i]; 
          } 
        } 
        newtext[j] = '\0'; 
        for (i = 0; i < n; i ++) { 
          if (strcasecmp(strs[i].name, newtext) == 0) { 
            printf("%d %s\n", i + 1, strs[i].name); 
          } 
        } 
      }else { // 需要正则匹配 
        for (j = 1, k = 0; j <= count; j ++, k ++) { // 构建文本数组 
          memset(t[k].name, '\0', sizeof(t[k].name)); 
          for (i = 0; i < left; i ++) { 
            t[k].name[i] = text[i]; 
          } 
          t[k].name[i] = text[left + j]; 
          strcat(t[k].name, text + right + 1);   
        }   
        
        // 正则匹配  
        for (i = 0; i < n; i ++) { 
          for (j = flag = 0; j < count; j ++) { 
            if (strcasecmp(strs[i].name, t[j].name) == 0) { 
              flag = 1; 
              break; 
            } 
          } 
          if (flag) { 
            printf("%d %s\n", i + 1, strs[i].name); 
          } 
        } 
      } 
    
    } 
    
    return 0; 
  } 

    /**************************************************************
        Problem: 1165
        User: wangzhengyi
        Language: C
        Result: Accepted
        Time:0 ms
        Memory:948 kb
    ****************************************************************/

更多精彩内容其他人还在看

C++中四种对象生存期和作用域以及static的用法总结分析

以下是对C++中四种对象生存期和作用域以及static的用法进行了详细的介绍,需要的朋友可以过来参考下
收藏 0 赞 0 分享

C++嵌套类与局部类详细解析

从作用域的角度看,嵌套类被隐藏在外围类之中,该类名只能在外围类中使用。如果在外围类之外的作用域使用该类名时,需要加名字限定
收藏 0 赞 0 分享

C++空类详解

以下是对C++中的空类进行了详细的介绍,需要的朋友可以过来参考下
收藏 0 赞 0 分享

C++之友元:友元函数和友元类详解

友元是一种允许非类成员函数访问类的非公有成员的一种机制。可以把一个函数指定为类的友元,也可以把整个类指定为另一个类的友元
收藏 0 赞 0 分享

C++中返回指向函数的指针示例

int (*ff(int)) (int *,int);表示:ff(int)是一个函数,带有一个int型的形参,该函数返回int (*) (int *,int),它是一个指向函数的指针,所指向的函数返回int型并带有两个分别是Int*和int型的形参
收藏 0 赞 0 分享

C数据结构之单链表详细示例分析

以下是对C语言中的单链表进行了详细的分析介绍,需要的朋友可以过来参考下
收藏 0 赞 0 分享

C数据结构之双链表详细示例分析

以下是对c语言中的双链表进行了详细的分析介绍,需要的朋友可以过来参考下
收藏 0 赞 0 分享

浅析如何在c语言中调用Linux脚本

如何在c语言中调用Linux脚本呢?下面小编就为大家详细的介绍一下吧!需要的朋友可以过来参考下
收藏 0 赞 0 分享

深入解析unsigned int 和 int

以下是对unsigned int和int进行了详细的分析介绍,需要的朋友可以过来参考下
收藏 0 赞 0 分享

浅谈C++中的string 类型占几个字节

本篇文章小编并不是为大家讲解string类型的用法,而是讲解我个人比较好奇的问题,就是string 类型占几个字节
收藏 0 赞 0 分享
查看更多