现在的位置: 首页 > 综合 > 正文

字符串分割

2018年04月03日 ⁄ 综合 ⁄ 共 3402字 ⁄ 字号 评论关闭

字符串分割

(1).char *strtok(char s[], const char *delim);

strtok()用来将字符串分割成一个个片段。参数s指向欲分割的字符串,参数delim则为分割字符串中包含的所有字符。当strtok()在参数s的字符串中发现参数delim中包含的分割字符时,则会将该字符改为\0 字符。在第一次调用时,strtok()必需给予参数s字符串,往后的调用则将参数s设置成NULL。每次调用成功则返回指向被分割出片段的指针。从s开头开始的一个个被分割的串。当查找不到delim中的字符时,返回NULL。所有delim中包含的字符都会被滤掉,并将被滤掉的地方设为一处分割的节点。

strtok的弱点

我们有一段字符串 "Fred male 25,John male 62,Anna female 16" 我们希望把这个字符串整理输入到一个struct

struct person { 

     char [25] name ; 

     char [6] sex;

     char [4] age;

}

要做到这个,其中一个方法就是先提取一段被“,”分割的字符串,然后再将其以“ ”(空格)分割。比如: 截取 "Fred male 25" 然后分割成 "Fred" "male" "25"

#include<stdio.h>

#include<string.h>

#define INFO_MAX_SZ 255

int main()

{

   int in=0;

   char buffer[INFO_MAX_SZ]="Fred male 25,John male 62,Anna female 16";

   char *p[20];

   char *buf=buffer;

 

   while((p[in]=strtok(buf,","))!=NULL) {

             buf=p[in];

             while((p[in]=strtok(buf," "))!=NULL) {

                       in++;

                       buf=NULL;

                    }

                 p[in++]="***"; //表现分割

                 buf=NULL; }

 

   printf("Here we have %d strings/n",i);

   for (int j=0; j<in; j++)

         printf(">%s</n",p[j]);

   return 0;

}

这个程序输出为:

Here we have 4 strings

>Fred<

>male<

>25<

>***<

这只是一小段的数据,并不是我们需要的。但这是为什么呢? 这是因为strtok使用一个static(静态)指针来操作数据,让我来分析一下以上代码的运行过程:

红色strtok内置指针指向的位置蓝色strtok对字符串的修改
1. "Fred male 25,John male 62,Anna female 16" //外循环
2. "Fred male 25/0John male 62,Anna female 16" //进入内循环
3. "Fred/0male 25/0John male 62,Anna female 16"
4. "Fred/0male/025/0John male 62,Anna female 16"
5 "Fred/0male/025/0John male 62,Anna female 16" //内循环遇到"/0"回到外循环
6 "Fred/0male/025/0John male 62,Anna female 16" //外循环遇到"/0"运行结束。

使用strtok_r

在这种情况我们应该使用strtok_r()

char *strtok_r(char *s, const char *delim, char **ptrptr);

相对strtok我们需要为strtok提供一个指针来操作,而不是像strtok使用配套的指针。

#include<stdio.h>

#include<string.h>

#define INFO_MAX_SZ 255

int main()

{

   int in=0;

   char buffer[INFO_MAX_SZ]="Fred male 25,John male 62,Anna female 16";

   char *p[20];

   char *buf=buffer;

 

   char *outer_ptr=NULL;

   char *inner_ptr=NULL;

 

   while((p[in]=strtok_r(buf,",",&outer_ptr))!=NULL) {

             buf=p[in];

             while((p[in]=strtok_r(buf," ",&inner_ptr))!=NULL) {

                       in++;

                       buf=NULL;

                    }

                 p[in++]="***";

                 buf=NULL; }

 

   printf("Here we have %d strings/n",i);

   for (int j=0; jn<i; j++)

         printf(">%s</n",p[j]);

   return 0;

}

这一次的输出为:

Here we have 12 strings

>Fred<

>male<

>25<

>***<

>John<

>male<

>62<

>***<

>Anna<

>female<

>16<

>***<

红色strtok_router_ptr指向的位置
紫色strtok_rinner_ptr指向的位置
蓝色strtok对字符串的修改
1. "Fred male 25,John male 62,Anna female 16" //外循环
2. "Fred male 25/0John male 62,Anna female 16"//进入内循环
3. "Fred/0male 25/0John male 62,Anna female 16"
4. "Fred/0male/025/0John male 62,Anna female 16"
5. "Fred/0male/025/0John male 62,Anna female 16" //内循环遇到"/0"回到外循环
6. "Fred/0male/025/0John male 62/0Anna female 16"//进入内循环

 

(2).

原型:char *strsep(char **stringp, const char *delim);

功能:分解字符串为一组字符串。从stringp指向的位置起向后扫描,遇到delim指向的字符串中的字符后(以字符为单位,delim中任何字符都可以),将此字符替换为NULL,返回stringp指向的地址。它适用于分割“关键字”在两个字符串之间只“严格出现一次”的情况。如果“关键字”在字符串之间连续出现,可使用如下技巧解决:

char str[] = "abcdefg";

  char *p = str;

  char *key_point;

  while(p)

  {

  while ( key_point = strsep(&p,"cd"))//关键字为cd,它们连续出现了

  {

  //函数遇到c时,key_point指向c返回,遇到dkey_point指向d返回(注意此时d已经被改写为'\0'了)

  if (*key_point == 0)

  continue;//遇到连续的关键字,返回一个指向\0的指针,继续往后找就是

  else

  break;//分割出一个正常的字符串,快去打印吧!

  }

  printf("%s\n",key_point);

  }

 

【上篇】
【下篇】

抱歉!评论已关闭.