字符串分割
(1).char *strtok(char s[], const char *delim);
strtok()用来将字符串分割成一个个片段。参数s指向欲分割的字符串,参数delim则为分割字符串中包含的所有字符。当strtok()在参数s的字符串中发现参数delim中包含的分割字符时,则会将该字符改为\0 字符。在第一次调用时,strtok()必需给予参数s字符串,往后的调用则将参数s设置成NULL。每次调用成功则返回指向被分割出片段的指针。从s开头开始的一个个被分割的串。当查找不到delim中的字符时,返回NULL。所有delim中包含的字符都会被滤掉,并将被滤掉的地方设为一处分割的节点。
strtok的弱点
我们有一段字符串 "Fred male 25,John male 62,Anna female 16" 我们希望把这个字符串整理输入到一个struct,
struct person {
char [25] name ;
char [6] sex;
char [4] age;
}
要做到这个,其中一个方法就是先提取一段被“,”分割的字符串,然后再将其以“ ”(空格)分割。比如: 截取 "Fred male 25" 然后分割成 "Fred" "male" "25"
#include<stdio.h>
#include<string.h>
#define INFO_MAX_SZ 255
int main()
{
int in=0;
char buffer[INFO_MAX_SZ]="Fred male 25,John male 62,Anna female 16";
char *p[20];
char *buf=buffer;
while((p[in]=strtok(buf,","))!=NULL) {
buf=p[in];
while((p[in]=strtok(buf," "))!=NULL) {
in++;
buf=NULL;
}
p[in++]="***"; //表现分割
buf=NULL; }
printf("Here we have %d strings/n",i);
for (int j=0; j<in; j++)
printf(">%s</n",p[j]);
return 0;
}
这个程序输出为:
Here we have 4 strings
>Fred<
>male<
>25<
>***<
这只是一小段的数据,并不是我们需要的。但这是为什么呢? 这是因为strtok使用一个static(静态)指针来操作数据,让我来分析一下以上代码的运行过程:
红色为strtok的内置指针指向的位置,蓝色为strtok对字符串的修改
1. "Fred male 25,John male 62,Anna female 16" //外循环
2. "Fred male 25/0John male 62,Anna female 16" //进入内循环
3. "Fred/0male 25/0John male 62,Anna female 16"
4. "Fred/0male/025/0John male 62,Anna female 16"
5 "Fred/0male/025/0John male 62,Anna female 16" //内循环遇到"/0"回到外循环
6 "Fred/0male/025/0John male 62,Anna female 16" //外循环遇到"/0"运行结束。
使用strtok_r
在这种情况我们应该使用strtok_r()
char *strtok_r(char *s, const char *delim, char **ptrptr);
相对strtok我们需要为strtok提供一个指针来操作,而不是像strtok使用配套的指针。
#include<stdio.h>
#include<string.h>
#define INFO_MAX_SZ 255
int main()
{
int in=0;
char buffer[INFO_MAX_SZ]="Fred male 25,John male 62,Anna female 16";
char *p[20];
char *buf=buffer;
char *outer_ptr=NULL;
char *inner_ptr=NULL;
while((p[in]=strtok_r(buf,",",&outer_ptr))!=NULL) {
buf=p[in];
while((p[in]=strtok_r(buf," ",&inner_ptr))!=NULL) {
in++;
buf=NULL;
}
p[in++]="***";
buf=NULL; }
printf("Here we have %d strings/n",i);
for (int j=0; jn<i; j++)
printf(">%s</n",p[j]);
return 0;
}
这一次的输出为:
Here we have 12 strings
>Fred<
>male<
>25<
>***<
>John<
>male<
>62<
>***<
>Anna<
>female<
>16<
>***<
红色为strtok_r的outer_ptr指向的位置,
紫色为strtok_r的inner_ptr指向的位置,
蓝色为strtok对字符串的修改
1. "Fred male 25,John male 62,Anna female 16" //外循环
2. "Fred male 25/0John male 62,Anna female 16"//进入内循环
3. "Fred/0male 25/0John male 62,Anna female 16"
4. "Fred/0male/025/0John male 62,Anna female 16"
5. "Fred/0male/025/0John male 62,Anna female 16" //内循环遇到"/0"回到外循环
6. "Fred/0male/025/0John male 62/0Anna female 16"//进入内循环
(2).
原型:char *strsep(char **stringp, const char *delim);
功能:分解字符串为一组字符串。从stringp指向的位置起向后扫描,遇到delim指向的字符串中的字符后(以字符为单位,delim中任何字符都可以),将此字符替换为NULL,返回stringp指向的地址。它适用于分割“关键字”在两个字符串之间只“严格出现一次”的情况。如果“关键字”在字符串之间连续出现,可使用如下技巧解决:
char str[] = "abcdefg";
char *p = str;
char *key_point;
while(p)
{
while ( key_point = strsep(&p,"cd"))//关键字为c或d,它们连续出现了
{
//函数遇到c时,key_point指向c返回,遇到d时key_point指向d返回(注意此时d已经被改写为'\0'了)
if (*key_point == 0)
continue;//遇到连续的关键字,返回一个指向\0的指针,继续往后找就是
else
break;//分割出一个正常的字符串,快去打印吧!
}
printf("%s\n",key_point);
}