第四章-串
□4.1 串类型的定义
由一个或者多个空格组成的串称为空格串(blank string),零个字符的串称为空串(null string)。
串(string)是由零个或多个字符组成的有限序列。称两个串是相等的,当且仅当这两个串的值相等。这就是说只有当两个串的长度相等,并且各个对应位置的字符都相等时才相等。串的逻辑结构和线性表极为相似,区别仅在于串的数据对象约束为字符集。在线性表中,大多以"单个元素"作为操作对象,例如在线性表中查找某个元素,求取某个位置上插入一个元素和删除一个元素等;而在串的基本操作中,通常以串的整体作为操作对象,例如在串中查找某个字串,求取一个子串,在串的某个位置上插入一个字串以及删除一个子串等。
// PROJECT04-01.cpp : 定义控制台应用程序的入口点。
//
#include "stdafx.h"
#include "c1.h"
#include <string.h>
/* ----------------------------------------
串的定长顺序存储表示
----------------------------------------*/
/* 用户可在255以内定义最大串长(1个字节) */
#define MAXSTRLEN 40
/* 0号单元存放串的长度 */
typedef char SString[MAXSTRLEN + 1];
Status StrAssign(SString T,char *chars)
{ /* 生成一个其值等于chars的串T */
int i;
if ( strlen(chars) > MAXSTRLEN ){
return ERROR;
}
T[0] = strlen(chars);
for(i = 1; i <= T[0]; i++){
T[i] = *(chars + i - 1);
}
return OK;
}
Status StrCopy(SString T, SString S)
{ /* 由串S复制得串T */
int i;
for(i = 0; i <= S[0]; i++){
T[i] = S[i];
}
return OK;
}
Status StrEmpty(SString S)
{ /* 若S为空串,则返回TRUE,否则返回FALSE */
if (S[0] == 0){
return TRUE;
}
else{
return FALSE;
}
}
int StrCompare(SString S, SString T)
{ /* 初始条件: 串S和T存在 */
/* 操作结果: 若S>T,则返回值>0;若S=T,则返回值=0;若S<T,则返回值<0 */
int i;
for(i = 1;i <= S[0] && i <= T[0]; ++i){
if (S[i] != T[i]){
return S[i] - T[i];
}
}
return S[0] - T[0];
}
int StrLength(SString S)
{ /* 返回串的元素个数 */
return S[0];
}
Status ClearString(SString S)
{ /* 初始条件:串S存在。操作结果:将S清为空串 */
S[0] = 0;/* 令串长为零 */
return OK;
}
Status Concat(SString T,SString S1,SString S2) /* 算法4.2改 */
{ /* 用T返回S1和S2联接而成的新串。若未截断,则返回TRUE,否则FALSE */
int i;
if (S1[0] + S2[0] < MAXSTRLEN){
/*没有截断*/
for(i = 1; i < S1[0]; i++){
T[i] = S1[i];
}
for(i = 1; i < S2[0]; i++){
T[S1[0] + i] = S2[i];
}
T[0] = S1[0] + S2[0];
return TRUE;
}
else{
/*已截断*/
for(i = 1;i <= S1[0]; i++){
T[i] = S1[i];
}
for(i = 1; i < MAXSTRLEN - S1[0]; i++){
T[S1[0] + i] = S2[i];
}
T[0] = MAXSTRLEN;
return FALSE;
}
}
Status SubString(SString Sub,SString S,int pos,int len)
{ /* 用Sub返回串S的第pos个字符起长度为len的子串。算法4.3 */
int i;
if(pos < 1 || pos > S[0] || len < 0 || len > S[0] - pos + 1){
return ERROR;
}
for(i = 1; i <= len; i++){
Sub[i] = S[i + pos - 1];
}
Sub[0] = len;
return OK;
}
int Index(SString S,SString T,int pos)
{ /* 返回子串T在主串S中第pos个字符之后的位置。若不存在,则函数值为0。 */
/* 其中,T非空,1≤pos≤StrLength(S)。算法4.5 */
int i,j;
if( 1 <= pos && pos <= S[0] ){
i = pos; /*i指向主串的指针*/
j = 1; /*j指向子串的指针*/
while( i <= S[0] && j <= T[0] ){
if(S[i] == T[j]){ /* 继续比较后继字符 */
++i;
++j;
}
else{ /* 指针后退重新开始匹配 */
i = i - j + 2;
j = 1;
}
}
if(j > T[0]){
return i - T[0];
}
else{
return 0;
}
}
else{
return 0;
}
}
void DestroyString()
{ /* 由于SString是定长类型,无法销毁 */
}
void StrPrint(SString T)
{ /* 输出字符串T。另加 */
int i;
for (i = 1; i <= T[0]; i++){
printf("%c", T[i]);
}
printf("\n");
}
Status StrInsert(SString S, int pos, SString T)
{ /* 初始条件: 串S和T存在,1≤pos≤StrLength(S)+1 */
/* 操作结果: 在串S的第pos个字符之前插入串T。完全插入返回TRUE,部分插入返回FALSE */
int i;
if( pos < 1 || pos > S[0] + 1 ){
return ERROR;
}
if(S[0] + T[0] <= MAXSTRLEN){ /* 完全插入 */
/*移动插入以后的后半段*/
for(i = S[0];i >= pos; i--){
S[i + T[0]] = S[i];
}
/*字符串T的插入*/
for(i = pos; i < pos + T[0]; i++){
S[i] = T[i - pos + 1];
}
S[0] = S[0] + T[0];
return TRUE;
}
else{
/* 部分插入 */
for(i = MAXSTRLEN; i <= pos; i--){
S[i]=S[i-T[0]];
}
for(i = pos;i < pos+T[0]; i++){
S[i]=T[i-pos+1];
}
S[0]=MAXSTRLEN;
return FALSE;
}
}
Status StrDelete(SString S,int pos,int len)
{ /* 初始条件: 串S存在,1≤pos≤StrLength(S)-len+1 */
/* 操作结果: 从串S中删除第pos个字符起长度为len的子串 */
int i;
if (pos < 1 || len < 0 || pos > S[0]- len + 1){
return ERROR;
}
for(i = pos + len; i <= S[0]; i++){
S[i-len] = S[i];
}
S[0] -= len;
return OK;
}
Status Replace(SString S,SString T,SString V)
{ /* 初始条件: 串S,T和V存在,T是非空串(此函数与串的存储结构无关) */
/* 操作结果: 用V替换主串S中出现的所有与T相等的不重叠的子串 */
int i=1; /* 从串S的第一个字符起查找串T */
if(StrEmpty(T)){ /* T是空串 */
return ERROR;
}
do{
i = Index(S,T,i);/* 结果i为从上一个i之后找到的子串T的位置 */
if (i){/* 串S中存在串T */
StrDelete(S,i,StrLength(T));/* 删除该串T */
StrInsert(S,i,V); /* 在原串T的位置插入串V */
i += StrLength(V);/* 在插入的串V后面继续查找串T */
}
}while(i);
return OK;
}
void get_next(SString T, int next[])
{ /* 求模式串T的next函数值并存入数组next 算法 4.7 */
int i = 1,j = 0;
next[1] = 0;
while(i < T[0]){
if (j == 0 || T[i] == T[j]){
++i;
++j;
next[i] = j;
}
else{
j = next[j];
}
}
}
int Index_KMP(SString S,SString T,int pos,int next[])
{ /* 利用模式串T的next函数求T在主串S中第pos个字符之后的位置的KMP算法。 */
/* 其中,T非空,1≤pos≤StrLength(S)。算法 4.6 */
int i = pos,j = 1;
while(i <= S[0] && j <= T[0]){
if(j == 0 || S[i] == T[j]){ /* 继续比较后继字符 */
++i;
++j;
}
else{ /* 模式串向右移动 */
j = next[j];
}
}
if(j > T[0]){ /* 匹配成功 */
return i - T[0];
}
else{
return 0;
}
}
int _tmain(int argc, _TCHAR* argv[])
{
int i,j;
Status k;
char s,c[MAXSTRLEN+1];
SString t,s1,s2;
printf("请输入串s1: ");
gets(c);
k=StrAssign(s1,c);
if(!k){
printf("串长超过MAXSTRLEN(=%d)\n",MAXSTRLEN);
exit(0);
}
printf("串长为%d 串空否?%d(1:是 0:否)\n",StrLength(s1),StrEmpty(s1));
StrCopy(s2,s1);
printf("拷贝s1生成的串为: ");
StrPrint(s2);
printf("请输入串s2: ");
gets(c);
k=StrAssign(s2,c);
if(!k){
printf("串长超过MAXSTRLEN(%d)\n",MAXSTRLEN);
exit(0);
}
i = StrCompare(s1,s2);
if(i < 0){
s = '<';
}
else if( i==0 ){
s = '=';
}
else{
s='>';
}
printf("串s1%c串s2\n",s);
k=Concat(t,s1,s2);
printf("串s1联接串s2得到的串t为: ");
StrPrint(t);
if(k==FALSE){
printf("串t有截断\n");
}
ClearString(s1);
printf("清为空串后,串s1为: ");
StrPrint(s1);
printf("串长为%d 串空否?%d(1:是 0:否)\n",StrLength(s1),StrEmpty(s1));
printf("求串t的子串,请输入子串的起始位置,子串长度: ");
scanf("%d,%d",&i,&j);
k=SubString(s2,t,i,j);
if(k){
printf("子串s2为: ");
StrPrint(s2);
}
printf("从串t的第pos个字符起,删除len个字符,请输入pos,len: ");
scanf("%d,%d",&i,&j);
StrDelete(t,i,j);
printf("删除后的串t为: ");
StrPrint(t);
i=StrLength(s2)/2;
StrInsert(s2,i,t);
printf("在串s2的第%d个字符之前插入串t后,串s2为:\n",i);
StrPrint(s2);
i=Index(s2,t,1);
printf("s2的第%d个字母起和t第一次匹配\n",i);
SubString(t,s2,1,1);
printf("串t为:");
StrPrint(t);
Concat(s1,t,t);
printf("串s1为:");
StrPrint(s1);
Replace(s2,t,s1);
printf("用串s1取代串s2中和串t相同的不重叠的串后,串s2为: ");
StrPrint(s2);
return 0;
}
在上述抽象数据类型定义的13种操作中,串赋值StrAssign,串比较StrCompare,求串长StrLength,串连接Concat以及求子串SubString五种操作构成串类型的最小操作子集。即这些操作不可能利用其他操作来实现,反之,其他串操作均可在这个最小操作子集上实现。