现在的位置: 首页 > 综合 > 正文

名企面试官精讲典型编程题之数据结构字符串篇

2013年08月09日 ⁄ 综合 ⁄ 共 6060字 ⁄ 字号 评论关闭

名企面试官精讲典型编程题之数据结构字符串篇

字符串是由若干字符组成的序列。由于字符串在编程时使用的频率非常高,为了优化,很多语言都对字符串做了特殊的规定。下面分别讨论C/C++和C#中字符串的特性。

C/C++ 中每个字符串都以字符'\0'作为结尾,这样我们就能很方便地找到字符串的最后尾部。但由于这个特点,每个字符串中都有一个额外字符的开销,稍不留神就会造成字符串的越界。比如下面的代码:

char str[10];

strcpy(str,"0123456789");

我们先声明一个长度为10的字符数组,然后把字符串"0123456789"复制到数组中。"0123456789"这个字符串看起来只有10个字符,但实际上它的末尾还有一个'\0'字符,因此它的实际长度为11个字节。要正确地复制该字符串,至少需要一个长度为11个字节的数组。

为了节省内存,C/C++把常量字符串放到单独的一个内存区域。当几个指针赋值给相同的常量字符串时,它们实际上会指向相同的内存地址。但用常量内存初始化数组,情况却有所不同。下面通过一个面试题来学习这一知识点。运行下面的代码,得到的结果是什么?

int _tmain(int argc,_TCHAR* argv[])

{

    char str1[] = "hello world";

    char str2[] = "hello world";

 

    char* str3 = "hello world";

    char* str4 = "hello world";

 

    if(str1 == str2)

        printf("str1 and str2 are same.\n");

    else

        printf("str1 and str2 are notsame.\n");

 

    if(str3 == str4)

        printf("str3 and str4 aresame.\n");

    else

        printf("str3 and str4 are notsame.\n");

 

    return 0;

}

str1和str2是两个字符串数组,我们会为它们分配两个长度为12个字节的空间,并把"hello world"的内容分别复制到数组中去。这是两个初始地址不同的数组,因此str1和str2的值也不相同,所以输出的第一行是”str1 and str2 are not same”。

str3和str4是两个指针,我们无须为它们分配内存以存储字符串的内容,而只需要把它们指向"helloworld”在内存中的地址就可以了。由于"hello world”是常量字符串,它在内存中只有一个拷贝,因此str3和str4指向的是同一个地址。所以比较str3和str4的值得到的结果是相同的,输出的第二行是”str3 and str4 are same”。

在C#中,封装字符串的类型System.String有一个非常特殊的性质:String中的内容是不能改变的。一旦试图改变String的内容,就会产生一个新的实例。请看下面的C#代码:

String str ="hello";

str.ToUpper();

str.Insert(0, "WORLD");

虽然我们对str做了ToUpper和Insert两个操作,但操作的结果都是生成一个新的String实例并在返回值中返回,str本身的内容都不会发生改变,因此最终str的值仍然是"hello"。由此可见,如果试图改变String的内容,改变之后的值只可以通过返回值得到。用String作连续多次修改,每一次修改都会产生一个临时对象,这样开销太大会影响效率。为此C#定义了一个新的与字符串相关的类型StringBuilder,它能容纳修改后的结果。因此如果要连续多次修改字符串内容,用StringBuilder是更好的选择。

和修改String内容类似,如果我们试图把一个常量字符串赋值给一个String实例,也不是把String的内容改成赋值的字符串,而是生成一个新的String实例。请看下面的代码:

class Program

{

    internal static void ValueOrReference(Typetype)

    {

        String result = "The type " +type.Name;

 

        if (type.IsValueType)

            Console.WriteLine(result + " is avalue type.");

        else

            Console.WriteLine(result + "is a reference type.");

    }

 

    internal static void ModifyString(Stringtext)

    {

        text = "world";

    }

 

    static void Main(string[] args)

    {

        String text = "hello";

 

        ValueOrReference(text.GetType());

        ModifyString(text);

 

        Console.WriteLine(text);

    }

}

在上面的代码中,我们先判断String是值类型还是引用类型。类型String的定义是public sealed class String {...}。既然是class,那么String自然就是引用类型。接下来在方法ModifyString里,对text赋值一个新的字符串。我们要记得text的内容是不能被修改的。此时会先生成一个新的内容是"world"的String实例,然后把text指向这个新的实例。由于参数text没有加ref或者out,出了方法ModifyString之后,text还是指向原来的字符串,因此输出仍然是"hello"。要想实现出了函数之后text变成"world"的效果,我们必须把参数text标记ref或者out。

面试题4:替换空格

题目:请实现一个函数,把字符串中的每个空格替换成"%20"。例如输入“We are happy.”,则输出“We%20are%20happy.”。

在网络编程中,如果URL参数中含有特殊字符,如空格、'#'等,可能导致服务器端无法获得正确的参数值。我们需要将这些特殊符号转换成服务器可以识别的字符。转换的规则是在'%'后面跟上ASCII码的两位十六进制的表示。比如空格的ASCII码是32,即十六进制的0x20,因此空格被替换成"%20"。再比如'#'的ASCII码为35,即十六进制的0x23,它在URL中被替换为"%23"。

看到这个题目,我们首先应该想到的是原来一个空格字符,替换之后变成'%'、'2'和'0'这3个字符,因此字符串会变长。如果是在原来的字符串上做替换,那么就有可能覆盖修改在该字符串后面的内存。如果是创建新的字符串并在新的字符串上做替换,那么我们可以自己分配足够多的内存。由于有两种不同的解决方案,我们应该向面试官问清楚,让他明确告诉我们他的需求。假设面试官让我们在原来的字符串上做替换,并且保证输入的字符串后面有足够多的空余内存。

 时间复杂度为O(n2)的解法,不足以拿到Offer

现在我们考虑怎么做替换操作。最直观的做法是从头到尾扫描字符串,每一次碰到空格字符的时候做替换。由于是把1个字符替换成3个字符,我们必须要把空格后面所有的字符都后移两个字节,否则就有两个字符被覆盖了。

举个例子,我们从头到尾把"We are happy."中的每一个空格替换成"%20"。为了形象起见,我们可以用一个表格来表示字符串,表格中的每个格子表示一个字符(如图2.3(a)所示)。

 

图2.3 从前往后把字符串中的空格替换成'%20'的过程

注:(a)字符串"Weare happy."。(b)把字符串中的第一个空格替换成'%20'。灰色背景表示需要移动的字符。(c)把字符串中的第二个空格替换成'%20'。浅灰色背景表示需要移动一次的字符,深灰色背景表示需要移动两次的字符。

我们替换第一个空格,这个字符串变成图2.3(b)中的内容,表格中灰色背景的格子表示需要做移动的区域。接着我们替换第二个空格,替换之后的内容如图2.3(c)所示。同时,我们注意到用深灰色背景标注的"happy"部分被移动了两次。

假设字符串的长度是n。对每个空格字符,需要移动后面O(n)个字符,因此对含有O(n)个空格字符的字符串而言总的时间效率是O(n2)。

当我们把这种思路阐述给面试官后,他不会就此满意,他将让我们寻找更快的方法。在前面的分析中,我们发现数组中很多字符都移动了很多次,能不能减少移动次数呢?答案是肯定的。我们换一种思路,把从前向后替换改成从后向前替换。

 时间复杂度为O(n)的解法,搞定Offer就靠它了

我们可以先遍历一次字符串,这样就能统计出字符串中空格的总数,并可以由此计算出替换之后的字符串的总长度。每替换一个空格,长度增加2,因此替换以后字符串的长度等于原来的长度加上2乘以空格数目。我们还是以前面的字符串"We are happy."为例,"We arehappy."这个字符串的长度是14(包括结尾符号'\0'),里面有两个空格,因此替换之后字符串的长度是18。

我们从字符串的后面开始复制和替换。首先准备两个指针,P1和P2。P1指向原始字符串的末尾,而P2指向替换之后的字符串的末尾(如图2.4(a)所示)。接下来我们向前移动指针P1,逐个把它指向的字符复制到P2指向的位置,直到碰到第一个空格为止。此时字符串包含如图2.4(b)所示,灰色背景的区域是做了字符拷贝(移动)的区域。碰到第一个空格之后,把P1向前移动1格,在P2之前插入字符串"%20"。由于"%20"的长度为3,同时也要把P2向前移动3格如图2.4(c)所示。

我们接着向前复制,直到碰到第二个空格(如图2.4(d)所示)。和上一次一样,我们再把P1向前移动1格,并把P2向前移动3格插入"%20"(如图2.4(e)所示)。此时P1和P2指向同一位置,表明所有空格都已经替换完毕。

从上面的分析我们可以看出,所有的字符都只复制(移动)一次,因此这个算法的时间效率是O(n),比第一个思路要快。

 

图2.4 从后往前把字符串中的空格替换成“%20”的过程

注:图中带有阴影的区域表示被移动的字符。(a)把第一个指针指向字符串的末尾,把第二个指针指向替换之后的字符串的末尾。(b)依次复制字符串的内容,直至第一个指针碰到第一个空格。(c)把第一个空格替换成'%20',把第一个指针向前移动1格,把第二个指针向前移动3格。(d)依次向前复制字符串中的字符,直至碰到空格。(e)替换字符串中的倒数第二个空格,把第一个指针向前移动1格,把第二个指针向前移动3格。

在面试的过程中,我们也可以和前面的分析一样画一两个示意图解释自己的思路,这样既能帮助我们理清思路,也能使我们和面试官的交流变得更加高效。在面试官肯定我们的思路之后,就可以开始写代码了。下面是参考代码:

/*length 为字符数组string的总容量*/

voidReplaceBlank(char string[], int length)

{

    if(string == NULL && length <=0)

 

 

        return;

 

    /*originalLength 为字符串string的实际长度*/

    int originalLength = 0;

    int numberOfBlank = 0;

    int i = 0;

    while(string[i] != '\0')

    {

        ++ originalLength;

 

        if(string[i] == ' ')

            ++ numberOfBlank;

 

        ++ i;

    }

 

    /*newLength 为把空格替换成'%20'之后的长度*/

    int newLength = originalLength +numberOfBlank * 2;

    if(newLength > length)

        return;

 

    int indexOfOriginal = originalLength;

    int indexOfNew = newLength;

    while(indexOfOriginal >= 0 &&indexOfNew > indexOfOriginal)

    {

        if(string[indexOfOriginal] == ' ')

        {

            string[indexOfNew --] = '0';

            string[indexOfNew --] = '2';

            string[indexOfNew --] = '%';

        }

        else

        {

            string[indexOfNew --] =string[indexOfOriginal];

        }

 

        -- indexOfOriginal;

    }

}

  源代码:

本题完整的源代码详见04_ReplaceBlank项目。

  测试用例:

输入的字符串中包含空格(空格位于字符串的最前面,空格位于字符串的最后面,空格位于字符串的中间,字符串中有连续多个空格)。

输入的字符串中没有空格。

特殊输入测试(字符串是个NULL指针、字符串是个空字符串、字符串只有一个空格字符、字符串中只有连续多个空格)。

  本题考点:

考查对字符串的编程能力。

考查分析时间效率的能力。我们要能清晰地分析出两种不同方法的时间效率各是多少。

考查对内存覆盖是否有高度的警惕。在分析得知字符串会变长之后,我们能够意识到潜在的问题,并主动和面试官沟通以寻找问题的解决方案。

考查思维能力。在从前到后替换的思路被面试官否定之后,我们能迅速想到从后往前替换的方法,这是解决此题的关键。

  相关题目:

有两个排序的数组A1和A2,内存在A1的末尾有足够多的空余空间容纳A2。请实现一个函数,把A2中的所有数字插入到A1中并且所有的数字是排序的。

和前面的例题一样,很多人首先想到的办法是在A1中从头到尾复制数字,但这样就会出现多次复制一个数字的情况。更好的办法是从尾到头比较A1和A2中的数字,并把较大的数字复制到A1的合适位置。

  举一反三:

合并两个数组(包括字符串)时,如果从前往后复制每个数字(或字符)需要重复移动数字(或字符)多次,那么我们可以考虑从后往前复制,这样就能减少移动的次数,从而提高效率。

 

本文选自《剑指Offer——名企面试官精讲典型编程题》一书

图书详细信息:http://blog.csdn.net/broadview2006/article/details/7043805

 

 

抱歉!评论已关闭.