现在的位置: 首页 > 综合 > 正文

java 基于JDK中的源码总结下String二

2013年10月29日 ⁄ 综合 ⁄ 共 3253字 ⁄ 字号 评论关闭

        申明:转载请注明出处,如有商用目的请务必知会本人,感谢。

        上一篇文章:http://blog.csdn.net/ts1122/article/details/8738336,介绍了String一些易错内容。这里接着大体介绍下String类提供的API。大体就是不对API做一一介绍,只是根据类型说个大概,再选择一些经典的方法详细说明下。说明下,这两篇文章都是基于JDK1.7.0_17版本进行说明的,本文章后面的内容会说到JDK1.7版本String类的实现和JDK1.6版本还是很大不同的。
        先说构造方法,String类里面构造方法很多。由于方法签名只与方法名称以及参数类型有关系,这么多构造方法的差异就只能是传递的参数类型和数目。不过有的构造方法基本不会被用到,比如下面两个:

public String() {
   this.value = new char[0];
}
public String(String original) {
   this.value = original.value;
   this.hash = original.hash;
}

第一个构造方法之所以不用,说明文档里面写的很清楚:由于String是不可变的,当前方法的基本没用。这个方法给出了一个指向空字符串的引用,之后指向的内容又不能改变,所以没有什么用处。Java里面有些类叫做不可变类,其定义为:类中的每个方法都不能改变其对象。一般这种类中的数据域都有加final修饰,String类就是一个不可变类,其数据域就加了final字符修饰。上面的第二个方法之所以不用是因为会多分配一块内存,JVM会在当前线程的stringpool中分配一块内存,之后在堆中再分配一块内存。构造一个String,我们一般只要用String
= “abc”这种方式就足够了,而且简单高效,这种用法也是java推荐的。:-D
        下面是一组和String类数据域有关的方法:

public int length()
public boolean isEmpty()
public char charAt(int index)
public void getChars(int srcBegin, int srcEnd, char dst[], int dstBegin)

这三个方法都是基于String的数据域char value[]实现的,比如返回value.length。这些方法经常有用到,得记住。最后一个方法是将String中数据域内容拷贝到char数组方法,用System.arraycopy的本地方法实现,效率应该很高。
        接下来是一组String内容比较方法:

public boolean equals(Object anObject)
public boolean equalsIgnoreCase(String anotherString)
public boolean contentEquals(CharSequence cs)
public int compareTo(String anotherString)

第一个方法比较两个字符串对象内容是否完全相等,如果是就返回true。第二个方法从方法名称就可以理解,不考虑大小写进行比较。看了下第二个方法的内部实现,先把字符统一转成大写进行比较,如果不行再转成小写进行比较,看说明文档对于Georgian alphabet就有这种大写不成要用小写的特殊情况。:-(   第三个方法和前面两个方法基本一样,只不过参数类型不同。最后一个方法和C语言中的一样:取两个字符串较短的长度,从第一个字符开始对两个字符串进行比较,如果出现第一个不同的字符则返回两个字符之间的差值。结果返回是0的话就说明两个字符串内容相等。但是这个方法在java中很少用到。
        一组新的字符串内容比较方法:

public int indexOf(int ch)
public int indexOf(int ch, int fromIndex) 
public int lastIndexOf(int ch)
public boolean startsWith(String prefix) 
public boolean startsWith(String prefix, int toffset)
public boolean endsWith(String suffix)
public int indexOf(String str)
public int indexOf(String str, int fromIndex)
public int lastIndexOf(String str)

前面三个方法都是返回一个字符在当前字符串中的位置。后面一组方法是寻找一组字符串在当前字符串中的位置,和前面一组方法很相似。
        一组易被忽视会产生新的字符串对象的方法:

public String substring(int beginIndex)
public String substring(int beginIndex, int endIndex)
public String replace(char oldChar, char newChar)
public String toLowerCase()
public String toUpperCase()
public String trim()

这些都是对当前字符串内容进行截取,替换,大小写变更等操作的方法。由于String类是不可变类,这些方法不能改变对象内容,只能新分配内存保存操作结果,如果滥用这些方法会造成内存泄露的。
        这里根据public String substring(int beginIndex)说一下JDK1.6和JDK1.7String类的一些不同。JDK1.6上String类的数据域如下:

/** The value is used for character storage. */
private final char value[];

/** The offset is the first index of the storage that is used. */
private final int offset;

/** The count is the number of characters in the String. */
private final int count;

即其包含一个类似高中几何上向量的东西,给出内容同时还给出了一个起始点和长度的游标。JDK1.6中在实现substring最终会用到下面的方法:

// Package private constructor which shares value array for speed.
String(int offset, int count, char value[]) {
   this.value = value;
   this.offset = offset;
   this.count = count;
}

这就是说截取一段某一个字符串中的一段,实际上并没有分配新的内存,只是提供了一个新的向量,返回的引用仍然指向原来的字符串。如果原来的字符串不再使用,仅使用新的截取的字符串,个人认为就造成内存浪费。如果每次都是从一个很长很长字符串中截取一小段内容,就造成了内存的极大浪费,这也是JDK1.6使用过程中,关于字符串的一个优化点。再看JDK1.7中String类就只有char value[]一个数据域,方法substring就采取了新的做法,如下:  

 this.value = Arrays.copyOfRange(value, offset, offset+count);

这句代码完成这个方法实现主体,分配了新的内存,将需要的内容拷贝到新的内存中。看JDK文档中说明,1.6的这种做法是为了速度。:-D
       接下来就是valueOf方法,都是像    public static String valueOf(Object obj) 这样的类方法,这些方法的实现其实就是参数本身的toString方法的实现。最后就是split方法,这个涉及到了正则表达式,这里暂不介绍。:-D

抱歉!评论已关闭.