JDK1.7-String源码详解

2024-04-11 18:58
文章标签 源码 详解 string jdk1.7

本文主要是介绍JDK1.7-String源码详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

    String表示字符串,是char的有序集合,在java中所有的字符串值,都是String的实例。
    String类提供了很多方法,如获取字符串中的字符,比较字符串,查询字符等。
    Java给String的 + 操作提供了很好的支持,相加后会返回一个字符常量结果。

    String类是不可变(final)的,对String类的任何改变,都是返回一个新的String类对象。所以任何对String的修改操作 (如+) 都会重新创建一个String对象。如果想要动态地操作,可以自己来维护一个char数组,或者使用StringBuilder/StringBuffer。

    String是char的有序集合,体现在String内部就是char的数组,所以本质是在操作char。String内部维护着一个char数组,一切对String的操作都是对char数组的操作。因为String的不可变性,此处也要使用final来修饰。

private final char value[];  

 

    由上,String的构造函数就很容易理解了,可以传入一个char数组,或者传入一个String对象,然后把char数组值copy过去,更新size等值就可以了。
    这里的copy是有必要的,避免受到原引用的影响。

public String(char value[]) {int size = value.length;this.offset = 0;this.count = size;this.value = Arrays.copyOf(value, size);}
public String(String original) {int size = original.count;char[] originalValue = original.value;char[] v;if (originalValue.length > size) {    // 判断size范围int off = original.offset;v = Arrays.copyOfRange(originalValue, off, off + size);} else {v = originalValue;}this.offset = 0;this.count = size;this.value = v;}

 

Arrays.copyOf()最终会调用System.arraycopy(),后者是java的数组copy中最原始的方法,再底层就是本地方法了,所以只要是数组copy最好都用这个。
    在第二个构造函数,传String对象的时候,需要判断size和offset的关系,因为String的值不一定是整个char数组都是有效的,这里赋值只取有效部分。

 

offset


    在String中,使用offset属性来指定第一个有效的字符的位置,从这个开始到char数组的末尾都是有效地。从此处看出,String实际上是一个char数组中连续的字符串。 
    private final int offset;

 

    另外,使用count属性来保存有效char数组的长度,就是(value.size – offset)。很多地方校验String的长度,或者是否为空,都使用了这个属性。

    private final int count;public int length() {return count;}public boolean isEmpty() {return count == 0;}

     在一般情况下,offset都等于0,所以count = value.size。那么offset这个属性有什么意义呢?
    其实,offset可以用在String对象的复用上,有时候一些返回部分字串的方法,如substring()等,就可以通过修改offset属性,来获取源String的一部分,反正String对象是不可变的,所以不会交叉影响。
    不过在JDK的String上,还没有使用到这样的逻辑,涉及到修改String的都是重新创建一个新的对象,如下面的substring()。

    public String substring(int beginIndex, int endIndex) {if (beginIndex < 0) throw new StringIndexOutOfBoundsException(beginIndex);if (endIndex > count) throw new StringIndexOutOfBoundsException(endIndex);if (beginIndex > endIndex) throw new StringIndexOutOfBoundsException(endIndex - beginIndex);return ((beginIndex == 0) && (endIndex == count)) ? this : new String(offset + beginIndex, endIndex - beginIndex, value);}

    在截取String前,需要进行index范围的校验,如果超出范围会抛出异常。和js以及php等不用,这里不会自动去根据String的值来调整截取范围,这也是Java强类型的一个体现吧。


equals

    判断字符串是否相等,实际上是比较两个char数组:
1、判断是否同一个对象;
2、判断是否String对象;
3、循环其中的char数组,看元素和次序是否都相等。
    这里的相等是次序和元素的完全相等,和数组相等是同一个标准,可以参考Arrays.equals(),而和List的标准不一样,可以参考CollectionUtils.isEqualCollection()。
    同理,equalsIgnoreCase()也是同样的实现方式,只是比较字符的时候IgnoreCase。

public boolean equals(Object anObject) {if (this == anObject) {return true;}if (anObject instanceof String) {String anotherString = (String) anObject;int n = count;if (n == anotherString.count) {char v1[] = value;char v2[] = anotherString.value;int i = offset;int j = anotherString.offset;while (n-- != 0) {if (v1[i++] != v2[j++])return false;}return true;}}return false;}

    类似的,compareTo也是逐个比较字符的大小,这里顺序比较,只要找到不相等的元素,返回两者之差即可。这里比较的是两个字符的Unicode,所以两者的差为Unicode之差,如果相等,则返回0,大于返回>0,小于返回<0。
    这里的compareTo()是大小写敏感的,不敏感可以用compareToIgnoreCase(),实现原理大抵相同。

public int compareTo(String anotherString) {int len1 = count;int len2 = anotherString.count;int n = Math.min(len1, len2);    // 取最短的,此处只要找不等char v1[] = value;char v2[] = anotherString.value;int i = offset;int j = anotherString.offset;if (i == j) {int k = i;int lim = n + i;while (k < lim) {char c1 = v1[k];char c2 = v2[k];if (c1 != c2) {return c1 - c2;}k++;}} else {while (n-- != 0) {char c1 = v1[i++];char c2 = v2[j++];if (c1 != c2) {return c1 - c2;}}}return len1 - len2;}

 

indexof

    String中的indexof()是判断目标是否存在String中,并定位。
下面看看经典的定位字符串indexof(String str):
    在source[offset+fromIndex]到source[offset+count]中,寻找target [offset]至target [offset+count]的字串。
① 先找到first的位置(循环过滤不同)
② 然后再找到end的位置(循环过滤相同)
③ 判断end-first是否为target.len,相等即找到,返回first-offset;
否则循环①②③。

        static int indexOf(char[] source, int sourceOffset, int sourceCount,char[] target, int targetOffset, int targetCount, int fromIndex) {// 前面省略范围判断----------------------------------------char first = target[targetOffset];int max = sourceOffset + (sourceCount - targetCount);for (int i = sourceOffset + fromIndex; i <= max; i++) {/* Look for first character. */if (source[i] != first) while (++i <= max && source[i] != first){}/* Found first character, now look at the rest of v2 */if (i <= max) {int j = i + 1;int end = j + targetCount - 1;/* 循环,直到出现不同的字符 */for (int k = targetOffset + 1; j < end && source[j] == target[k]; j++, k++){}if (j == end) {return i - sourceOffset;    /* Found whole string. */}}}return -1;}

    校验String是否以prefix为开始,就是找出String前和prefix一样长度的字串,然后通过equals的逻辑来校验是否相等。

public boolean startsWith(String prefix) {return startsWith(prefix, 0);
}
public boolean startsWith(String prefix, int toffset) {char ta[] = value;int to = offset + toffset;char pa[] = prefix.value;int po = prefix.offset;int pc = prefix.count;// Note: toffset might be near -1>>>1.if ((toffset < 0) || (toffset > count - pc)) {return false;}while (--pc >= 0) {if (ta[to++] != pa[po++]) {return false;}}return true;
}
public boolean endsWith(String suffix) {return startsWith(suffix, count - suffix.count);
}

    另外,判断是否以suffix结尾,也是同样的一个逻辑,(count - suffix.count)截取和suffix一样长度的字串,然后判断equals。

 

replace

    replace()用于覆盖原来的字串,替换成新的。就是先找到源字符(串),然后再替换。
    这里先讨论字符替换的,比较简单,查找方便,替换的时候也不用重新创建char数组,因为长度不变。  而字符串的replace()是直接调用正则来匹配替换的,这里就不讨论了。

public String replace(char oldChar, char newChar) {if (oldChar != newChar) {int len = count;int i = -1;char[] val = value;       /* avoid getfield opcode */int off = offset;          /* avoid getfield opcode */while (++i < len)   if (val[off + i] == oldChar) break;if (i < len) {char buf[] = new char[len];for (int j = 0; j < i; j++) {buf[j] = val[off + j];}while (i < len) {char c = val[off + i];buf[i] = (c == oldChar) ? newChar : c;i++;}return new String(0, len, buf);}}return this;}

    如上,先找到oldChar的位置i,break掉,再把i前的字符放到新的数组中,把i处字符换成新的字符,最后再对i后的赋值。
    这里先找到oldChar再替换的方式,还可以用另外两种来处理: 1、全部的if相等就替换;2、先Arrays.copy()再替换。  
    而这里的优点在于:如果找不到oldChar,不用新建char[]和String
 

 

intern                        

    String私有地维护了一个初始时为空的字符串常量池。

    字符串常量是在编译期就加载到常量池了(相同的字符串指向同一个String对象),直接调用就可以了。而String.intern()可以自定义添加到字符串常量池中。

    具体可以参考我的《String字符常量池和intern()

 

    --文中的代码取自JDK1.7

这篇关于JDK1.7-String源码详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/894914

相关文章

使用Python删除Excel中的行列和单元格示例详解

《使用Python删除Excel中的行列和单元格示例详解》在处理Excel数据时,删除不需要的行、列或单元格是一项常见且必要的操作,本文将使用Python脚本实现对Excel表格的高效自动化处理,感兴... 目录开发环境准备使用 python 删除 Excphpel 表格中的行删除特定行删除空白行删除含指定

MySQL中的LENGTH()函数用法详解与实例分析

《MySQL中的LENGTH()函数用法详解与实例分析》MySQLLENGTH()函数用于计算字符串的字节长度,区别于CHAR_LENGTH()的字符长度,适用于多字节字符集(如UTF-8)的数据验证... 目录1. LENGTH()函数的基本语法2. LENGTH()函数的返回值2.1 示例1:计算字符串

Spring Boot spring-boot-maven-plugin 参数配置详解(最新推荐)

《SpringBootspring-boot-maven-plugin参数配置详解(最新推荐)》文章介绍了SpringBootMaven插件的5个核心目标(repackage、run、start... 目录一 spring-boot-maven-plugin 插件的5个Goals二 应用场景1 重新打包应用

mybatis执行insert返回id实现详解

《mybatis执行insert返回id实现详解》MyBatis插入操作默认返回受影响行数,需通过useGeneratedKeys+keyProperty或selectKey获取主键ID,确保主键为自... 目录 两种方式获取自增 ID:1. ​​useGeneratedKeys+keyProperty(推

Python通用唯一标识符模块uuid使用案例详解

《Python通用唯一标识符模块uuid使用案例详解》Pythonuuid模块用于生成128位全局唯一标识符,支持UUID1-5版本,适用于分布式系统、数据库主键等场景,需注意隐私、碰撞概率及存储优... 目录简介核心功能1. UUID版本2. UUID属性3. 命名空间使用场景1. 生成唯一标识符2. 数

Linux系统性能检测命令详解

《Linux系统性能检测命令详解》本文介绍了Linux系统常用的监控命令(如top、vmstat、iostat、htop等)及其参数功能,涵盖进程状态、内存使用、磁盘I/O、系统负载等多维度资源监控,... 目录toppsuptimevmstatIOStatiotopslabtophtopdstatnmon

java使用protobuf-maven-plugin的插件编译proto文件详解

《java使用protobuf-maven-plugin的插件编译proto文件详解》:本文主要介绍java使用protobuf-maven-plugin的插件编译proto文件,具有很好的参考价... 目录protobuf文件作为数据传输和存储的协议主要介绍在Java使用maven编译proto文件的插件

Android ClassLoader加载机制详解

《AndroidClassLoader加载机制详解》Android的ClassLoader负责加载.dex文件,基于双亲委派模型,支持热修复和插件化,需注意类冲突、内存泄漏和兼容性问题,本文给大家介... 目录一、ClassLoader概述1.1 类加载的基本概念1.2 android与Java Class

Java中的数组与集合基本用法详解

《Java中的数组与集合基本用法详解》本文介绍了Java数组和集合框架的基础知识,数组部分涵盖了一维、二维及多维数组的声明、初始化、访问与遍历方法,以及Arrays类的常用操作,对Java数组与集合相... 目录一、Java数组基础1.1 数组结构概述1.2 一维数组1.2.1 声明与初始化1.2.2 访问

SpringBoot线程池配置使用示例详解

《SpringBoot线程池配置使用示例详解》SpringBoot集成@Async注解,支持线程池参数配置(核心数、队列容量、拒绝策略等)及生命周期管理,结合监控与任务装饰器,提升异步处理效率与系统... 目录一、核心特性二、添加依赖三、参数详解四、配置线程池五、应用实践代码说明拒绝策略(Rejected