JDK1.7-String源码详解

2024-04-11 18:58
文章标签 源码 详解 string jdk1.7

本文主要是介绍JDK1.7-String源码详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

    String表示字符串,是char的有序集合,在java中所有的字符串值,都是String的实例。
    String类提供了很多方法,如获取字符串中的字符,比较字符串,查询字符等。
    Java给String的 + 操作提供了很好的支持,相加后会返回一个字符常量结果。

    String类是不可变(final)的,对String类的任何改变,都是返回一个新的String类对象。所以任何对String的修改操作 (如+) 都会重新创建一个String对象。如果想要动态地操作,可以自己来维护一个char数组,或者使用StringBuilder/StringBuffer。

    String是char的有序集合,体现在String内部就是char的数组,所以本质是在操作char。String内部维护着一个char数组,一切对String的操作都是对char数组的操作。因为String的不可变性,此处也要使用final来修饰。

private final char value[];  

 

    由上,String的构造函数就很容易理解了,可以传入一个char数组,或者传入一个String对象,然后把char数组值copy过去,更新size等值就可以了。
    这里的copy是有必要的,避免受到原引用的影响。

public String(char value[]) {int size = value.length;this.offset = 0;this.count = size;this.value = Arrays.copyOf(value, size);}
public String(String original) {int size = original.count;char[] originalValue = original.value;char[] v;if (originalValue.length > size) {    // 判断size范围int off = original.offset;v = Arrays.copyOfRange(originalValue, off, off + size);} else {v = originalValue;}this.offset = 0;this.count = size;this.value = v;}

 

Arrays.copyOf()最终会调用System.arraycopy(),后者是java的数组copy中最原始的方法,再底层就是本地方法了,所以只要是数组copy最好都用这个。
    在第二个构造函数,传String对象的时候,需要判断size和offset的关系,因为String的值不一定是整个char数组都是有效的,这里赋值只取有效部分。

 

offset


    在String中,使用offset属性来指定第一个有效的字符的位置,从这个开始到char数组的末尾都是有效地。从此处看出,String实际上是一个char数组中连续的字符串。 
    private final int offset;

 

    另外,使用count属性来保存有效char数组的长度,就是(value.size – offset)。很多地方校验String的长度,或者是否为空,都使用了这个属性。

    private final int count;public int length() {return count;}public boolean isEmpty() {return count == 0;}

     在一般情况下,offset都等于0,所以count = value.size。那么offset这个属性有什么意义呢?
    其实,offset可以用在String对象的复用上,有时候一些返回部分字串的方法,如substring()等,就可以通过修改offset属性,来获取源String的一部分,反正String对象是不可变的,所以不会交叉影响。
    不过在JDK的String上,还没有使用到这样的逻辑,涉及到修改String的都是重新创建一个新的对象,如下面的substring()。

    public String substring(int beginIndex, int endIndex) {if (beginIndex < 0) throw new StringIndexOutOfBoundsException(beginIndex);if (endIndex > count) throw new StringIndexOutOfBoundsException(endIndex);if (beginIndex > endIndex) throw new StringIndexOutOfBoundsException(endIndex - beginIndex);return ((beginIndex == 0) && (endIndex == count)) ? this : new String(offset + beginIndex, endIndex - beginIndex, value);}

    在截取String前,需要进行index范围的校验,如果超出范围会抛出异常。和js以及php等不用,这里不会自动去根据String的值来调整截取范围,这也是Java强类型的一个体现吧。


equals

    判断字符串是否相等,实际上是比较两个char数组:
1、判断是否同一个对象;
2、判断是否String对象;
3、循环其中的char数组,看元素和次序是否都相等。
    这里的相等是次序和元素的完全相等,和数组相等是同一个标准,可以参考Arrays.equals(),而和List的标准不一样,可以参考CollectionUtils.isEqualCollection()。
    同理,equalsIgnoreCase()也是同样的实现方式,只是比较字符的时候IgnoreCase。

public boolean equals(Object anObject) {if (this == anObject) {return true;}if (anObject instanceof String) {String anotherString = (String) anObject;int n = count;if (n == anotherString.count) {char v1[] = value;char v2[] = anotherString.value;int i = offset;int j = anotherString.offset;while (n-- != 0) {if (v1[i++] != v2[j++])return false;}return true;}}return false;}

    类似的,compareTo也是逐个比较字符的大小,这里顺序比较,只要找到不相等的元素,返回两者之差即可。这里比较的是两个字符的Unicode,所以两者的差为Unicode之差,如果相等,则返回0,大于返回>0,小于返回<0。
    这里的compareTo()是大小写敏感的,不敏感可以用compareToIgnoreCase(),实现原理大抵相同。

public int compareTo(String anotherString) {int len1 = count;int len2 = anotherString.count;int n = Math.min(len1, len2);    // 取最短的,此处只要找不等char v1[] = value;char v2[] = anotherString.value;int i = offset;int j = anotherString.offset;if (i == j) {int k = i;int lim = n + i;while (k < lim) {char c1 = v1[k];char c2 = v2[k];if (c1 != c2) {return c1 - c2;}k++;}} else {while (n-- != 0) {char c1 = v1[i++];char c2 = v2[j++];if (c1 != c2) {return c1 - c2;}}}return len1 - len2;}

 

indexof

    String中的indexof()是判断目标是否存在String中,并定位。
下面看看经典的定位字符串indexof(String str):
    在source[offset+fromIndex]到source[offset+count]中,寻找target [offset]至target [offset+count]的字串。
① 先找到first的位置(循环过滤不同)
② 然后再找到end的位置(循环过滤相同)
③ 判断end-first是否为target.len,相等即找到,返回first-offset;
否则循环①②③。

        static int indexOf(char[] source, int sourceOffset, int sourceCount,char[] target, int targetOffset, int targetCount, int fromIndex) {// 前面省略范围判断----------------------------------------char first = target[targetOffset];int max = sourceOffset + (sourceCount - targetCount);for (int i = sourceOffset + fromIndex; i <= max; i++) {/* Look for first character. */if (source[i] != first) while (++i <= max && source[i] != first){}/* Found first character, now look at the rest of v2 */if (i <= max) {int j = i + 1;int end = j + targetCount - 1;/* 循环,直到出现不同的字符 */for (int k = targetOffset + 1; j < end && source[j] == target[k]; j++, k++){}if (j == end) {return i - sourceOffset;    /* Found whole string. */}}}return -1;}

    校验String是否以prefix为开始,就是找出String前和prefix一样长度的字串,然后通过equals的逻辑来校验是否相等。

public boolean startsWith(String prefix) {return startsWith(prefix, 0);
}
public boolean startsWith(String prefix, int toffset) {char ta[] = value;int to = offset + toffset;char pa[] = prefix.value;int po = prefix.offset;int pc = prefix.count;// Note: toffset might be near -1>>>1.if ((toffset < 0) || (toffset > count - pc)) {return false;}while (--pc >= 0) {if (ta[to++] != pa[po++]) {return false;}}return true;
}
public boolean endsWith(String suffix) {return startsWith(suffix, count - suffix.count);
}

    另外,判断是否以suffix结尾,也是同样的一个逻辑,(count - suffix.count)截取和suffix一样长度的字串,然后判断equals。

 

replace

    replace()用于覆盖原来的字串,替换成新的。就是先找到源字符(串),然后再替换。
    这里先讨论字符替换的,比较简单,查找方便,替换的时候也不用重新创建char数组,因为长度不变。  而字符串的replace()是直接调用正则来匹配替换的,这里就不讨论了。

public String replace(char oldChar, char newChar) {if (oldChar != newChar) {int len = count;int i = -1;char[] val = value;       /* avoid getfield opcode */int off = offset;          /* avoid getfield opcode */while (++i < len)   if (val[off + i] == oldChar) break;if (i < len) {char buf[] = new char[len];for (int j = 0; j < i; j++) {buf[j] = val[off + j];}while (i < len) {char c = val[off + i];buf[i] = (c == oldChar) ? newChar : c;i++;}return new String(0, len, buf);}}return this;}

    如上,先找到oldChar的位置i,break掉,再把i前的字符放到新的数组中,把i处字符换成新的字符,最后再对i后的赋值。
    这里先找到oldChar再替换的方式,还可以用另外两种来处理: 1、全部的if相等就替换;2、先Arrays.copy()再替换。  
    而这里的优点在于:如果找不到oldChar,不用新建char[]和String
 

 

intern                        

    String私有地维护了一个初始时为空的字符串常量池。

    字符串常量是在编译期就加载到常量池了(相同的字符串指向同一个String对象),直接调用就可以了。而String.intern()可以自定义添加到字符串常量池中。

    具体可以参考我的《String字符常量池和intern()

 

    --文中的代码取自JDK1.7

这篇关于JDK1.7-String源码详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/894914

相关文章

十四、观察者模式与访问者模式详解

21.观察者模式 21.1.课程目标 1、 掌握观察者模式和访问者模式的应用场景。 2、 掌握观察者模式在具体业务场景中的应用。 3、 了解访问者模式的双分派。 4、 观察者模式和访问者模式的优、缺点。 21.2.内容定位 1、 有 Swing开发经验的人群更容易理解观察者模式。 2、 访问者模式被称为最复杂的设计模式。 21.3.观察者模式 观 察 者 模 式 ( Obser

【操作系统】信号Signal超详解|捕捉函数

🔥博客主页: 我要成为C++领域大神🎥系列专栏:【C++核心编程】 【计算机网络】 【Linux编程】 【操作系统】 ❤️感谢大家点赞👍收藏⭐评论✍️ 本博客致力于知识分享,与更多的人进行学习交流 ​ 如何触发信号 信号是Linux下的经典技术,一般操作系统利用信号杀死违规进程,典型进程干预手段,信号除了杀死进程外也可以挂起进程 kill -l 查看系统支持的信号

Jitter Injection详解

一、定义与作用 Jitter Injection,即抖动注入,是一种在通信系统中人为地添加抖动的技术。该技术通过在发送端对数据包进行延迟和抖动调整,以实现对整个通信系统的时延和抖动的控制。其主要作用包括: 改善传输质量:通过调整数据包的时延和抖动,可以有效地降低误码率,提高数据传输的可靠性。均衡网络负载:通过对不同的数据流进行不同程度的抖动注入,可以实现网络资源的合理分配,提高整体传输效率。增

springboot家政服务管理平台 LW +PPT+源码+讲解

3系统的可行性研究及需求分析 3.1可行性研究 3.1.1技术可行性分析 经过大学四年的学习,已经掌握了JAVA、Mysql数据库等方面的编程技巧和方法,对于这些技术该有的软硬件配置也是齐全的,能够满足开发的需要。 本家政服务管理平台采用的是Mysql作为数据库,可以绝对地保证用户数据的安全;可以与Mysql数据库进行无缝连接。 所以,家政服务管理平台在技术上是可以实施的。 3.1

Steam邮件推送内容有哪些?配置教程详解!

Steam邮件推送功能是否安全?如何个性化邮件推送内容? Steam作为全球最大的数字游戏分发平台之一,不仅提供了海量的游戏资源,还通过邮件推送为用户提供最新的游戏信息、促销活动和个性化推荐。AokSend将详细介绍Steam邮件推送的主要内容。 Steam邮件推送:促销优惠 每当平台举办大型促销活动,如夏季促销、冬季促销、黑色星期五等,用户都会收到邮件通知。这些邮件详细列出了打折游戏、

探索Elastic Search:强大的开源搜索引擎,详解及使用

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引入 全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选,相信大家多多少少的都听说过它。它可以快速地储存、搜索和分析海量数据。就连维基百科、Stack Overflow、

高仿精仿愤怒的小鸟android版游戏源码

这是一款很完美的高仿精仿愤怒的小鸟android版游戏源码,大家可以研究一下吧、 为了报复偷走鸟蛋的肥猪们,鸟儿以自己的身体为武器,仿佛炮弹一样去攻击肥猪们的堡垒。游戏是十分卡通的2D画面,看着愤怒的红色小鸟,奋不顾身的往绿色的肥猪的堡垒砸去,那种奇妙的感觉还真是令人感到很欢乐。而游戏的配乐同样充满了欢乐的感觉,轻松的节奏,欢快的风格。 源码下载

基于Java医院药品交易系统详细设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍:✌全网粉丝10W+,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码+数据库🌟 感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人  Java精品实战案例《600套》 2023-2025年最值得选择的Java毕业设计选题大全:1000个热

常用MQ消息中间件Kafka、ZeroMQ和RabbitMQ对比及RabbitMQ详解

1、概述   在现代的分布式系统和实时数据处理领域,消息中间件扮演着关键的角色,用于解决应用程序之间的通信和数据传递的挑战。在众多的消息中间件解决方案中,Kafka、ZeroMQ和RabbitMQ 是备受关注和广泛应用的代表性系统。它们各自具有独特的特点和优势,适用于不同的应用场景和需求。   Kafka 是一个高性能、可扩展的分布式消息队列系统,被设计用于处理大规模的数据流和实时数据传输。它

Linux中拷贝 cp命令中拷贝所有的写法详解

This text from: http://www.jb51.net/article/101641.htm 一、预备  cp就是拷贝,最简单的使用方式就是: cp oldfile newfile 但这样只能拷贝文件,不能拷贝目录,所以通常用: cp -r old/ new/ 那就会把old目录整个拷贝到new目录下。注意,不是把old目录里面的文件拷贝到new目录,