[Forward].Net Discovery 系列之一--string从入门到精通(上)

2024-01-24 05:08

本文主要是介绍[Forward].Net Discovery 系列之一--string从入门到精通(上),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

string是一种很特殊的数据类型,它既是基元类型又是引用类型,在编译以及运行时,.Net都对它做了一些优化工作,正式这些优化工作有时会迷惑编程人员,使string看起来难以琢磨,这篇文章分上下两章,共四节,来讲讲关于string的陌生一面。
一.恒定的字符串
要想比较全面的了解stirng类型,首先要清楚.Net中的值类型与引用类型。在C#中,以下数据类型为值类型:
bool、byte、char、enum、sbyte以及数字类型(包括可空类型)
以下数据类型为引用类型:
class、interface、delegate、object、stirng
看到了吗,我们要讨论的stirng赫然其中。被声明为string型变量存放于堆中,是一个彻头彻尾的引用类型。
那么许多同学就会对如下代码产生有疑问了,难道string类型也会“牵一发而动全身”吗?让我们先来看看以下三行代码有何玄机:
string a = "str_1";
string b = a;
a = "str_2";

不要说无聊,这一点时必须讲清楚的!在以上代码中,第3行的“=”有一个隐藏的秘密:它的作用我们可以理解为新建,而不是对变量“a”的修改。以下是IL代码,可以说明这一点:
  .maxstack  1
   .locals init ([0] string a,
            [1] string b)
   IL_0000:  nop
   IL_0001:  ldstr      "str_1"
   IL_0006:  stloc.0
  IL_0007:  ldloc.0
  IL_0008:  stloc.1
  IL_0009:  ldstr      "str_2"
      IL_000e:  stloc.0  //以上2行对应 C#代码 a = "str_2";
   IL_0015:  ret
可以看出IL代码的第1、6行,由ldstr指令创建字符串"str_1",并将其关联到了变量“a”中;7、8行直接将堆栈顶部的值弹出并关联到变量 “b”中;9、10由ldstr创建字符串"str_2",关联在变量“a”中(并没有像我们想象的那样去修改变量a的旧值,而是产生了新的字符串);
在C#中,如果用new关键字实例化一个类,对应是由IL指令newobj来完成的;而创建一个字符串,则由ldstr指令完成,看到 ldstr指令,我们即可认为,IL希望创建一个新的字符串。(注意:是IL希望创建一个字符串,而最终是否创建,还要在运行时由字符串的驻留机制决定,这一点下面的章节会有介绍。)
所以,第三行C#代码 (a = "str_2";)的样子看起来是在修改变量a的旧值"str_1",但实际上是创建了一个新的字符串"str_2",然后将变量a的指针指向了"str_2"的内存地址,而"str_1"依然在内存中没有受到任何影响,所以变量b的值没有任何改变---这就是string的恒定性,同学们,一定要牢记这一点,在.Net中,string类型的对象一旦创建即不可修改!包括ToUpper、SubString、Trim等操作都会在内存中产生新的字符串。
本节重点回顾:由于stirng类型的恒定性,让同学友们经常误解,string虽属引用类型但经常表现出值的特性,这是由于不了解string的恒定性造成的,根本不是“值的特性”。例如:
string a = "str_1";
a = "str_2";
这样会在内存中创建"str_1"和"str_2"两个字符串,但只有"str_2"在被使用,"str_1"不会被修改或消失,这样就浪费了内存资源,这也是为什么在做大量字符串操作时,推荐使用StringBuilder的原因。
二..Net中字符串的驻留(重要)
在第一节中,我们讲了字符串的恒定性,该特性又为我们引出了字符串的另一个重要特性:字符串驻留。
从某些方面讲,正是字符串的恒定性,才造就了字符串的驻留机制,也为字符串的线程同步工作大开方便之门(同一个字符串对象可以在不同的应用程序域中被访问,所以驻留的字符串是进程级的,垃圾回收不能释放这些字符串对象,只有进程结束这些对象才被释放)。
我们用以下2行代码来说明字符串的驻留现象:
string a = "str_1";
string b = "str_1";
请各位同学友思考一下,这2行代码会在内存中产生了几个string对象?你可能会认为产生2个:由于声明了2个变量,程序第1行会在内存中产生"str_1"供变量a所引用;第2行会产生新的字符串"str_1"供变量b所引用,然而真的是这样吗?我们用ReferenceEquals这个方法来看一下变量a与b的内存引用地址:
string a = "str_1";
string b = "str_1";
Response.Write(ReferenceEquals(a,b));   //比较a与b是否来自同一内存引用
输出:True
哈,各位同学看到了吗,我们用ReferenceEquals方法比较a与b,虽然我们声明了2个变量,但它们竟然来自同一内存地址!这说明string b = "str_1";根本没有在内存中产生新的字符串。
这是因为,在.Net中处理字符串时,有一个很重要的机制,叫做字符串驻留机制。由于string是编程中用到的频率较高的一种类型,CLR对相同的字符串,只分配一次内存。CLR内部维护着一块特殊的数据结构,我们叫它字符串池,可以把它理解成是一个HashTable,这个HashTable维护着程序中用到的一部分字符串,HashTable的Key是字符串的值,而Value则是字符串的内存地址。一般情况下,程序中如果创建一个string类型的变量,CLR会首先在HashTable遍历具有相同Hash Code的字符串,如果找到,则直接把该字符串的地址返回给相应的变量,如果没有才会在内存中新建一个字符串对象。
所以,这2行代码只在内存中产生了1个string对象,变量b与a共享了内存中的"str_1"。
好了,结合第一节所讲到的字符串恒定性与第二节所讲到的驻留机制,来理解一下下面4行代码吧:
string a = "str_1"; //声明变量a,将变量a的指针指向内存中新产生的"str_1"的地址
a = "str_2";  //CLR先会在字符串池中遍历"str_2"是否已存在,如果没有,则新建"str_2",并修改变量a的指针,指向"str_2"内存地址,"str_1"保持不变。(字符串恒定)
string c = "str_2"; //CLR先会在字符串池中遍历"str_2"是否已存在,如果存在,则直接将变量c的指针指向"str_2"的地址。(字符串驻留)

那么如果是动态创建字符串呢?字符串还会不会有驻留现象呢?
我们分3种情况讲解动态创建字符串时,驻留机制的表现:

字符串常量连接
string a = “str_1” + “str_2”;
string b = “str_1str_2”;
Response.Write(ReferenceEquals(a,b));   //比较a与b是否来自同一内存引用
输出 :True
IL代码说明问题:
.maxstack  1
.locals init ([0] string a,
            [1] string b)
IL_0000:  nop
IL_0001:  ldstr      “str_1str_2”
IL_0006:  stloc.0
IL_0007:  ldstr      “str_1str_2”
IL_000c:  stloc.1
IL_000d:  ret
其中第1、6行对应c#代码string a = “str_1” + “str_2”;
第7、8对应c# string b = “str_1str_2”;
可以看出,字符串常量连接时,程序在被编译为IL代码前,编译器已经计算出了字符串常量连接的结果,ldstr指令直接处理编译器计算后的字符串值,所以这种情况字符串驻留机制有效!
字符串变量连接
string a = “str_1”;
string b = a + “str_2”;
string c = “str_1str_2”;
Response.Write(ReferenceEquals(b,c));
输出:False

IL代码说明问题:
   .maxstack  2
   .locals init ([0] string a,
            [1] string b,
           [2] string c)
IL_0000:  nop
  IL_0001:  ldstr      “str_1”
   IL_0006:  stloc.0
  IL_0007:  ldloc.0
   IL_0008:  ldstr      “str_2”
   IL_000d:  call       string [mscorlib]System.String::Concat(string,
                                                               string)
   IL_0012:  stloc.1
   IL_0013:  ldstr      “str_1str_2”
   IL_0018:  stloc.2
   IL_0019:  ret

其中第1、6行对应string a = “str_1”;
第7、8、9行对应string b = a + “str_2”;,IL用的是Concat方法连接字符串
第13、18行对应string c = “str_1str_2”;
可以看出,字符串变量连接时,IL使用Concat方法,在运行时生成最终的连接结 果,所以这种情况字符串驻留机制无效!
3.显式实例化

string a = "a";
string b = new string('a',1);
Response.Write(ReferenceEquals(a, b));

输出 False

IL代码:
   .maxstack  3
   .locals init ([0] string a,
            [1] string b)
   IL_0000:  nop
   IL_0001:  ldstr      "a"
   IL_0006:  stloc.0
   IL_0007:  ldc.i4.s   97
   IL_0009:  ldc.i4.1
   IL_000a:  newobj     instance void [mscorlib]System.String::.ctor (char,
                                                                    int32)
   IL_000f:  stloc.1
   IL_0010:  ret

这种情况比较好理解,IL使用newobj来实例化一个字符串对象,驻留机制无效。从string b = new string('a',1);这行代码我们可以看出,其实string类型实际上是由char[]实现的,一个string的诞生绝不像我们想想的那样简单,要由栈、堆同时配合,才会有一个string的诞生。这一点在第四节会有介绍。
当然,当字符串驻留机制无效时,我们可以很简便的使用string.Intern方法将其手动驻留至字符串池中,例如以下代码:
string a = "a";
string b = new string('a',1);
Response.Write(ReferenceEquals(a, string.Intern(b)));

输出:True 

程序返回Ture,说明变量"a"与"b"来自同一内存地址。

好了,下面两节将通过实例为大家展示string的内部秘密,大家可以通过它测试一下自己对string的了解程度,敬请期待!

这篇关于[Forward].Net Discovery 系列之一--string从入门到精通(上)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/638613

相关文章

IDEA如何将String类型转json格式

《IDEA如何将String类型转json格式》在Java中,字符串字面量中的转义字符会被自动转换,但通过网络获取的字符串可能不会自动转换,为了解决IDEA无法识别JSON字符串的问题,可以在本地对字... 目录问题描述问题原因解决方案总结问题描述最近做项目需要使用Ai生成json,可生成String类型

.NET利用C#字节流动态操作Excel文件

《.NET利用C#字节流动态操作Excel文件》在.NET开发中,通过字节流动态操作Excel文件提供了一种高效且灵活的方式处理数据,本文将演示如何在.NET平台使用C#通过字节流创建,读取,编辑及保... 目录用C#创建并保存Excel工作簿为字节流用C#通过字节流直接读取Excel文件数据用C#通过字节

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

数论入门整理(updating)

一、gcd lcm 基础中的基础,一般用来处理计算第一步什么的,分数化简之类。 LL gcd(LL a, LL b) { return b ? gcd(b, a % b) : a; } <pre name="code" class="cpp">LL lcm(LL a, LL b){LL c = gcd(a, b);return a / c * b;} 例题:

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

Java 创建图形用户界面(GUI)入门指南(Swing库 JFrame 类)概述

概述 基本概念 Java Swing 的架构 Java Swing 是一个为 Java 设计的 GUI 工具包,是 JAVA 基础类的一部分,基于 Java AWT 构建,提供了一系列轻量级、可定制的图形用户界面(GUI)组件。 与 AWT 相比,Swing 提供了许多比 AWT 更好的屏幕显示元素,更加灵活和可定制,具有更好的跨平台性能。 组件和容器 Java Swing 提供了许多

【IPV6从入门到起飞】5-1 IPV6+Home Assistant(搭建基本环境)

【IPV6从入门到起飞】5-1 IPV6+Home Assistant #搭建基本环境 1 背景2 docker下载 hass3 创建容器4 浏览器访问 hass5 手机APP远程访问hass6 更多玩法 1 背景 既然电脑可以IPV6入站,手机流量可以访问IPV6网络的服务,为什么不在电脑搭建Home Assistant(hass),来控制你的设备呢?@智能家居 @万物互联

如何在Visual Studio中调试.NET源码

今天偶然在看别人代码时,发现在他的代码里使用了Any判断List<T>是否为空。 我一般的做法是先判断是否为null,再判断Count。 看了一下Count的源码如下: 1 [__DynamicallyInvokable]2 public int Count3 {4 [__DynamicallyInvokable]5 get