本文主要是介绍[java基础揉碎]char类型储存到计算机的过程字符编码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
字符型存储到 计算机中,需要将字符对应的码值(整数)找出来,比如'a' 存储:'a'==>码值97==>二进制(1100001)==>存储 读取:二进制(1100001)=>97===>'a'=>显示
字符编码表介绍:
ASCIl(ASCIl编码表 一个字节 表示, 一个128个字符, 实际上一个字节有八位可以表示256个字符, 只用128个, 为什么没有用完是因为计算机是美国人造出的, 英文只有24个, 算上特殊子字符128个足够表示所有字符了)
ASClI码:上个世纪60年代,美国制定了一套字符编码(使用一个字节),对英语字符与二进制位之间的关系,做了统一规定。这被称为ASClI码。ASCI码一共规定 了128个字符的编码,只占用了一个字节的后面7位,最前面的1位统一规定为0。 特别提示:一个字节可以表示256个字符,ASCII码只用了 128个字符.
Unicode(Unicode编码表固定大小的编码使用两个字节来表示字符,字母和汉字统一都是占用两个字节, 这样浪费空间, 为什么有了ascll码还要有其他编码, 因为计算机其他国家也要用, 例如中国, 中国汉字特别多, 128个字符就远远不够, 256个也不够, 所以有了Unicode码, 它是ascll的扩展)
Unicode码:
1.好处:一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码,使用 Unicode 没有乱码的问题。
2.Unicode的缺点:一个英文字母和一个汉字都占用2个字节,这对于存储空间来说是浪费。
3.2的16次方是65536,所以最多编码是65536个字符。
4.编码0-127的字符是与ASCII的编码一样.比如'a'在ASCII码是Ox61,在unicode码是 ox0061,都对应97.因此 Unicode码兼容ASCII码.
utf-8(编码表, 相比于Uniode, 这个编码大小可变, 字母使用1个字节,汉字使用3个字节)
1.UTF-8是在互联网上使用最广的一种 Unicode 的实现方式(可以说是Unicode的改进)
2.UTF-8是一种变长的编码方式。它可以使用1-6个字节表示一个符号,根据不同的符号而变化字节长度。
3.使用大小可变的编码字母占1个字节,汉字占3个字节
gbk(可以表示汉字,而且范围广,字母使用1个字节,汉字2个字节, 但没有utf-8表示的汉字多)
gb2312(也可以表示汉字,但是范围gb2312<gbk)
big5(可以表示繁体中文,台湾,香港用的比较多)
这篇关于[java基础揉碎]char类型储存到计算机的过程字符编码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!