Unicode也是一种字符编码方法,容纳65536个字符

2024-04-15 05:08

本文主要是介绍Unicode也是一种字符编码方法,容纳65536个字符,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Unicode也是一种字符编码方法,容纳65536个字符

标签:  css常用字体    css 常用字体    myeclipse常用字体  
转自:  http://blog.csdn.net/autumn20080101/article/details/8515256


Unicode也是一种字符编码方法,它占用两个字节(0000H—FFFFH,容纳65536个字符,这完全可以容纳全世界所有语言文字的编码。

中国人常用汉字单字个数有多少

     这个问题没有准确的答案,只能是在某个范围内的统计数字。国家有关机构作了统计,发布了有关文件。分为常用字表和次常用字表。大约是2500到7000之间。 
在社会生活中,不同的行业,部门,不同职业的人所需要的用字量是不同的,在学校教育的不同阶段,也需要规定不同量的识字标准。因此,汉字的字量标准就不能只有一个,而应该有不同的层次和类别。就用字来讲,首先应该区分常用字和通用字。 
按现在一般的理解, 常用字就是经常使用的,阅读报刊书籍必须掌握的字,但“经常使用”也只是个模糊的概念,因此在不同的历史时期,根据不同的需要,常用字的概念的内涵也时有变化,即使是同样的内涵,其所收字的数量也会不同。 
通用字的范围比常用字大,它是指一定时期出版印刷,辞书编撰和汉字信息处理所需要使用的汉字。现代汉语通用字则是指现代所需要使用的汉字,它不包括很生僻的,专门用于汉语的用字,也不包括专业用字。根据对文字资料的统计,从商朝到现代,一般使用的汉字数量没有显著的变化,可能一直在五六千左右。近年来指定的具有通用字表性质的汉字标准,基本上维持了这一数目。如《印刷通用汉字字形表》收字6196个,国家标准《信息交换用汉字编码字符表》收字6763个。根据近年来实际使用的情况,国家语委在1988年研制的《现代汉语通用字表》,收字7000个。

python--ASCII和UNICODE字符串的区别

标签: android chinese input   linux chinese input  
转自: http://wait_miracle.iteye.com/blog/2003206

import os print "Input your Chinese name:" s=raw_input("Press enter to be continued  "); print "Your name is  : " +s; l=len(s) print "Length of your Chinese name in asc codes is:"+str(l); a=unicode(s,"GBK") l=len(a) print "I'm sorry we should use unicode char!Characters number of your Chinese \ name in unicode is:"+str(l);

 

 

运行结果:

Input your Chinese name: Press enter to be continued  王二毛 Your name is  : 王二毛 Length of your Chinese name in asc codes is:6 I'm sorry we should use unicode char!Characters number of your Chinese name in unicode is:3





js URL编码方法的比较

标签: android 字符串编码   c#字符编码格式   ios 字符串编码  
转自: http://blog.csdn.net/phptripper/article/details/4293795

javascrīpt中存在几种对URL字符串进行编码的方法 :escape(),encodeURI(),以及encodeURIComponent()。这几种编码所起的作用各不相同。 

escape() 方法:

采用ISO Latin字符集对指定的字符串进行编码。所有的空格符、标点符号、特殊字符以及其他非ASCII字符都将被转化成%xx格式的字符编码(xx等于该字符在字符集表里面的编码的16进制数字)。比如,空格符对应的编码是%20。

不会被此方法编码的字符:@ * / +

encodeURI() 方法:

把URI字符串采用UTF-8编码格式转化成escape格式的字符串。

不会被此方法编码的字符:! @ # $& * ( ) = : / ; ? + '

encodeURIComponent() 方法:

把URI字符串采用UTF-8编码格式转化成escape格式的字符串。与encodeURI()相比,这个方法将对更多的字符进行编码,比如 / 等字符。所以如果字符串里面包含了URI的几个部分的话,不能用这个方法来进行编码,否则 / 字符被编码之后URL将显示错误。

不会被此方法编码的字符:! * ( ) '

因此,对于中文字符串来说,如果不希望把字符串编码格式转化成UTF-8格式的(比如原页面和目标页面的charset是一致的时候),只需要使用escape。如果你的页面是GB2312或者其他的编码,而接受参数的页面是UTF-8编码的,就要采用encodeURI或者encodeURIComponent。

另外,encodeURI/encodeURIComponent是在javascrīpt1.5之后引进的,escape则在javascrīpt1.0版本就有。

这篇关于Unicode也是一种字符编码方法,容纳65536个字符的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/904899

相关文章

C#如何去掉文件夹或文件名非法字符

《C#如何去掉文件夹或文件名非法字符》:本文主要介绍C#如何去掉文件夹或文件名非法字符的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C#去掉文件夹或文件名非法字符net类库提供了非法字符的数组这里还有个小窍门总结C#去掉文件夹或文件名非法字符实现有输入字

idea报错java: 非法字符: ‘\ufeff‘的解决步骤以及说明

《idea报错java:非法字符:‘ufeff‘的解决步骤以及说明》:本文主要介绍idea报错java:非法字符:ufeff的解决步骤以及说明,文章详细解释了为什么在Java中会出现uf... 目录BOM是什么?1. BOM的作用2. 为什么会出现 \ufeff 错误?3. 如何解决 \ufeff 问题?最

使用Java编写一个字符脱敏工具类

《使用Java编写一个字符脱敏工具类》这篇文章主要为大家详细介绍了如何使用Java编写一个字符脱敏工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、字符脱敏工具类2、测试工具类3、测试结果1、字符脱敏工具类import lombok.extern.slf4j.Slf4j

解决IDEA报错:编码GBK的不可映射字符问题

《解决IDEA报错:编码GBK的不可映射字符问题》:本文主要介绍解决IDEA报错:编码GBK的不可映射字符问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录IDEA报错:编码GBK的不可映射字符终端软件问题描述原因分析解决方案方法1:将命令改为方法2:右下jav

C语言字符函数和字符串函数示例详解

《C语言字符函数和字符串函数示例详解》本文详细介绍了C语言中字符分类函数、字符转换函数及字符串操作函数的使用方法,并通过示例代码展示了如何实现这些功能,通过这些内容,读者可以深入理解并掌握C语言中的字... 目录一、字符分类函数二、字符转换函数三、strlen的使用和模拟实现3.1strlen函数3.2st

C# string转unicode字符的实现

《C#string转unicode字符的实现》本文主要介绍了C#string转unicode字符的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随... 目录1. 获取字符串中每个字符的 Unicode 值示例代码:输出:2. 将 Unicode 值格式化

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

Go语言使用Buffer实现高性能处理字节和字符

《Go语言使用Buffer实现高性能处理字节和字符》在Go中,bytes.Buffer是一个非常高效的类型,用于处理字节数据的读写操作,本文将详细介绍一下如何使用Buffer实现高性能处理字节和... 目录1. bytes.Buffer 的基本用法1.1. 创建和初始化 Buffer1.2. 使用 Writ

一种改进的red5集群方案的应用、基于Red5服务器集群负载均衡调度算法研究

转自: 一种改进的red5集群方案的应用: http://wenku.baidu.com/link?url=jYQ1wNwHVBqJ-5XCYq0PRligp6Y5q6BYXyISUsF56My8DP8dc9CZ4pZvpPz1abxJn8fojMrL0IyfmMHStpvkotqC1RWlRMGnzVL1X4IPOa_  基于Red5服务器集群负载均衡调度算法研究 http://ww

string字符会调用new分配堆内存吗

gcc的string默认大小是32个字节,字符串小于等于15直接保存在栈上,超过之后才会使用new分配。