Unicode也是一种字符编码方法,容纳65536个字符

2024-04-15 05:08

本文主要是介绍Unicode也是一种字符编码方法,容纳65536个字符,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Unicode也是一种字符编码方法,容纳65536个字符

标签:  css常用字体    css 常用字体    myeclipse常用字体  
转自:  http://blog.csdn.net/autumn20080101/article/details/8515256


Unicode也是一种字符编码方法,它占用两个字节(0000H—FFFFH,容纳65536个字符,这完全可以容纳全世界所有语言文字的编码。

中国人常用汉字单字个数有多少

     这个问题没有准确的答案,只能是在某个范围内的统计数字。国家有关机构作了统计,发布了有关文件。分为常用字表和次常用字表。大约是2500到7000之间。 
在社会生活中,不同的行业,部门,不同职业的人所需要的用字量是不同的,在学校教育的不同阶段,也需要规定不同量的识字标准。因此,汉字的字量标准就不能只有一个,而应该有不同的层次和类别。就用字来讲,首先应该区分常用字和通用字。 
按现在一般的理解, 常用字就是经常使用的,阅读报刊书籍必须掌握的字,但“经常使用”也只是个模糊的概念,因此在不同的历史时期,根据不同的需要,常用字的概念的内涵也时有变化,即使是同样的内涵,其所收字的数量也会不同。 
通用字的范围比常用字大,它是指一定时期出版印刷,辞书编撰和汉字信息处理所需要使用的汉字。现代汉语通用字则是指现代所需要使用的汉字,它不包括很生僻的,专门用于汉语的用字,也不包括专业用字。根据对文字资料的统计,从商朝到现代,一般使用的汉字数量没有显著的变化,可能一直在五六千左右。近年来指定的具有通用字表性质的汉字标准,基本上维持了这一数目。如《印刷通用汉字字形表》收字6196个,国家标准《信息交换用汉字编码字符表》收字6763个。根据近年来实际使用的情况,国家语委在1988年研制的《现代汉语通用字表》,收字7000个。

python--ASCII和UNICODE字符串的区别

标签: android chinese input   linux chinese input  
转自: http://wait_miracle.iteye.com/blog/2003206

import os print "Input your Chinese name:" s=raw_input("Press enter to be continued  "); print "Your name is  : " +s; l=len(s) print "Length of your Chinese name in asc codes is:"+str(l); a=unicode(s,"GBK") l=len(a) print "I'm sorry we should use unicode char!Characters number of your Chinese \ name in unicode is:"+str(l);

 

 

运行结果:

Input your Chinese name: Press enter to be continued  王二毛 Your name is  : 王二毛 Length of your Chinese name in asc codes is:6 I'm sorry we should use unicode char!Characters number of your Chinese name in unicode is:3





js URL编码方法的比较

标签: android 字符串编码   c#字符编码格式   ios 字符串编码  
转自: http://blog.csdn.net/phptripper/article/details/4293795

javascrīpt中存在几种对URL字符串进行编码的方法 :escape(),encodeURI(),以及encodeURIComponent()。这几种编码所起的作用各不相同。 

escape() 方法:

采用ISO Latin字符集对指定的字符串进行编码。所有的空格符、标点符号、特殊字符以及其他非ASCII字符都将被转化成%xx格式的字符编码(xx等于该字符在字符集表里面的编码的16进制数字)。比如,空格符对应的编码是%20。

不会被此方法编码的字符:@ * / +

encodeURI() 方法:

把URI字符串采用UTF-8编码格式转化成escape格式的字符串。

不会被此方法编码的字符:! @ # $& * ( ) = : / ; ? + '

encodeURIComponent() 方法:

把URI字符串采用UTF-8编码格式转化成escape格式的字符串。与encodeURI()相比,这个方法将对更多的字符进行编码,比如 / 等字符。所以如果字符串里面包含了URI的几个部分的话,不能用这个方法来进行编码,否则 / 字符被编码之后URL将显示错误。

不会被此方法编码的字符:! * ( ) '

因此,对于中文字符串来说,如果不希望把字符串编码格式转化成UTF-8格式的(比如原页面和目标页面的charset是一致的时候),只需要使用escape。如果你的页面是GB2312或者其他的编码,而接受参数的页面是UTF-8编码的,就要采用encodeURI或者encodeURIComponent。

另外,encodeURI/encodeURIComponent是在javascrīpt1.5之后引进的,escape则在javascrīpt1.0版本就有。

这篇关于Unicode也是一种字符编码方法,容纳65536个字符的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/904899

相关文章

一种改进的red5集群方案的应用、基于Red5服务器集群负载均衡调度算法研究

转自: 一种改进的red5集群方案的应用: http://wenku.baidu.com/link?url=jYQ1wNwHVBqJ-5XCYq0PRligp6Y5q6BYXyISUsF56My8DP8dc9CZ4pZvpPz1abxJn8fojMrL0IyfmMHStpvkotqC1RWlRMGnzVL1X4IPOa_  基于Red5服务器集群负载均衡调度算法研究 http://ww

string字符会调用new分配堆内存吗

gcc的string默认大小是32个字节,字符串小于等于15直接保存在栈上,超过之后才会使用new分配。

如何将一个文件里不包含某个字符的行输出到另一个文件?

第一种: grep -v 'string' filename > newfilenamegrep -v 'string' filename >> newfilename 第二种: sed -n '/string/!'p filename > newfilenamesed -n '/string/!'p filename >> newfilename

【Python 千题 —— 算法篇】字符统计

Python 千题持续更新中 …… 脑图地址 👉:⭐https://twilight-fanyi.gitee.io/mind-map/Python千题.html⭐ 题目背景 在编程中,对字符串的字符统计是一个常见任务。这在文本处理、数据分析、词频统计、自然语言处理等领域有广泛应用。无论是统计字母出现的频率,还是分析不同字符类型的数量,字符串字符统计都是非常有用的技术。 字符统

C语言进阶【1】--字符函数和字符串函数【1】

本章概述 字符分类函数字符转换函数strlen的使用和模拟实现strcpy的使用和模拟实现strcat的使用和模拟实现strcmp的使用和模拟实现彩蛋时刻!!! 字符分类函数 字符: 这个概念,我们在以前的文章中讲过了。我们键盘输入的信息都是字符。字符大体可以分为两类——单个字符,字符串。而单个字符又可以进行分类——字母字符,数字字符,特殊字符和不可见字符。进行思维图展示: 在日

centOS7.0设置默认进入字符界面

刚装的,带有x window桌面,每次都是进的桌面,想改成自动进命令行的。记得以前是修改 /etc/inittab 但是这个版本inittab里的内容不一样了没有id:x:initdefault这一行而且我手动加上也不管用,这个centos 7下 /etc/inittab 的内容 Targets systemd uses targets which serve a simil

一种快速生成CSV的方法

事情是这个样子的 在QQ群在聊把如何100万数据导出成CSV文件?会不会很慢? 俺回了一句“现在的机器性能好,没啥问题”。 然后大家开始谈论机器的配置了。哎,俺的机器配置有点差。 然后俺就进行了一个测试。 测试数据 数据定义         public struct Rec         {             public int v1;             publi

Python字符编码及应用

字符集概念 字符集就是一套文字符号及其编码的描述。从第一个计算机字符集ASCII开始,为了处理不同的文字,发明过几百种字符集,例如ASCII、USC、GBK、BIG5等,这些不同的字符集从收录到编码都各不相同。在编程中出现比较严重的问题是字符乱码。 几个概念 位:计算机的最小单位二进制中的一位,用二进制的0,1表示。 字节:八位组成一个字节。(位与字节有对应关系) 字符:我们肉眼可见的文字与符号。

如何判断一个数组中是否包含一个字符或字符串

第一种方法:遍历数组 String[] arr1 = {"1","2","3","4","6","7"}; for (int i = 0; i < arr1.length; i++) { if("5".equals(arr1[i])) { System.out.println("包含"); }else { System.out.println("不包含"); } } 第二种方法:先把数组

Oracle 数据库中 字符型字段 按数字排序

由于需要维护表里面的值,id主键是字符串型,保存的都是数字,每次都要看好久,才知道新增id,用哪个数字; 遇到了一个主键排序的问题。字符型的主键,保存的都是数字,数据导过来以后发现数据排序都是乱的,就想着按数字规则排序。 但发现to_number总是报错,就想着里面应该是有字符存在。后来使用了正则关系式,问题解决。 以下是正则关系式的两种用法,记录下来: 方法一: select * fr