简体中文GBK/繁体中文Big5的Codepage

2024-04-29 03:58

本文主要是介绍简体中文GBK/繁体中文Big5的Codepage,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

如何制作简体中文GBK/繁体中文Big5的Codepage?

 

  1. Unicode 组织取得GBK/Big5的Unicode的定义.

    由于GBK是基于ISO 10646-1:1993标准的,而相应的日文是JIS X 0221-1995,韩文是KS C 5700-1995,他们被提交到Unicode标准的时间表为:
    Unicode Version 1.0
    Unicode Version 1.1 <-> ISO 10646-1:1993, JIS X 0221-1995, GB 13000.1-93
    Unicode Version 2.0 <-> KS C 5700-1995

    从Windows 95开始均采用GBK编码. 您需要的是 CP936.TXTBIG5.TXT

  2. 然后使用下面的程序就可以将其转化为Linux核心需要的Unicode<->GBK码表
    ./genmap BIG5.txt | perl uni2big5.pl
    ./genmap CP936.txt | perl uni2gbk.pl
  3. 再修改fat/vfat/ntfs的相关函数就可以完成对核心的修改工作. 具体使用时可以使用下面的命令:

 

  • 简体中文: mount -t vfat /dev/hda1 /mnt/1 -o codepage=936,iocharset=cp936
  • 繁体中文: mount -t vfat /dev/hda1 /mnt/1 -o codepage=950,iocharset=cp936

    有趣的是,由于GBK包含了全部的GB2312/Big5/JIS的内码,所以使用936的Codepage也可以显示Big5的文件名.

这篇关于简体中文GBK/繁体中文Big5的Codepage的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/945061

相关文章

maven项目中程序运行编译的时候出现:编码GBK的不可映射字符

由于JDK是国际版的,我们在用javac.exe编译时,编译程序首先会获得我们操作系统默认采用的编码格式(也即在编译java程序时,若我们不指定源程序文件的编码格式,JDK首先获得操作系统的file.encoding参数(它保存的就是操作系统默认的编码格式,如WIN2k,它的值为GBK),然后JDK就把我们的java源程序从file.encoding编码格式转化为JAVA内部默认的UNICODE格

Android 打开 GBK项目如何设置成UTF-8

1.标题 今天打开一个eclipse老项目,编码格式为GBK,Android studio导入项目报错,本人想到一个方案就是批量修改文件格式从 GBK到 UTF-8,这样可以一键解决问题 2.开发脚本 使用前请备份代码   使用前请备份代码   使用前请备份代码 脚本代码如下,保存到文件下为 shell.ps1 # 获取当前脚本的所在目录$folderPath = Get-Loca

codepage 和 charset

codepage 和 charset codepage:简单地说,这是程序用于对字符进行编码的一个表。代码页是服务器的事情。 常见的三种codepage 简体中文 : 936繁体中文 : 950UTF-8 : 65001 如果你不想用默认的UTF-8,可以修改该设置 直接在页面中修改 <%@ Page Language="C#" AutoEventWireup="true" CodeB

utf-8、gbk、unicode相互转码的几种方式

utf-8、gbk、unicode相互转码的几种方式 以下代码是java对于常见编码方式进行相互转换的,主要是gbk和utf-8互转,gbk与uncode互转,utf-8与unicode互转。 package com.encoding.util;import java.io.UnsupportedEncodingException;import java.lang.Characte

在Mysql数据库中执行函数报错: Illegal mix of collations (gbk_chinese_ci,IMPLICIT) and (utf8_general_ci,COERCIBLE

SQLSTATE[HY000]: General error: 1267 Illegal mix of collations (utf8_general_ci,IMPLICIT) and (gb2312_chinese_ci,COERCIBLE) for operation ‘=’ 在操作MySQL数据库时,报“ error code [1267]; 在Mysql数据库中执行函数报错: Illeg

使用python按拼音归类GBK编码表中的所有汉字

按拼音归类GBK编码表中的所有汉字,每个拼音对应的第一个汉字前面用左大括号,每一个拼音的最后一个汉字后面用右大括号,并保存到txt文本中,并统计包含了多少汉字 安装必要的库 确保安装 pypinyin 库用于拼音转换: pip install pypinyin 代码 import collectionsimport pypinyin# 生成 GBK 编码中的所有汉字gbk_char

Python实现文件(xml,txt)编码转换GB2312、GBK、UTF-8

Python实现文件编码转换GB2312、GBK、UTF-8 1、查看文件编码格式 import chardetfilename = './flash.c'with open(filename, 'rb') as f:data = f.read()encoding_type = chardet.detect(data)print(encoding_type) 运行结果: 2、文件编码

javac编译错误: 编码UTF8/GBK的不可映射字符

本文出处: http://blog.csdn.net/leytton/article/details/52740171 Linux下为UTF-8编码,javac编译gbk编码的java文件时,容易出现“错误: 编码UTF8的不可映射字符” 解决方法是添加encoding 参数:javac -encoding gbk WordCount.java Windows下为G

《幽林怪谈》手机修复版 简体中文 一键安装 免费下载分享

《幽林怪谈》手机修复版 简体中文 一键安装 免费下载分享 《幽林怪谈》是一款2D横版动作手机游戏,融合了中国古代神话传说和春秋战国历史,加入了超现实主义的科幻元素。游戏的故事背景设定在战国初期,讲述了齐国权臣田和的阴谋导致齐康公薨逝,王姬季姜被诬陷流放,而她的姐姐叔姜被囚禁,姜氏家族因此覆灭,这段历史被称为“田氏代齐”。季姜背负着国仇家恨,在这个纷乱的世界中寻求正义,虽然屡遭挫败,但也逐渐认识

iOS_技巧(4)_转码(UTF-8 /GBK/Unicode/GBK2312)

一丶 UTF-8 /GBK UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。 GBK全称《汉字内码扩展规范