026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记

本文主要是介绍026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 在 C# 中,内存中的所有字符串都是按 Unicode (UTF-16) 编码的。将数据从存储器移动到 string 对象中后,数据将自动转换为 UTF-16。如果数据仅包含从 0 到 127 的 ASCII 值,则此转换无需您执行任何额外的工作。但若源文本包含扩展的 ASCII 字节值(128 到 255),则默认情况下,将根据当前代码页解释扩展字符。若要指定应该根据其他某个代码页解释源文本,请使用 System.Text..::.Encoding 类,如下面的示例所示。

下面的示例演示如何转换按 8 位 ASCII 编码的文本文件

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading.Tasks;
//yngqq@2024年9月3日15:22:45
namespace ConsoleApp1
{class ANSIToUnicode{static void Main(){// Create a file that contains the Greek work ψυχή (psyche) when interpreted by using // code page 737 ((DOS) Greek). You can also create the file by using Character Map // to paste the characters into Microsoft Word and then "Save As" by using the DOS// (Greek) encoding. (Word will actually create a six-byte file by appending "\r\n" at the end.)//桌面自动生成一个txt文件,写入字节。string mypath = @"C:\Users\Administrator\Desktop\greek.txt";System.IO.File.WriteAllBytes(mypath, new byte[] { 0xAF, 0xAC, 0xAE, 0x9E });// Specify the code page to correctly interpret byte values//此外,对于一些常用的字符编码(如UTF-8、Unicode等),C#还提供了更直接的获取方式,如 Encoding.UTF8 或 Encoding.Unicode。然而,对于特定语言或地区的字符编码,如希腊语(代码页737),/则需要使用 GetEncoding 方法指定代码页编号来获取。Encoding encoding = Encoding.GetEncoding(737); //(DOS) Greek code page// Encoding encoding = Encoding.ASCII ;  //也可以用其他编码方式读取                                    string mypath1 = @"C:\Users\Administrator\Desktop\1.txt";//读取字节文件byte[] codePageValues = System.IO.File.ReadAllBytes(mypath);//byte[] codePageValues = System.IO.File.ReadAllBytes(mypath);// Same content is now encoded as UTF-16//用希腊编码737方式读取文本string unicodeValues = encoding.GetString(codePageValues);// Show that the text content is still intact in Unicode string// (Add a reference to System.Windows.Forms.dll)Console.WriteLine(unicodeValues);// Same content "ψυχή" is stored as UTF-8//转换编码后输出到1.txtSystem.IO.File.WriteAllText(mypath1, unicodeValues);// Conversion is complete. Show the bytes to prove the conversion. Console.WriteLine("8-bit encoding byte values:");foreach (byte b in codePageValues)Console.Write("{0:X}-", b);Console.WriteLine("\n");Console.WriteLine("Unicode values:");//需要在桌面建一个2.txt文件string mypath2 = @"C:\Users\Administrator\Desktop\2.txt";string mypath3 = @"C:\Users\Administrator\Desktop\3.txt";string mypath4 = @"C:\Users\Administrator\Desktop\4.txt";//读取桌面的已有文件2.txtstring unicodeString2 = System.IO.File.ReadAllText(mypath2);byte[] code4 = System.IO.File.ReadAllBytes(mypath2);string unicode4 = encoding.GetString(code4);System.IO.File.WriteAllText(mypath4, unicode4);System.Globalization.TextElementEnumerator enumerator =System.Globalization.StringInfo.GetTextElementEnumerator(unicodeString2);//另一种转换方法while (enumerator.MoveNext()){string s = enumerator.GetTextElement();//转换编码方式int i = Char.ConvertToUtf32(s, 0);Console.Write("{0:X}-", i);}Console.WriteLine();System.IO.File.WriteAllText(mypath3, unicodeValues);// Keep the console window open in debug mode.Console.Write("Press any key to exit.");Console.ReadKey();}}}

这篇关于026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1135545

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

2. c#从不同cs的文件调用函数

1.文件目录如下: 2. Program.cs文件的主函数如下 using System;using System.Collections.Generic;using System.Linq;using System.Threading.Tasks;using System.Windows.Forms;namespace datasAnalysis{internal static

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了