026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记

本文主要是介绍026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 在 C# 中,内存中的所有字符串都是按 Unicode (UTF-16) 编码的。将数据从存储器移动到 string 对象中后,数据将自动转换为 UTF-16。如果数据仅包含从 0 到 127 的 ASCII 值,则此转换无需您执行任何额外的工作。但若源文本包含扩展的 ASCII 字节值(128 到 255),则默认情况下,将根据当前代码页解释扩展字符。若要指定应该根据其他某个代码页解释源文本,请使用 System.Text..::.Encoding 类,如下面的示例所示。

下面的示例演示如何转换按 8 位 ASCII 编码的文本文件

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading.Tasks;
//yngqq@2024年9月3日15:22:45
namespace ConsoleApp1
{class ANSIToUnicode{static void Main(){// Create a file that contains the Greek work ψυχή (psyche) when interpreted by using // code page 737 ((DOS) Greek). You can also create the file by using Character Map // to paste the characters into Microsoft Word and then "Save As" by using the DOS// (Greek) encoding. (Word will actually create a six-byte file by appending "\r\n" at the end.)//桌面自动生成一个txt文件,写入字节。string mypath = @"C:\Users\Administrator\Desktop\greek.txt";System.IO.File.WriteAllBytes(mypath, new byte[] { 0xAF, 0xAC, 0xAE, 0x9E });// Specify the code page to correctly interpret byte values//此外,对于一些常用的字符编码(如UTF-8、Unicode等),C#还提供了更直接的获取方式,如 Encoding.UTF8 或 Encoding.Unicode。然而,对于特定语言或地区的字符编码,如希腊语(代码页737),/则需要使用 GetEncoding 方法指定代码页编号来获取。Encoding encoding = Encoding.GetEncoding(737); //(DOS) Greek code page// Encoding encoding = Encoding.ASCII ;  //也可以用其他编码方式读取                                    string mypath1 = @"C:\Users\Administrator\Desktop\1.txt";//读取字节文件byte[] codePageValues = System.IO.File.ReadAllBytes(mypath);//byte[] codePageValues = System.IO.File.ReadAllBytes(mypath);// Same content is now encoded as UTF-16//用希腊编码737方式读取文本string unicodeValues = encoding.GetString(codePageValues);// Show that the text content is still intact in Unicode string// (Add a reference to System.Windows.Forms.dll)Console.WriteLine(unicodeValues);// Same content "ψυχή" is stored as UTF-8//转换编码后输出到1.txtSystem.IO.File.WriteAllText(mypath1, unicodeValues);// Conversion is complete. Show the bytes to prove the conversion. Console.WriteLine("8-bit encoding byte values:");foreach (byte b in codePageValues)Console.Write("{0:X}-", b);Console.WriteLine("\n");Console.WriteLine("Unicode values:");//需要在桌面建一个2.txt文件string mypath2 = @"C:\Users\Administrator\Desktop\2.txt";string mypath3 = @"C:\Users\Administrator\Desktop\3.txt";string mypath4 = @"C:\Users\Administrator\Desktop\4.txt";//读取桌面的已有文件2.txtstring unicodeString2 = System.IO.File.ReadAllText(mypath2);byte[] code4 = System.IO.File.ReadAllBytes(mypath2);string unicode4 = encoding.GetString(code4);System.IO.File.WriteAllText(mypath4, unicode4);System.Globalization.TextElementEnumerator enumerator =System.Globalization.StringInfo.GetTextElementEnumerator(unicodeString2);//另一种转换方法while (enumerator.MoveNext()){string s = enumerator.GetTextElement();//转换编码方式int i = Char.ConvertToUtf32(s, 0);Console.Write("{0:X}-", i);}Console.WriteLine();System.IO.File.WriteAllText(mypath3, unicodeValues);// Keep the console window open in debug mode.Console.Write("Press any key to exit.");Console.ReadKey();}}}

这篇关于026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1135545

相关文章

golang获取当前时间、时间戳和时间字符串及它们之间的相互转换方法

《golang获取当前时间、时间戳和时间字符串及它们之间的相互转换方法》:本文主要介绍golang获取当前时间、时间戳和时间字符串及它们之间的相互转换,本文通过实例代码给大家介绍的非常详细,感兴趣... 目录1、获取当前时间2、获取当前时间戳3、获取当前时间的字符串格式4、它们之间的相互转化上篇文章给大家介

Python实现AVIF图片与其他图片格式间的批量转换

《Python实现AVIF图片与其他图片格式间的批量转换》这篇文章主要为大家详细介绍了如何使用Pillow库实现AVIF与其他格式的相互转换,即将AVIF转换为常见的格式,比如JPG或PNG,需要的小... 目录环境配置1.将单个 AVIF 图片转换为 JPG 和 PNG2.批量转换目录下所有 AVIF 图

Nginx中配置HTTP/2协议的详细指南

《Nginx中配置HTTP/2协议的详细指南》HTTP/2是HTTP协议的下一代版本,旨在提高性能、减少延迟并优化现代网络环境中的通信效率,本文将为大家介绍Nginx配置HTTP/2协议想详细步骤,需... 目录一、HTTP/2 协议概述1.HTTP/22. HTTP/2 的核心特性3. HTTP/2 的优

详解如何通过Python批量转换图片为PDF

《详解如何通过Python批量转换图片为PDF》:本文主要介绍如何基于Python+Tkinter开发的图片批量转PDF工具,可以支持批量添加图片,拖拽等操作,感兴趣的小伙伴可以参考一下... 目录1. 概述2. 功能亮点2.1 主要功能2.2 界面设计3. 使用指南3.1 运行环境3.2 使用步骤4. 核

在React中引入Tailwind CSS的完整指南

《在React中引入TailwindCSS的完整指南》在现代前端开发中,使用UI库可以显著提高开发效率,TailwindCSS是一个功能类优先的CSS框架,本文将详细介绍如何在Reac... 目录前言一、Tailwind css 简介二、创建 React 项目使用 Create React App 创建项目

SpringBoot3实现Gzip压缩优化的技术指南

《SpringBoot3实现Gzip压缩优化的技术指南》随着Web应用的用户量和数据量增加,网络带宽和页面加载速度逐渐成为瓶颈,为了减少数据传输量,提高用户体验,我们可以使用Gzip压缩HTTP响应,... 目录1、简述2、配置2.1 添加依赖2.2 配置 Gzip 压缩3、服务端应用4、前端应用4.1 N

使用Jackson进行JSON生成与解析的新手指南

《使用Jackson进行JSON生成与解析的新手指南》这篇文章主要为大家详细介绍了如何使用Jackson进行JSON生成与解析处理,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 核心依赖2. 基础用法2.1 对象转 jsON(序列化)2.2 JSON 转对象(反序列化)3.

揭秘Python Socket网络编程的7种硬核用法

《揭秘PythonSocket网络编程的7种硬核用法》Socket不仅能做聊天室,还能干一大堆硬核操作,这篇文章就带大家看看Python网络编程的7种超实用玩法,感兴趣的小伙伴可以跟随小编一起... 目录1.端口扫描器:探测开放端口2.简易 HTTP 服务器:10 秒搭个网页3.局域网游戏:多人联机对战4.

使用C#代码在PDF文档中添加、删除和替换图片

《使用C#代码在PDF文档中添加、删除和替换图片》在当今数字化文档处理场景中,动态操作PDF文档中的图像已成为企业级应用开发的核心需求之一,本文将介绍如何在.NET平台使用C#代码在PDF文档中添加、... 目录引言用C#添加图片到PDF文档用C#删除PDF文档中的图片用C#替换PDF文档中的图片引言在当

详解C#如何提取PDF文档中的图片

《详解C#如何提取PDF文档中的图片》提取图片可以将这些图像资源进行单独保存,方便后续在不同的项目中使用,下面我们就来看看如何使用C#通过代码从PDF文档中提取图片吧... 当 PDF 文件中包含有价值的图片,如艺术画作、设计素材、报告图表等,提取图片可以将这些图像资源进行单独保存,方便后续在不同的项目中使