026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记

本文主要是介绍026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 在 C# 中,内存中的所有字符串都是按 Unicode (UTF-16) 编码的。将数据从存储器移动到 string 对象中后,数据将自动转换为 UTF-16。如果数据仅包含从 0 到 127 的 ASCII 值,则此转换无需您执行任何额外的工作。但若源文本包含扩展的 ASCII 字节值(128 到 255),则默认情况下,将根据当前代码页解释扩展字符。若要指定应该根据其他某个代码页解释源文本,请使用 System.Text..::.Encoding 类,如下面的示例所示。

下面的示例演示如何转换按 8 位 ASCII 编码的文本文件

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading.Tasks;
//yngqq@2024年9月3日15:22:45
namespace ConsoleApp1
{class ANSIToUnicode{static void Main(){// Create a file that contains the Greek work ψυχή (psyche) when interpreted by using // code page 737 ((DOS) Greek). You can also create the file by using Character Map // to paste the characters into Microsoft Word and then "Save As" by using the DOS// (Greek) encoding. (Word will actually create a six-byte file by appending "\r\n" at the end.)//桌面自动生成一个txt文件,写入字节。string mypath = @"C:\Users\Administrator\Desktop\greek.txt";System.IO.File.WriteAllBytes(mypath, new byte[] { 0xAF, 0xAC, 0xAE, 0x9E });// Specify the code page to correctly interpret byte values//此外,对于一些常用的字符编码(如UTF-8、Unicode等),C#还提供了更直接的获取方式,如 Encoding.UTF8 或 Encoding.Unicode。然而,对于特定语言或地区的字符编码,如希腊语(代码页737),/则需要使用 GetEncoding 方法指定代码页编号来获取。Encoding encoding = Encoding.GetEncoding(737); //(DOS) Greek code page// Encoding encoding = Encoding.ASCII ;  //也可以用其他编码方式读取                                    string mypath1 = @"C:\Users\Administrator\Desktop\1.txt";//读取字节文件byte[] codePageValues = System.IO.File.ReadAllBytes(mypath);//byte[] codePageValues = System.IO.File.ReadAllBytes(mypath);// Same content is now encoded as UTF-16//用希腊编码737方式读取文本string unicodeValues = encoding.GetString(codePageValues);// Show that the text content is still intact in Unicode string// (Add a reference to System.Windows.Forms.dll)Console.WriteLine(unicodeValues);// Same content "ψυχή" is stored as UTF-8//转换编码后输出到1.txtSystem.IO.File.WriteAllText(mypath1, unicodeValues);// Conversion is complete. Show the bytes to prove the conversion. Console.WriteLine("8-bit encoding byte values:");foreach (byte b in codePageValues)Console.Write("{0:X}-", b);Console.WriteLine("\n");Console.WriteLine("Unicode values:");//需要在桌面建一个2.txt文件string mypath2 = @"C:\Users\Administrator\Desktop\2.txt";string mypath3 = @"C:\Users\Administrator\Desktop\3.txt";string mypath4 = @"C:\Users\Administrator\Desktop\4.txt";//读取桌面的已有文件2.txtstring unicodeString2 = System.IO.File.ReadAllText(mypath2);byte[] code4 = System.IO.File.ReadAllBytes(mypath2);string unicode4 = encoding.GetString(code4);System.IO.File.WriteAllText(mypath4, unicode4);System.Globalization.TextElementEnumerator enumerator =System.Globalization.StringInfo.GetTextElementEnumerator(unicodeString2);//另一种转换方法while (enumerator.MoveNext()){string s = enumerator.GetTextElement();//转换编码方式int i = Char.ConvertToUtf32(s, 0);Console.Write("{0:X}-", i);}Console.WriteLine();System.IO.File.WriteAllText(mypath3, unicodeValues);// Keep the console window open in debug mode.Console.Write("Press any key to exit.");Console.ReadKey();}}}

这篇关于026集——在旧式编码与 Unicode 之间转换(C# 编程指南)——C#学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1135545

相关文章

关于集合与数组转换实现方法

《关于集合与数组转换实现方法》:本文主要介绍关于集合与数组转换实现方法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、Arrays.asList()1.1、方法作用1.2、内部实现1.3、修改元素的影响1.4、注意事项2、list.toArray()2.1、方

深度解析Java项目中包和包之间的联系

《深度解析Java项目中包和包之间的联系》文章浏览阅读850次,点赞13次,收藏8次。本文详细介绍了Java分层架构中的几个关键包:DTO、Controller、Service和Mapper。_jav... 目录前言一、各大包1.DTO1.1、DTO的核心用途1.2. DTO与实体类(Entity)的区别1

Linux中SSH服务配置的全面指南

《Linux中SSH服务配置的全面指南》作为网络安全工程师,SSH(SecureShell)服务的安全配置是我们日常工作中不可忽视的重要环节,本文将从基础配置到高级安全加固,全面解析SSH服务的各项参... 目录概述基础配置详解端口与监听设置主机密钥配置认证机制强化禁用密码认证禁止root直接登录实现双因素

Go语言数据库编程GORM 的基本使用详解

《Go语言数据库编程GORM的基本使用详解》GORM是Go语言流行的ORM框架,封装database/sql,支持自动迁移、关联、事务等,提供CRUD、条件查询、钩子函数、日志等功能,简化数据库操作... 目录一、安装与初始化1. 安装 GORM 及数据库驱动2. 建立数据库连接二、定义模型结构体三、自动迁

深度解析Spring Boot拦截器Interceptor与过滤器Filter的区别与实战指南

《深度解析SpringBoot拦截器Interceptor与过滤器Filter的区别与实战指南》本文深度解析SpringBoot中拦截器与过滤器的区别,涵盖执行顺序、依赖关系、异常处理等核心差异,并... 目录Spring Boot拦截器(Interceptor)与过滤器(Filter)深度解析:区别、实现

MySQL追踪数据库表更新操作来源的全面指南

《MySQL追踪数据库表更新操作来源的全面指南》本文将以一个具体问题为例,如何监测哪个IP来源对数据库表statistics_test进行了UPDATE操作,文内探讨了多种方法,并提供了详细的代码... 目录引言1. 为什么需要监控数据库更新操作2. 方法1:启用数据库审计日志(1)mysql/mariad

SpringBoot开发中十大常见陷阱深度解析与避坑指南

《SpringBoot开发中十大常见陷阱深度解析与避坑指南》在SpringBoot的开发过程中,即使是经验丰富的开发者也难免会遇到各种棘手的问题,本文将针对SpringBoot开发中十大常见的“坑... 目录引言一、配置总出错?是不是同时用了.properties和.yml?二、换个位置配置就失效?搞清楚加

利用Python脚本实现批量将图片转换为WebP格式

《利用Python脚本实现批量将图片转换为WebP格式》Python语言的简洁语法和库支持使其成为图像处理的理想选择,本文将介绍如何利用Python实现批量将图片转换为WebP格式的脚本,WebP作为... 目录简介1. python在图像处理中的应用2. WebP格式的原理和优势2.1 WebP格式与传统

SpringBoot集成LiteFlow工作流引擎的完整指南

《SpringBoot集成LiteFlow工作流引擎的完整指南》LiteFlow作为一款国产轻量级规则引擎/流程引擎,以其零学习成本、高可扩展性和极致性能成为微服务架构下的理想选择,本文将详细讲解Sp... 目录一、LiteFlow核心优势二、SpringBoot集成实战三、高级特性应用1. 异步并行执行2

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O