go gbk和utf8g互转(mahonia)和判断对应编码方法

2024-02-24 22:20

本文主要是介绍go gbk和utf8g互转(mahonia)和判断对应编码方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、导入库  github.com/axgle/mahonia

二、使用方式 

 

str :="我是中国人"
coderGbkToUtf8 := mahonia.NewDecoder("GBK") // GBK转成utf8编码
coderGbkToUtf8.ConvertString(str)coderUtf8ToGbk := mahonia.NewEncoder("GBK") // utf8转成GBK编码
coderUtf8ToGbk.ConvertString(src)

 三、判断字符串类型

1、判断是不是gbk

// 是不是gbk
func isGBK(str string) bool {data := []byte(str)dataLen := len(data)var i int = 0for i < dataLen {if data[i] <= 0x7f {//编码0~127,只有一个字节的编码,兼容ASCII码i++continue} else {if i+1 >= dataLen {return false}//大于127的使用双字节编码,落在gbk编码范围内的字符if data[i] >= 0x81 &&data[i] <= 0xfe &&data[i+1] >= 0x40 &&data[i+1] <= 0xfe &&data[i+1] != 0xf7 {i += 2continue} else {return false}}}return true
}

2、判断是不是Utf8 (没使用go自带的utf8判断,测试有些字符串判断有问题,如“系统”,“时装”,可能只是本人有问题)

// 是否utf8
func isUtf8(str string) bool {i := 0data := []byte(str)dataLen := len(data)for i < dataLen {if (data[i] & 0x80) == 0x00 {// 0XXX_XXXXi++continue} else if num := preNUm(data[i]); num > 2 {// 110X_XXXX 10XX_XXXX// 1110_XXXX 10XX_XXXX 10XX_XXXX// 1111_0XXX 10XX_XXXX 10XX_XXXX 10XX_XXXX// 1111_10XX 10XX_XXXX 10XX_XXXX 10XX_XXXX 10XX_XXXX// 1111_110X 10XX_XXXX 10XX_XXXX 10XX_XXXX 10XX_XXXX 10XX_XXXX// preNUm() 返回首个字节的8个bits中首个0bit前面1bit的个数,该数量也是该字符所使用的字节数i++for j := 0; j < num-1; j++ {//判断后面的 num - 1 个字节是不是都是10开头if i >= dataLen {return false}if (data[i] & 0xc0) != 0x80 {return false}i++}} else {//其他情况说明不是utf-8return false}}return true
}
func preNUm(data byte) int {var mask byte = 0x80var num int = 0//8bit中首个0bit前有多少个1bitsfor i := 0; i < 8; i++ {if (data & mask) == mask {num++mask = mask >> 1} else {break}}return num
}

 

这篇关于go gbk和utf8g互转(mahonia)和判断对应编码方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/743553

相关文章

Go标准库常见错误分析和解决办法

《Go标准库常见错误分析和解决办法》Go语言的标准库为开发者提供了丰富且高效的工具,涵盖了从网络编程到文件操作等各个方面,然而,标准库虽好,使用不当却可能适得其反,正所谓工欲善其事,必先利其器,本文将... 目录1. 使用了错误的time.Duration2. time.After导致的内存泄漏3. jsO

go中空接口的具体使用

《go中空接口的具体使用》空接口是一种特殊的接口类型,它不包含任何方法,本文主要介绍了go中空接口的具体使用,具有一定的参考价值,感兴趣的可以了解一下... 目录接口-空接口1. 什么是空接口?2. 如何使用空接口?第一,第二,第三,3. 空接口几个要注意的坑坑1:坑2:坑3:接口-空接口1. 什么是空接

利用Go语言开发文件操作工具轻松处理所有文件

《利用Go语言开发文件操作工具轻松处理所有文件》在后端开发中,文件操作是一个非常常见但又容易出错的场景,本文小编要向大家介绍一个强大的Go语言文件操作工具库,它能帮你轻松处理各种文件操作场景... 目录为什么需要这个工具?核心功能详解1. 文件/目录存javascript在性检查2. 批量创建目录3. 文件

Python实现PDF与多种图片格式之间互转(PNG, JPG, BMP, EMF, SVG)

《Python实现PDF与多种图片格式之间互转(PNG,JPG,BMP,EMF,SVG)》PDF和图片是我们日常生活和工作中常用的文件格式,有时候,我们可能需要将PDF和图片进行格式互转来满足... 目录一、介绍二、安装python库三、Python实现多种图片格式转PDF1、单张图片转换为PDF2、多张图

Go语言中最便捷的http请求包resty的使用详解

《Go语言中最便捷的http请求包resty的使用详解》go语言虽然自身就有net/http包,但是说实话用起来没那么好用,resty包是go语言中一个非常受欢迎的http请求处理包,下面我们一起来学... 目录安装一、一个简单的get二、带查询参数三、设置请求头、body四、设置表单数据五、处理响应六、超

pytorch+torchvision+python版本对应及环境安装

《pytorch+torchvision+python版本对应及环境安装》本文主要介绍了pytorch+torchvision+python版本对应及环境安装,安装过程中需要注意Numpy版本的降级,... 目录一、版本对应二、安装命令(pip)1. 版本2. 安装全过程3. 命令相关解释参考文章一、版本对

Golang基于内存的键值存储缓存库go-cache

《Golang基于内存的键值存储缓存库go-cache》go-cache是一个内存中的key:valuestore/cache库,适用于单机应用程序,本文主要介绍了Golang基于内存的键值存储缓存库... 目录文档安装方法示例1示例2使用注意点优点缺点go-cache 和 Redis 缓存对比1)功能特性

Go 1.23中Timer无buffer的实现方式详解

《Go1.23中Timer无buffer的实现方式详解》在Go1.23中,Timer的实现通常是通过time包提供的time.Timer类型来实现的,本文主要介绍了Go1.23中Timer无buff... 目录Timer 的基本实现无缓冲区的实现自定义无缓冲 Timer 实现更复杂的 Timer 实现总结在

Go使用pprof进行CPU,内存和阻塞情况分析

《Go使用pprof进行CPU,内存和阻塞情况分析》Go语言提供了强大的pprof工具,用于分析CPU、内存、Goroutine阻塞等性能问题,帮助开发者优化程序,提高运行效率,下面我们就来深入了解下... 目录1. pprof 介绍2. 快速上手:启用 pprof3. CPU Profiling:分析 C

C++实现回文串判断的两种高效方法

《C++实现回文串判断的两种高效方法》文章介绍了两种判断回文串的方法:解法一通过创建新字符串来处理,解法二在原字符串上直接筛选判断,两种方法都使用了双指针法,文中通过代码示例讲解的非常详细,需要的朋友... 目录一、问题描述示例二、解法一:将字母数字连接到新的 string思路代码实现代码解释复杂度分析三、