本文主要是介绍批量文件编码转换用python实现的utf8转gb2312,vscode设置特殊文件的默认打开编码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
批量文件编码转换用python实现的utf8转gb2312, 任意编码之间的相互转换都是可以的.改一下下面的参数即可
convert.py文件内容如下
import os
import glob
import chardet#检测文件编码类型
def detect_file_encoding(file_path):with open(file_path, 'rb') as f:data = f.read()result = chardet.detect(data)encoding = result['encoding']confidence = result['confidence']return encoding, confidencedef convert_encoding(file_path, from_encoding='utf-8', to_encoding='gb2312'): """ 将文件的编码从一种转换为另一种。 :param file_path: 文件的路径 :param from_encoding: 原始编码 :param to_encoding: 目标编码 """ try: #判断文件内容的编码类型,如果与to_encoding相同则不转换det_encoding, confidence=detect_file_encoding(file_path) if(det_encoding == to_encoding):print(f"{file_path} is already in {to_encoding} encoding")return# 读取文件内容 with open(file_path, 'r', encoding=from_encoding) as file: content = file.read() # 写入文件内容到新文件(先写入临时文件,然后替换原文件) temp_file_path = file_path + '.tmp' with open(temp_file_path, 'w', encoding=to_encoding, errors='ignore') as file: file.write(content) # 替换原文件 os.remove(file_path) os.rename(temp_file_path, file_path) print(f"Converted {file_path} from {from_encoding} to {to_encoding}") except Exception as e: print(f"Failed to convert {file_path}: {e}") if __name__ == "__main__": file_or_folder_to_convert = 'G:/demo/src/gb3l/' # 修改为你的文件夹路径或文件路径 from_encoding='utf-8'to_encoding ='gb2312'file_extensions=['.h','.c'] # 修改为你需要转换的文件类型#判断是文件还是文件夹if os.path.isfile(file_or_folder_to_convert): #转换单个文件convert_encoding(file_or_folder_to_convert) else:#转换文件夹下所有文件for root, dirs, files in os.walk(file_or_folder_to_convert): for file in files: #取文件扩展名file_extension = os.path.splitext(file)[1]if (file_extension in file_extensions): file_path = os.path.join(root, file) convert_encoding(file_path)
使用的时候只需要修改 代码中的这几个参数即可.
file_or_folder_to_convert = 'G:/demo/src/gb3l/' # 修改为你的文件夹路径 from_encoding='utf-8'to_encoding ='gb2312'file_extensions=['.h','.c'] # 修改为你需要转换的文件类型
使用前需要安装python 3.8以上.
然后使用下面的命令安装chardet 库
$> pip install chardet
使用方法, 如下
$> python convert.py
参数路径什么的, 直接在代码中改.这么简单的代码,是个程序员就会改. 主打一个简单易用.
vscode中指定某种类型的文件打开时的编码格式
按住ctrl+, 在弹出的设置中, 点击右上角的 这个打开json设置图标.
我的配置如下, .c和.h, 还有.v文件都改成了gb2312编码.
{"git.openRepositoryInParentFolders": "never","Codegeex.Privacy": true,"EIDE.ARM.INI.Path": "d:\\Keil_v5\\UV4\\UV4.exe","terminal.integrated.scrollback": 3000,"workbench.editorAssociations": {"*.c": "default"},"Codegeex.Comment.LanguagePreference": "中文","files.associations": {"*.v": "verilog","*.c": "c","*.h": "c"},"[c]": { "files.encoding": "gb2312" //设置c文件编码},"[verilog]": { "files.encoding": "gb2312" //设置verilog文件编码}
}
这篇关于批量文件编码转换用python实现的utf8转gb2312,vscode设置特殊文件的默认打开编码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!