python中各种常见文件的读写操作与类型转换详细指南

2025-04-20 16:50

本文主要是介绍python中各种常见文件的读写操作与类型转换详细指南,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《python中各种常见文件的读写操作与类型转换详细指南》这篇文章主要为大家详细介绍了python中各种常见文件(txt,xls,csv,sql,二进制文件)的读写操作与类型转换,感兴趣的小伙伴可以跟...

1.文件txt读写标准用法

1.1写入文件

要读取文件,首先得使用 open() 函数打开文件。

file = open(file_path, mode='r', encoding=None)

file_path:文件的路径,可以是绝对路径或者相对路径。

mode:文件打开模式,'r' 代表以只读模式打开文件,这是默认值,‘w’表示写入模式。

encoding:文件的编码格式,像 'utf-8'、'gbk' 等,默认值是 None。

下面写入文件的示例:

#写入文件,当open(file_name,'w')时清除文件内容写入新内容,当open(file_name,'a')时直接在文件结尾加入新内容
file_name = 'text.txt'
try:
    with open(file_name,'w',encoding='utf-8') as file:
        file.write("你好!我是老叶爱吃鱼")
        file.write("\n你好呀,老叶,很高兴认识你")
except Exception as e:
    print(f'出错{e}')

系统会判断时候会有text.txt文件,没有的话会创建文件,加入写入内容,示例如下

python中各种常见文件的读写操作与类型转换详细指南

1.2读取文件

下面是读取文件示例:

#读取文件
try:
    with open(file_name,'r',encoding='utf-8') as file:
        print(file.read())
except Exception as e:
    print(f'出错时输出{e}')
#打印出:你好!我是老叶爱吃鱼     你好呀,老叶,很高兴认识你

1.2.1 readline() 方法

readline() 方法每次读取文件的一行内容,返回一个字符串。

# 打开文件
file = open('example.txt', 'r', encoding='utf-8')
# android读取第一行
line = file.readline()
while line:
    print(line.strip())  # strip() 方法用于去除行尾的换行符
    line = file.readline()
# 关闭文件
file.close()

1.2.2 readlines() 方法

readlines() 方法会读取文件的所有行,并将每行内容作为一个元素存储在列表中返回。

# 打开文件
file = open('example.txt', 'r', encoding='utf-8')
# 读取所有行
lines = file.readlines()
for line in lines:
    print(line.strip())
# 关闭文件
file.close()

1.2.3 迭代文件对象

可以直接对文件对象进行迭代,每次迭代会返回文件的一行内容。

# 打开文件
file = open('example.txt', 'r', encoding='utf-8')
# 迭代文件对象
for line in file:
    print(line.strip())
# 关闭文件
file.close()

2. 二进制文件读取

若要读取二进制文件,需将 mode 参数设置为 'rb'。

# 以二进制只读模式打开文件
with open('example.jpg', 'rb') as file:
    # 读取文件全部内容
    content = file.read()
    # 可以对二进制数据进行处理,如保存到另一个文件
    with open('copy.jpg', 'wb') as copy_file:
        copy_file.write(content)

3. 大文件读取

对于大文件,不建议使用 read() 方法一次性读取全部内容,因为这可能会导致内存不足。可以采用逐行读取或者分块读取的方式。

3.1 逐行读取

# 逐行读取大文件
with open('large_file.twww.chinasem.cnxt', 'r', encoding='utf-8') as file:
    for line in file:
        # 处理每行内容
        print(line.strip())

3.2 分块读取

# 分块读取大文件
chunk_size = 1024  # 每次读取 1024 字节
with open('large_file.txt', 'r', encoding='utf-8') as file:
    while True:
        chunk = file.read(chunk_size)
        if not chunk:
            break
        # 处理每个数据块
        print(chunk)

4.Excel表格文件的读写

4.1读取excel

import xlrd
import xlwt
from datetime import date,datetime
 
 
# 打开文件
workbook = xlrd.open_workbook(r"D:\python_file\request_files\excelfile.xlsx", formatting_info=False)
# 获取所有的sheet
print("所有的工作表:",workbook.sheet_names())
sheet1 = workbook.sheet_names()[0]
 
# 根据sheet索引或者名称获取sheet内容
sheet1 = workbook.sheet_by_index(0)
sheet1 = workbook.sheet_by_name("Sheet1")
 
# 打印出所有合并的单元格
print(sheet1.merged_cells)
for (row,row_range,col,col_range) in sheet1.merged_cells:
    print(sheet1.cell_value(row,col))
 
# sheet1的名称、行数、列数
print("工作表名称:%s,行数:%d,列数:%d" % (sheet1.name, sheet1.nrows, sheet1.ncols))
 
# 获取整行和整列的值
row = sheet1.row_values(1)
col = sheet1.col_values(4)
print("第2行的值:%s" % row)
print("第5列的值:%s" % col)
 
# 获取单元格的内容
print("第一行第一列:%s" % sheet1.cell(0,0).value)
print("第一行第二列:%s" % sheet1.cell_value(0,1))
print("第一行第三列:%s" % sheet1.row(0)[2])
 
# 获取单元格内容的数据类型
# 类型 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
print("第二行第三列的数据类型:%s" % sheet1.cell(3,2).ctype)
 
# 判断ctype类型是否等于data,如果等于,则用时间格式处理
if sheet1.cell(3,2).ctype == 3:
    data_value = xlrd.xldate_as_tuple(sheet1.cell_value(3, 2),workbook.datemode)
    print(data_value)
    print(date(*data_value[:3]))
    print(date(*data_value[:3]).strftime("%Y\%m\%d"))

4.2 设置单元格样式

style = xlwt.XFStyle()    # 初始化样式
font = xlwt.Font()    # 为样式创建字体
font.name = name    # 设置字体名字对应系统内字体
font.bold = bold    # 是否加粗
font.color_index = 5    # 设置字体颜色
font.height = height    # 设置字体大小
 
# 设置边框的大小
borders = xlwt.Borders()
borders.left = 6
borders.right = 6
borders.top = 6
borders.bottom = 6
 
style.font = font    # 为样式设置字体
style.borders = borders
 
return style

4.3写入excel

writeexcel = xlwt.Workbook()    # 创建工作表
sheet1 = writeexcel.add_sheet(u"Sheet1", cell_overwrite_ok = True)    # 创建sheet
 
row0 = ["编号", "姓名", "性别", "年龄", "生日", "学历"]
num = [1, 2, 3, 4, 5, 6, 7, 8]
column0 = ["a1", "a2", "a3", "a4", "a5", "a6", "a7", "a8"]
education = ["小学", "初中", "高中", "大学"]
 
# 生成合并单元格
i,j = 1,0
while i < 2*len(education) and j < len(education):
    sheet1.write_merge(i, i+1, 5, 5, education[j], set_style("Arial", 200, True))
    i += 2
    j += 1
 
# 生成第一行
for i in range(0, 6):
    sheet1.write(0, i, row0[i])
 
# 生成前两列
for i in range(1, 9):
    sheet1.write(i, 0, i)
    sheet1.write(i, 1, "a1")
 
# 添加超链接
n = "HYperlINK"
sheet1.write_merge(9,9,0,5,xlwt.Formula(n + '("https://www.baidu.com")'))
 
# 保存文件
writeexcel.save("demo.xls")

5.cvs文件的读写操作

5.1读取cvs文件

# 读取 CSV 文件
def read_from_csv(file_path):
    try:
        with open(file_path, 'r', encoding='utf-8') as csvfile:
            reader = csv.reader(csvfile)
            print("读取到的 CSV 文件内容如下:")
            for row in reader:
                print(row)
    except FileNotFoundError:
        print(f"错误: 文件 {file_path} 未找到!")
    except Exception as e:
        print(f"读取文件时出错: {e}")
 

5.2写入cvs文件

# 写入 CSV 文件
def write_to_csv(file_path, data):
    try:
        with open(file_path, 'w', newline='', encoding='utf-8') as csvfile:
            writer = csv.writer(csvfile)
            # 写入表头
            writer.writjserow(['Name', 'Age', 'City'])
            # 写入数据行
            for row in data:
                writer.writerow(row)
        print(f"数据已成功写入 {file_path}")
    except Exception as e:
        print(f"写入文件时出错: {e}")

6.SQL文件读取

import SQLite3
import pandas as pd
 
# 连接到SQLite数据库
conn = sqlite3.connect('example.db')
 
# 读取数据库表
query = "SELECT * FROM table_name"
data = pd.read_sql(query, conn)
print(data.head())
 
# 关闭连接
conn.close()

7.cvs、xls、txt文件相互转换

一般情况下python只会对cvs文件进行数据处理,那么对于很多文件属于二进制文件不能直接处理,那么需要将二进制转为cvs文件后才能处理,如xls是二进制文件需要对xls文件转为cvs文件,操作数据后再转成xls文件即可

7.1xls文件转cvs文件

import pandas as pd
 
def xls_to_csv(xls_file_path, csv_file_path):
    try:
        df = pd.read_excel(xls_file_path)
        df.to_csv(csv_file_path, index=False)
        print(f"成功将 {xls_file_path} 转换为 {csv_file_path}")
    except Exception as e:
        print(f"转换过程中出现错误: {e}")
 
# 示例调用
xls_file = 'example.xls'
csv_file = 'example.csv'
xls_to_csv(xls_file, csv_file)

7.2cvs文件转xls文件

import pandas as pd
 
def csv_to_xls(csv_file_path, xls_file_pjavascriptath):
    try:
        df = pd.read_csv(csv_file_path)
        df.to_excel(xls_file_path, index=False)
        print(f"成功将 {csv_file_path} 转换为 {xls_file_path}")
    except Exception as e:
        print(f"转换过程中出现错误: {e}")
 
# 示例调用
csv_file = 'example.csv'
xls_file = 'example.xls'
csv_to_xls(csv_file, xls_file)

7.3txt文件转cvs文件

import pandas as pd
 
def txt_to_csv(txt_file_path, csv_file_path):
    try:
        # 假设 txt 文件以空格分隔,根据实际情况修改 sep 参数
        df = pd.read_csv(txt_file_path, sep=' ', header=None)
        df.to_csv(csv_file_path, index=False, header=False)
        print(f"成功将 {txt_file_path} 转换为 {csv_file_path}")
    except Exception as e:
        print(f"转换过程中出现错误: {e}")
 
# 示例调用
txt_file = 'example.txt'
csv_file = 'example.csv'
txt_to_csv(txt_file, csv_file)

7.4csv文件转txt文件

import pandas as pd
 
def csv_to_txt(csv_file_path, txt_file_path):
    try:
        df = pd.read_csv(csv_file_path)
        df.to_csv(txt_file_path, sep=' ', index=False, header=False)
        print(f"成功将 {csv_file_path} 转换为 {txt_file_path}")
    except Exception as e:
        print(f"转换过程中出现错误: {e}")
 
# 示例调用
csv_file = 'example.csv'
txt_file = 'example.txt'
csv_to_txt(csv_file, txt_file)

以上就是python中各种常见文件的读写操作与类型转换详细指南的详细内容,更多关于python文件读写与类型转换的资料请关注China编程(www.chinasem.cn)其它相关文章!

这篇关于python中各种常见文件的读写操作与类型转换详细指南的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1154300

相关文章

使用Python实现一个优雅的异步定时器

《使用Python实现一个优雅的异步定时器》在Python中实现定时器功能是一个常见需求,尤其是在需要周期性执行任务的场景下,本文给大家介绍了基于asyncio和threading模块,可扩展的异步定... 目录需求背景代码1. 单例事件循环的实现2. 事件循环的运行与关闭3. 定时器核心逻辑4. 启动与停

基于Python实现读取嵌套压缩包下文件的方法

《基于Python实现读取嵌套压缩包下文件的方法》工作中遇到的问题,需要用Python实现嵌套压缩包下文件读取,本文给大家介绍了详细的解决方法,并有相关的代码示例供大家参考,需要的朋友可以参考下... 目录思路完整代码代码优化思路打开外层zip压缩包并遍历文件:使用with zipfile.ZipFil

Python处理函数调用超时的四种方法

《Python处理函数调用超时的四种方法》在实际开发过程中,我们可能会遇到一些场景,需要对函数的执行时间进行限制,例如,当一个函数执行时间过长时,可能会导致程序卡顿、资源占用过高,因此,在某些情况下,... 目录前言func-timeout1. 安装 func-timeout2. 基本用法自定义进程subp

Python实现word文档内容智能提取以及合成

《Python实现word文档内容智能提取以及合成》这篇文章主要为大家详细介绍了如何使用Python实现从10个左右的docx文档中抽取内容,再调整语言风格后生成新的文档,感兴趣的小伙伴可以了解一下... 目录核心思路技术路径实现步骤阶段一:准备工作阶段二:内容提取 (python 脚本)阶段三:语言风格调

SpringBoot中配置Redis连接池的完整指南

《SpringBoot中配置Redis连接池的完整指南》这篇文章主要为大家详细介绍了SpringBoot中配置Redis连接池的完整指南,文中的示例代码讲解详细,具有一定的借鉴价值,感兴趣的小伙伴可以... 目录一、添加依赖二、配置 Redis 连接池三、测试 Redis 操作四、完整示例代码(一)pom.

Python结合PyWebView库打造跨平台桌面应用

《Python结合PyWebView库打造跨平台桌面应用》随着Web技术的发展,将HTML/CSS/JavaScript与Python结合构建桌面应用成为可能,本文将系统讲解如何使用PyWebView... 目录一、技术原理与优势分析1.1 架构原理1.2 核心优势二、开发环境搭建2.1 安装依赖2.2 验

Linux内核参数配置与验证详细指南

《Linux内核参数配置与验证详细指南》在Linux系统运维和性能优化中,内核参数(sysctl)的配置至关重要,本文主要来聊聊如何配置与验证这些Linux内核参数,希望对大家有一定的帮助... 目录1. 引言2. 内核参数的作用3. 如何设置内核参数3.1 临时设置(重启失效)3.2 永久设置(重启仍生效

QT进行CSV文件初始化与读写操作

《QT进行CSV文件初始化与读写操作》这篇文章主要为大家详细介绍了在QT环境中如何进行CSV文件的初始化、写入和读取操作,本文为大家整理了相关的操作的多种方法,希望对大家有所帮助... 目录前言一、CSV文件初始化二、CSV写入三、CSV读取四、QT 逐行读取csv文件五、Qt如何将数据保存成CSV文件前言

一文详解如何在Python中从字符串中提取部分内容

《一文详解如何在Python中从字符串中提取部分内容》:本文主要介绍如何在Python中从字符串中提取部分内容的相关资料,包括使用正则表达式、Pyparsing库、AST(抽象语法树)、字符串操作... 目录前言解决方案方法一:使用正则表达式方法二:使用 Pyparsing方法三:使用 AST方法四:使用字

Python列表去重的4种核心方法与实战指南详解

《Python列表去重的4种核心方法与实战指南详解》在Python开发中,处理列表数据时经常需要去除重复元素,本文将详细介绍4种最实用的列表去重方法,有需要的小伙伴可以根据自己的需要进行选择... 目录方法1:集合(set)去重法(最快速)方法2:顺序遍历法(保持顺序)方法3:副本删除法(原地修改)方法4: