python-文件操作,文件指针,buffering:缓冲区,编码描述符及其读写,以及上下文管理.一站式详解

本文主要是介绍python-文件操作,文件指针,buffering:缓冲区,编码描述符及其读写,以及上下文管理.一站式详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录标题

  • 冯诺依曼体系架构
  • 文件IO常用操作
  • 打开操作
    • open的参数
      • r模式
      • w模式:**没有文件**-进行创建;**有文件**-进行覆盖
      • x模式:**有文件**-直接抛异常;**没有文件**-创建,只写打开
      • a模式:**有文件**-只写打开,进行追加;**没有文件**-创建
      • rb模式:只读二进制
      • wb模式-只写二进制
      • - r+/w+增加缺失能力
  • 文件指针,指向当前字节位置
    • seek偏移的是字符还是字节?
    • 文本模式下
    • 二进制模式下
  • buffering:缓存区
    • 简介
    • 缓冲和缓存的区别?
      • 缓冲数据结构:
      • 缓存数据结构:
      • 缓冲的目的是:
      • 缓存的目的是:
    • open()方法的buffering参数设置
  • 参数编码描述符encoding
    • encoding:编码,仅文本模式使用
    • 其他参数
      • errors
      • newline
  • read
  • 行读取
    • readline(size=-1)
    • readlines()
    • 注意事项
  • write写入
  • close
  • 其他(返回类型都是布尔值)
  • 上下文管理
    • 引子
    • 为了解决上述问题这里就需要使用"上下文管理"格式:
    • 使用上下注意事项:
  • 练习:指定一个源文件,事项copy到目录
  • 练习:有一个文件,对其进行单词统计,不区分大小写,计算单词重复最多的10个单词

冯诺依曼体系架构

在这里插入图片描述
一般说IO操作,指的是文件IO,如果指的是网络IO,都会直接说网络IO

文件IO常用操作

文件操作无非就是读和写

open 打开
在这里插入图片描述
read 读取
write 写入
close 关闭
readline 行读取
readlines 多行读取
seek 文件指针操作
tell 指针位置

打开操作

f = open("test") # 返回的是文件对象 file object
print(f.read())
f.close() # 用完就关闭

open的参数

file:
打开或者要创建的文件名.如果不指定,默认是当前路径
mode模式:
在这里插入图片描述

r模式

f = open("test","r") # 只读
f.read()
f.write("abc") # 抛出错误
f.close()

w模式:没有文件-进行创建;有文件-进行覆盖

f = open("test","w") # 只写 
f.write("abc")
f.close()

x模式:有文件-直接抛异常;没有文件-创建,只写打开

f = open("test2","x")

运行结果
在这里插入图片描述

a模式:有文件-只写打开,进行追加;没有文件-创建

f = open("test","a")
f.write("abc")

rb模式:只读二进制

f = open("test","rb")
print(f.read())
f.close()

运行结果
在这里插入图片描述

wb模式-只写二进制

f = open("test","wb")
f.write("啊".encode(encoding="gbk")) # 把中文转化bytes用encode()
f.close()

- r+/w+增加缺失能力

f = open("test1","r+")

运行结果
在这里插入图片描述
可以观察到,r+增加缺失能力,但是没有改变r的特性,r的特性是要求文件必须存在,才能打开成功.

文件指针,指向当前字节位置

mode = r,指针起始在0
mode = a,指针起始在末尾

f.tell()显示指针当前位置
f.seek(offset[,whence])移动文件指针位置.offest偏移多少字节,whence从哪里开始

seek偏移的是字符还是字节?

seek偏移的是字节

文本模式下

whence 0 缺失值,表示从头开始,正数
whence 1 表示从当前位置,offset只能用0
whence 2 表示从末尾,offset只能用0

二进制模式下

whence 0 缺失值,表示从头开始,offset正数
whence 1 表示从当前位置,offset可正可负
whence 2 表示从末尾,offset可正可负
注意:
向后seek可以越界,越界返回空字符;但是向前seek不能越界,否则抛异常

f = open("test","rb+")
f.write(b"addffg")
f.seek(50) # 向后
f.read() # 返回''空
f.seek(-20,2) # 向前
f.read() # OSError

buffering:缓存区

简介

缓冲区是一个内存空间,一般是使用一个FIFO队列(先进先出),到缓冲区满了或者到阀值了,数据会被flush到磁盘上.

缓冲和缓存的区别?

缓冲数据结构:

是一个列表或者是队列

缓存数据结构:

是一个字典

缓冲的目的是:

一堆数据排个队放哪暂存数据,减缓数据进入磁盘的速度.

缓存的目的是:

暂时性存储数据(掉电即失),使用字典数据结构为了最快速度的找到自己存储的内容,帮助硬件更快的运行

open()方法的buffering参数设置

  • -1缺省buffer大小:默认是8192个字节,8192/1024 = 8k
  • 0只在二进制模式使用,表示关buffer,文本下不支持
  • 1只在文本模式使用,表示行缓冲.意思就是见到换行符就flush
    在二进制下表示就1个字节
  • 大于1:二进制下,表示指定大小,文本下指定大小还依旧表示为默认值
  • flush()将缓冲区数据写入磁盘
  • close()关闭前会调用flush()

为方便记忆以上总结为:
文本就默认,二进制可以指定大小.一般情况下默认是个比较好的选择,除非你明确知道你在做什么,否则不调整他

参数编码描述符encoding

encoding:编码,仅文本模式使用

Npne表示使用缺省编码,依赖操作系统
在这里插入图片描述

其他参数

errors

不设置,直接默认

newline

一般不设定
在这里插入图片描述
系统分隔符os.linesep -->\r\n回车换行
\n换行
\r回车
当写时,None表示所有的"\n换行"都会被替换成为->\r\n回车换行,当遇见\r时候就不进行替换

read

read(size=-1)
size表示读取的多少个字符或字节;负数或者None表示读取到结尾

行读取

readline(size=-1)

一行行读取文件内容.size设置一次能读取行内几个字符或字节

readlines()

读取所有行的列表.

注意事项

行读取内容以后基本不推荐使用,直接使用,以下方式:

f = open("file","r+") # 返回一个可迭代对象
for line in f:print(line)  #file文件内容,一行行打印出来f.close()

write写入

write(s),把字符串s写入到文件中并返回字符的个数
writelines(lines),将字符串列表写入文件

close

释放文件对象,flus并关闭文件对象

其他(返回类型都是布尔值)

f.seekable()是否可seek
f.radable()是否可读
f.writable()是否可写
closed是否已经关闭

上下文管理

引子

在这里插入图片描述
当出现上述问题时我们怎么解决那??

为了解决上述问题这里就需要使用"上下文管理"格式:

with open(“test”) as f:
f.read()

使用上下注意事项:

1.上下文管理的语句块并不会开启新的作用域
2.with语句块执行完的时候,会自动关闭文件对象

上下文管理内部实现的内部原理源码详解

练习:指定一个源文件,事项copy到目录

def copyFile(src,dst):with open(src) as f1:with open(dst,"w+") as f2:f2.write(f1.read())
copyFile("file","file2")         

练习:有一个文件,对其进行单词统计,不区分大小写,计算单词重复最多的10个单词

这篇关于python-文件操作,文件指针,buffering:缓冲区,编码描述符及其读写,以及上下文管理.一站式详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/212535

相关文章

python中列表list切分的实现

《python中列表list切分的实现》列表是Python中最常用的数据结构之一,经常需要对列表进行切分操作,本文主要介绍了python中列表list切分的实现,文中通过示例代码介绍的非常详细,对大家... 目录一、列表切片的基本用法1.1 基本切片操作1.2 切片的负索引1.3 切片的省略二、列表切分的高

基于Python实现一个PDF特殊字体提取工具

《基于Python实现一个PDF特殊字体提取工具》在PDF文档处理场景中,我们常常需要针对特定格式的文本内容进行提取分析,本文介绍的PDF特殊字体提取器是一款基于Python开发的桌面应用程序感兴趣的... 目录一、应用背景与功能概述二、技术架构与核心组件2.1 技术选型2.2 系统架构三、核心功能实现解析

Flutter监听当前页面可见与隐藏状态的代码详解

《Flutter监听当前页面可见与隐藏状态的代码详解》文章介绍了如何在Flutter中使用路由观察者来监听应用进入前台或后台状态以及页面的显示和隐藏,并通过代码示例讲解的非常详细,需要的朋友可以参考下... flutter 可以监听 app 进入前台还是后台状态,也可以监听当http://www.cppcn

通过Python脚本批量复制并规范命名视频文件

《通过Python脚本批量复制并规范命名视频文件》本文介绍了如何通过Python脚本批量复制并规范命名视频文件,实现自动补齐数字编号、保留原始文件、智能识别有效文件等功能,听过代码示例介绍的非常详细,... 目录一、问题场景:杂乱的视频文件名二、完整解决方案三、关键技术解析1. 智能路径处理2. 精准文件名

基于Python开发PDF转Doc格式小程序

《基于Python开发PDF转Doc格式小程序》这篇文章主要为大家详细介绍了如何基于Python开发PDF转Doc格式小程序,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 用python实现PDF转Doc格式小程序以下是一个使用Python实现PDF转DOC格式的GUI程序,采用T

Python使用PIL库将PNG图片转换为ICO图标的示例代码

《Python使用PIL库将PNG图片转换为ICO图标的示例代码》在软件开发和网站设计中,ICO图标是一种常用的图像格式,特别适用于应用程序图标、网页收藏夹图标等场景,本文将介绍如何使用Python的... 目录引言准备工作代码解析实践操作结果展示结语引言在软件开发和网站设计中,ICO图标是一种常用的图像

C++ Primer 标准库vector示例详解

《C++Primer标准库vector示例详解》该文章主要介绍了C++标准库中的vector类型,包括其定义、初始化、成员函数以及常见操作,文章详细解释了如何使用vector来存储和操作对象集合,... 目录3.3标准库Vector定义和初始化vector对象通列表初始化vector对象创建指定数量的元素值

MyBatis与其使用方法示例详解

《MyBatis与其使用方法示例详解》MyBatis是一个支持自定义SQL的持久层框架,通过XML文件实现SQL配置和数据映射,简化了JDBC代码的编写,本文给大家介绍MyBatis与其使用方法讲解,... 目录ORM缺优分析MyBATisMyBatis的工作流程MyBatis的基本使用环境准备MyBati

C#中的 Dictionary常用操作

《C#中的Dictionary常用操作》C#中的DictionaryTKey,TValue是用于存储键值对集合的泛型类,允许通过键快速检索值,并且具有唯一键、动态大小和无序集合的特性,常用操作包括添... 目录基本概念Dictionary的基本结构Dictionary的主要特性Dictionary的常用操作

使用Python开发一个图像标注与OCR识别工具

《使用Python开发一个图像标注与OCR识别工具》:本文主要介绍一个使用Python开发的工具,允许用户在图像上进行矩形标注,使用OCR对标注区域进行文本识别,并将结果保存为Excel文件,感兴... 目录项目简介1. 图像加载与显示2. 矩形标注3. OCR识别4. 标注的保存与加载5. 裁剪与重置图像