Go 秒读32GB大文件

2024-05-23 21:12
文章标签 go 32gb

本文主要是介绍Go 秒读32GB大文件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在Go中,处理大文件时,一般采用分块读取的方式,以避免一次性加载整个文件到内存中。

1、打开文件

使用os.Open打开文件 

package mainimport ("log""os"
)func main() {file, err := os.Open("xxx.txt")if err != nil {log.Fatal(err)}defer file.Close()
}

2、获取文件信息

使用file.Stat获取文件的基本信息,包括文件大小

package mainimport ("fmt""log""os"
)func main() {file, err := os.Open("xxx.txt")if err != nil {log.Fatal(err)}defer file.Close()fileInfo, err := file.Stat()if err != nil {log.Fatal(err)}fileSize := fileInfo.Size()fmt.Println(fileSize)
}

3、设置缓冲区大小

为了提高读取效率,使用合适大小的缓冲区

package mainimport ("fmt""io""log""os"
)func main() {//1、打开文件file, err := os.Open("xxx.txt")if err != nil {log.Fatal(err)}defer file.Close()//2、获取文件信息fileInfo, err := file.Stat()if err != nil {log.Fatal(err)}fileSize := fileInfo.Size()fmt.Println(fileSize)//3、设置缓冲区大小bufferSize := 8192 // 8KB 缓冲区大小buffer := make([]byte, bufferSize)
}

4、循环读取文件内容

使用file.Read循环读取文件内容 

package mainimport ("fmt""io""log""os"
)func main() {//1、打开文件file, err := os.Open("xxx.txt")if err != nil {log.Fatal(err)}defer file.Close()//2、获取文件信息fileInfo, err := file.Stat()if err != nil {log.Fatal(err)}fileSize := fileInfo.Size()fmt.Println(fileSize)//3、设置缓冲区大小bufferSize := 8192 // 8KB 缓冲区大小buffer := make([]byte, bufferSize)//4、循环读取文件内容for {bytesRead, err := file.Read(buffer)if err == io.EOF {// 文件读取完毕break}if err != nil {log.Fatal(err)}// 处理读取的数据,例如输出到控制台fmt.Print(string(buffer[:bytesRead]))}
}

5、 关闭文件

package mainimport ("fmt""io""log""os"
)func main() {//1、打开文件file, err := os.Open("xxx.txt")if err != nil {log.Fatal(err)}defer file.Close()//关闭//2、获取文件信息fileInfo, err := file.Stat()if err != nil {log.Fatal(err)}fileSize := fileInfo.Size()fmt.Println(fileSize)//3、设置缓冲区大小bufferSize := 8192 // 8KB 缓冲区大小buffer := make([]byte, bufferSize)//4、循环读取文件内容for {bytesRead, err := file.Read(buffer)if err == io.EOF {// 文件读取完毕break}if err != nil {log.Fatal(err)}// 处理读取的数据,例如输出到控制台fmt.Print(string(buffer[:bytesRead]))}
}

 6、案例

package mainimport ("bufio""fmt""log""os""strings"
)func main() {file, err := os.Open("large_file.txt")if err != nil {log.Fatal(err)}defer file.Close()const maxScanTokenSize = 64 * 1024 * 1024 // 64MBbuf := make([]byte, maxScanTokenSize)scanner := bufio.NewScanner(file)scanner.Buffer(buf, maxScanTokenSize)for scanner.Scan() {line := scanner.Text()// 处理每一行的逻辑fmt.Println(line) //打印每一行fields := strings.Split(line, ",") // 假设使用逗号分隔// 处理fields中的每个字段for _, field := range fields {fmt.Println(field)// 可以添加更多处理逻辑}}if err := scanner.Err(); err != nil {log.Fatal(err)}
}

这篇关于Go 秒读32GB大文件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/996430

相关文章

Go语言实现将中文转化为拼音功能

《Go语言实现将中文转化为拼音功能》这篇文章主要为大家详细介绍了Go语言中如何实现将中文转化为拼音功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 有这么一个需求:新用户入职 创建一系列账号比较麻烦,打算通过接口传入姓名进行初始化。想把姓名转化成拼音。因为有些账号即需要中文也需要英

Go语言使用Buffer实现高性能处理字节和字符

《Go语言使用Buffer实现高性能处理字节和字符》在Go中,bytes.Buffer是一个非常高效的类型,用于处理字节数据的读写操作,本文将详细介绍一下如何使用Buffer实现高性能处理字节和... 目录1. bytes.Buffer 的基本用法1.1. 创建和初始化 Buffer1.2. 使用 Writ

Go Gorm 示例详解

《GoGorm示例详解》Gorm是一款高性能的GolangORM库,便于开发人员提高效率,本文介绍了Gorm的基本概念、数据库连接、基本操作(创建表、新增记录、查询记录、修改记录、删除记录)等,本... 目录1. 概念2. 数据库连接2.1 安装依赖2.2 连接数据库3. 数据库基本操作3.1 创建表(表关

Go信号处理如何优雅地关闭你的应用

《Go信号处理如何优雅地关闭你的应用》Go中的优雅关闭机制使得在应用程序接收到终止信号时,能够进行平滑的资源清理,通过使用context来管理goroutine的生命周期,结合signal... 目录1. 什么是信号处理?2. 如何优雅地关闭 Go 应用?3. 代码实现3.1 基本的信号捕获和优雅关闭3.2

Go Playground 在线编程环境

For all examples in this and the next chapter, we will use Go Playground. Go Playground represents a web service that can run programs written in Go. It can be opened in a web browser using the follow

go基础知识归纳总结

无缓冲的 channel 和有缓冲的 channel 的区别? 在 Go 语言中,channel 是用来在 goroutines 之间传递数据的主要机制。它们有两种类型:无缓冲的 channel 和有缓冲的 channel。 无缓冲的 channel 行为:无缓冲的 channel 是一种同步的通信方式,发送和接收必须同时发生。如果一个 goroutine 试图通过无缓冲 channel

如何确定 Go 语言中 HTTP 连接池的最佳参数?

确定 Go 语言中 HTTP 连接池的最佳参数可以通过以下几种方式: 一、分析应用场景和需求 并发请求量: 确定应用程序在特定时间段内可能同时发起的 HTTP 请求数量。如果并发请求量很高,需要设置较大的连接池参数以满足需求。例如,对于一个高并发的 Web 服务,可能同时有数百个请求在处理,此时需要较大的连接池大小。可以通过压力测试工具模拟高并发场景,观察系统在不同并发请求下的性能表现,从而

【Go】go连接clickhouse使用TCP协议

离开你是傻是对是错 是看破是软弱 这结果是爱是恨或者是什么 如果是种解脱 怎么会还有眷恋在我心窝 那么爱你为什么                      🎵 黄品源/莫文蔚《那么爱你为什么》 package mainimport ("context""fmt""log""time""github.com/ClickHouse/clickhouse-go/v2")func main(

Go Select的实现

select语法总结 select对应的每个case如果有已经准备好的case 则进行chan读写操作;若没有则执行defualt语句;若都没有则阻塞当前goroutine,直到某个chan准备好可读或可写,完成对应的case后退出。 Select的内存布局 了解chanel的实现后对select的语法有个疑问,select如何实现多路复用的,为什么没有在第一个channel操作时阻塞 从而导

Go Channel的实现

channel作为goroutine间通信和同步的重要途径,是Go runtime层实现CSP并发模型重要的成员。在不理解底层实现时,经常在使用中对channe相关语法的表现感到疑惑,尤其是select case的行为。因此在了解channel的应用前先看一眼channel的实现。 Channel内存布局 channel是go的内置类型,它可以被存储到变量中,可以作为函数的参数或返回值,它在r