记一次多线程写入文件出现IOException:Stream Closed的问题

2024-03-12 18:28

本文主要是介绍记一次多线程写入文件出现IOException:Stream Closed的问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

背景

        网关在解析1000个05文件(txt)写入到SFTP文件时,是每次读取1000 * 5条数据,然后每1000笔数据创建一个线程逐条数据进行字段数值映射转换,一共创建5个线程扔到线程池进行处理。每条数据解析完都会将数据写入到SFTP的DAT文件,并且累加条数写入到CTL文件。

原来是1000笔数据才进行解析,每个文件造数据10条,导入没问题。为了方便测试,把条数调小到每次读取5 * 2 条数据,每个文件有10条数据,方便验证多线程读取有无问题。

问题来了:预期是DAT文件会写入10笔数据,CTL文件记录的条数增加10,但是每次解析写到几条就抛异常了:IOException:Stream Closed,有时候能写2条,有时候能写4条,有时候能写8条.......

分析

  • 怀疑是不是因为改了网关的代码导致的,因为原来代码写死的1000,导入是没问题的,分析一波发现,原来每个文件只有10条数据,达不到1000,所以每次导入只会创建一个线程就处理完了,回检了一遍代码应该不是调小引发的问题;
  • 改成每次只读取5 * 2条,一次读取就把文件10条数据读完了,但是还是出现报错;改成每次只读取1 * 2条数据,要读取10 / 2 = 5次,才能读完,也还是会报错;
  • 是不是数据有问题呢?应该也不是,因为在配置1000的时候是能够把这10条数据正常写入的,打了断点也没发现write的时候写入的数据有啥问题 为什么会出现有时候能够写入2条就挂了,有时候写到4条呢.....发现是由于debug断点打的位置导致多个线程执行的快慢不一致导致的,如果不是debug的话正常postman触发是每次写了2条就报错了。补充一下:读取到数据并不是马上就写入到文件中,而是将数据加到一个dataList中存放,达到1000笔才写入;还有一个写入时机,那就是执行完每个线程会调用flush()方法,将dataList中的数据写入到txt
  • 原来每个线程处理完只返回boolean,主线程使用Future<Boolean>接收,看不到具体报错信息,在线程run()里面加了日志打印,也只能看到catch中的stream closed异常,看不到其他什么有效信息......
  • 试试其他思路:百度了一下Stream Closed这个报错原因,如果一个文件流对象已经关闭过了在finally再重复关闭一次的话会报这个错,由此猜测是不是因为我在write的时候文件流对象就被关闭了呢? debug断点打在写入前文件流对象那里,发现抛异常之前这个文件流对象一直都是正常的不为null,那为啥写入的时候会抛stream closed异常呢(有个误区:我一直以为closed了对象就会为null,后面才发现只是关闭只是跟句柄断开联系对象还不是null的)
  • 为啥其他文件的导入也是调用的ConvertIn这个通用的文件解析没有问题,我调用这个就有问题了呢。查看了一下其他文件的导入代码,发现其他文件的导入每次读取完1000条数据之后,并不是写入到文件,而是调用了作业条进行发送就返回了,不存在我这种写入文件的场景,自然就不会出现stream Closed的问题
  • 我这种场景跟导出的时候ConvertOut类似,读取文件数据之后再写入到txt中,对比了一个多线程里面的run()方法,发现我每次处理完一批数据就调用数据源的close()方法对文件流对象进行释放了,而导出的ConvertOut的话里面并没有closed文件对象,而是在处理完所有数据在finally才关闭文件流对象。每次创建线程的时候都将这个文件流对象传进去,导致有些线程在执行的时候将这个对象close了,其他线程在写的时候发现已经被关闭了,所以就报Stream Closed异常了
  • 至此,终于发现问题所在了,修改一下代码每个线程处理完不马上关闭这个文件流对象,而是在主线程外面的finally统一关闭一次,这样就不会出现多线程写入的时候报Stream Closed异常了

结论

  1. 调用别人的代码要认真阅读每行的逻辑,仔细斟酌有没有什么问题,是否适用,不能看都没看就放心使用,不然出了问题也不知道是什么原因.......
  2. 多线程进行文件写入时要注意及时关闭IO流对象防止内存泄漏

这篇关于记一次多线程写入文件出现IOException:Stream Closed的问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/802178

相关文章

SpringBoot启动报错的11个高频问题排查与解决终极指南

《SpringBoot启动报错的11个高频问题排查与解决终极指南》这篇文章主要为大家详细介绍了SpringBoot启动报错的11个高频问题的排查与解决,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一... 目录1. 依赖冲突:NoSuchMethodError 的终极解法2. Bean注入失败:No qu

Spring定时任务只执行一次的原因分析与解决方案

《Spring定时任务只执行一次的原因分析与解决方案》在使用Spring的@Scheduled定时任务时,你是否遇到过任务只执行一次,后续不再触发的情况?这种情况可能由多种原因导致,如未启用调度、线程... 目录1. 问题背景2. Spring定时任务的基本用法3. 为什么定时任务只执行一次?3.1 未启用

MySQL新增字段后Java实体未更新的潜在问题与解决方案

《MySQL新增字段后Java实体未更新的潜在问题与解决方案》在Java+MySQL的开发中,我们通常使用ORM框架来映射数据库表与Java对象,但有时候,数据库表结构变更(如新增字段)后,开发人员可... 目录引言1. 问题背景:数据库与 Java 实体不同步1.1 常见场景1.2 示例代码2. 不同操作

如何解决mysql出现Incorrect string value for column ‘表项‘ at row 1错误问题

《如何解决mysql出现Incorrectstringvalueforcolumn‘表项‘atrow1错误问题》:本文主要介绍如何解决mysql出现Incorrectstringv... 目录mysql出现Incorrect string value for column ‘表项‘ at row 1错误报错

如何解决Spring MVC中响应乱码问题

《如何解决SpringMVC中响应乱码问题》:本文主要介绍如何解决SpringMVC中响应乱码问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring MVC最新响应中乱码解决方式以前的解决办法这是比较通用的一种方法总结Spring MVC最新响应中乱码解

pip无法安装osgeo失败的问题解决

《pip无法安装osgeo失败的问题解决》本文主要介绍了pip无法安装osgeo失败的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 进入官方提供的扩展包下载网站寻找版本适配的whl文件注意:要选择cp(python版本)和你py

解决Java中基于GeoTools的Shapefile读取乱码的问题

《解决Java中基于GeoTools的Shapefile读取乱码的问题》本文主要讨论了在使用Java编程语言进行地理信息数据解析时遇到的Shapefile属性信息乱码问题,以及根据不同的编码设置进行属... 目录前言1、Shapefile属性字段编码的情况:一、Shp文件常见的字符集编码1、System编码

Spring MVC使用视图解析的问题解读

《SpringMVC使用视图解析的问题解读》:本文主要介绍SpringMVC使用视图解析的问题解读,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring MVC使用视图解析1. 会使用视图解析的情况2. 不会使用视图解析的情况总结Spring MVC使用视图

Java使用多线程处理未知任务数的方案介绍

《Java使用多线程处理未知任务数的方案介绍》这篇文章主要为大家详细介绍了Java如何使用多线程实现处理未知任务数,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 知道任务个数,你可以定义好线程数规则,生成线程数去跑代码说明:1.虚拟线程池:使用 Executors.newVir

Redis解决缓存击穿问题的两种方法

《Redis解决缓存击穿问题的两种方法》缓存击穿问题也叫热点Key问题,就是⼀个被高并发访问并且缓存重建业务较复杂的key突然失效了,无数的请求访问会在瞬间给数据库带来巨大的冲击,本文给大家介绍了Re... 目录引言解决办法互斥锁(强一致,性能差)逻辑过期(高可用,性能优)设计逻辑过期时间引言缓存击穿:给