tcp的拆包,黏包解决方案

2023-11-04 22:30
文章标签 解决方案 tcp 拆包 黏包

本文主要是介绍tcp的拆包,黏包解决方案,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在进行Java NIO学习时,发现,如果客户端连续不断的向服务端发送数据包时,服务端接收的数据会出现两个数据包粘在一起的情况,这就是TCP协议中经常会遇到的粘包以及拆包的问题。

我们都知道TCP属于传输层的协议,传输层除了有TCP协议外还有UDP协议。那么UDP是否会发生粘包或拆包的现象呢?答案是不会。UDP是基于报文发送的,从UDP的帧结构可以看出,在UDP首部采用了16bit来指示UDP数据报文的长度,因此在应用层能很好的将不同的数据报文区分开,从而避免粘包和拆包的问题。而TCP是基于字节流的,虽然应用层和TCP传输层之间的数据交互是大小不等的数据块,但是TCP把这些数据块仅仅看成一连串无结构的字节流,没有边界;另外从TCP的帧结构也可以看出,在TCP的首部没有表示数据长度的字段,基于上面两点,在使用TCP传输数据时,才有粘包或者拆包现象发生的可能。

粘包、拆包表现形式

现在假设客户端向服务端连续发送了两个数据包,用packet1和packet2来表示,那么服务端收到的数据可以分为三种,现列举如下:

第一种情况,接收端正常收到两个数据包,即没有发生拆包和粘包的现象,此种情况不在本文的讨论范围内。normal

第二种情况,接收端只收到一个数据包,由于TCP是不会出现丢包的,所以这一个数据包中包含了发送端发送的两个数据包的信息,这种现象即为粘包。这种情况由于接收端不知道这两个数据包的界限,所以对于接收端来说很难处理。one

第三种情况,这种情况有两种表现形式,如下图。接收端收到了两个数据包,但是这两个数据包要么是不完整的,要么就是多出来一块,这种情况即发生了拆包和粘包。这两种情况如果不加特殊处理,对于接收端同样是不好处理的。half_oneone_half

粘包、拆包发生原因

发生TCP粘包或拆包有很多原因,现列出常见的几点,可能不全面,欢迎补充,

1、要发送的数据大于TCP发送缓冲区剩余空间大小,将会发生拆包。

2、待发送数据大于MSS(最大报文长度),TCP在传输前将进行拆包。

3、要发送的数据小于TCP发送缓冲区的大小,TCP将多次写入缓冲区的数据一次发送出去,将会发生粘包。

4、接收数据端的应用层没有及时读取接收缓冲区中的数据,将发生粘包。

等等。

粘包、拆包解决办法

通过以上分析,我们清楚了粘包或拆包发生的原因,那么如何解决这个问题呢?解决问题的关键在于如何给每个数据包添加边界信息,常用的方法有如下几个:

1、发送端给每个数据包添加包首部,首部中应该至少包含数据包的长度,这样接收端在接收到数据后,通过读取包首部的长度字段,便知道每一个数据包的实际长度了。

2、发送端将每个数据包封装为固定长度(不够的可以通过补0填充),这样接收端每次从接收缓冲区中读取固定长度的数据就自然而然的把每个数据包拆分开来。

3、可以在数据包之间设置边界,如添加特殊符号,这样,接收端通过这个边界就可以将不同的数据包拆分开。

等等。

样例程序

我将在程序中使用两种方法来解决粘包和拆包问题,固定数据包长度和添加长度首部,这两种方法各有优劣。固定数据包长度传输效率一般,尤其是在要发送的数据长度长短差别很大的时候效率会比较低,但是编程实现比较简单;添加长度首部虽然可以获得较高的传输效率,冗余信息少且固定,但是编程实现较为复杂。下面给出的样例程序是基于之前的文章《Java中BIO,NIO和AIO使用样例》中提到的NIO实例的,如果对NIO的使用还不是很熟悉,可以先了解一下Java中NIO编程。

固定数据包长度

这种处理方式的思路很简单,发送端在发送实际数据前先把数据封装为固定长度,然后在发送出去,接收端接收到数据后按照这个固定长度进行拆分即可。发送端程序如下:

 
  1. // 发送端

  2. String msg = "hello world " + number++;

  3. socketChannel.write(ByteBuffer.wrap(new FixLengthWrapper(msg).getBytes()));

  4.  
  5. // 封装固定长度的工具类

  6. public class FixLengthWrapper {

  7.  
  8. public static final int MAX_LENGTH = 32;

  9. private byte[] data;

  10.  
  11. public FixLengthWrapper(String msg) {

  12. ByteBuffer byteBuffer = ByteBuffer.allocate(MAX_LENGTH);

  13. byteBuffer.put(msg.getBytes());

  14. byte[] fillData = new byte[MAX_LENGTH - msg.length()];

  15. byteBuffer.put(fillData);

  16. data = byteBuffer.array();

  17. }

  18.  
  19. public FixLengthWrapper(byte[] msg) {

  20. ByteBuffer byteBuffer = ByteBuffer.allocate(MAX_LENGTH);

  21. byteBuffer.put(msg);

  22. byte[] fillData = new byte[MAX_LENGTH - msg.length];

  23. byteBuffer.put(fillData);

  24. data = byteBuffer.array();

  25. }

  26.  
  27. public byte[] getBytes() {

  28. return data;

  29. }

  30.  
  31. public String toString() {

  32. StringBuilder sb = new StringBuilder();

  33. for (byte b : getBytes()) {

  34. sb.append(String.format("0x%02X ", b));

  35. }

  36. return sb.toString();

  37. }

  38. }

可以看到客户端在发送数据前首先把数据封装为长度为32bytes的数据包,这个长度是根据目前实际数据包长度来规定的,这个长度必须要大于所有可能出现的数据包的长度,这样才不会出现把数据“截断”的情况。接收端程序如下:

 
  1. private static void processByFixLength(SocketChannel socketChannel) throws IOException {

  2. while (socketChannel.read(byteBuffer) > 0) {

  3.  
  4. byteBuffer.flip();

  5. while (byteBuffer.remaining() >= FixLengthWrapper.MAX_LENGTH) {

  6. byte[] data = new byte[FixLengthWrapper.MAX_LENGTH];

  7. byteBuffer.get(data, 0, FixLengthWrapper.MAX_LENGTH);

  8. System.out.println(new String(data) + " <---> " + number++);

  9. }

  10. byteBuffer.compact();

  11. }

  12. }

可以看出接收端的处理很简单,只需要每次读取固定的长度即可区分出来不同的数据包。

添加长度首部

这种方式的处理较上面提到的方式稍微复杂一点。在发送端需要给待发送的数据添加固定的首部,然后再发送出去,然后在接收端需要根据这个首部的长度信息进行数据包的组合或拆分,发送端程序如下:

 
  1. // 发送端

  2. String msg = "hello world " + number++;

  3. // add the head represent the data length

  4. socketChannel.write(ByteBuffer.wrap(new PacketWrapper(msg).getBytes()));

  5.  
  6. // 添加长度首部的工具类

  7. public class PacketWrapper {

  8.  
  9. private int length;

  10. private byte[] payload;

  11.  
  12. public PacketWrapper(String payload) {

  13. this.payload = payload.getBytes();

  14. this.length = this.payload.length;

  15. }

  16.  
  17. public PacketWrapper(byte[] payload) {

  18. this.payload = payload;

  19. this.length = this.payload.length;

  20. }

  21.  
  22. public byte[] getBytes() {

  23. ByteBuffer byteBuffer = ByteBuffer.allocate(this.length + 4);

  24. byteBuffer.putInt(this.length);

  25. byteBuffer.put(payload);

  26. return byteBuffer.array();

  27. }

  28.  
  29. public String toString() {

  30. StringBuilder sb = new StringBuilder();

  31. for (byte b : getBytes()) {

  32. sb.append(String.format("0x%02X ", b));

  33. }

  34. return sb.toString();

  35. }

  36. }

从程序可以看到,发送端在发送数据前首先给待发送数据添加了代表长度的首部,首部长为4bytes(即int型长度),这样接收端在收到这个数据之后,首先需要读取首部,拿到实际数据长度,然后再继续读取实际长度的数据,即实现了组包和拆包的操作。程序如下:

 
  1. private static void processByHead(SocketChannel socketChannel) throws IOException {

  2.  
  3. while (socketChannel.read(byteBuffer) > 0) {

  4. // 保存bytebuffer状态

  5. int position = byteBuffer.position();

  6. int limit = byteBuffer.limit();

  7. byteBuffer.flip();

  8. // 判断数据长度是否够首部长度

  9. if (byteBuffer.remaining() < 4) {

  10. byteBuffer.position(position);

  11. byteBuffer.limit(limit);

  12. continue;

  13. }

  14. // 判断bytebuffer中剩余数据是否足够一个包

  15. int length = byteBuffer.getInt();

  16. if (byteBuffer.remaining() < length) {

  17. byteBuffer.position(position);

  18. byteBuffer.limit(limit);

  19. continue;

  20. }

  21. // 拿到实际数据包

  22. byte[] data = new byte[length];

  23.  
  24. byteBuffer.get(data, 0, length);

  25. System.out.println(new String(data) + " <---> " + number++);

  26. byteBuffer.compact();

  27. }

  28. }

关键信息已经在程序中做了注释,可以很明显的感觉到这种方法的处理难度相对于固定长度要大一些,不过这种方式可以获取更大的传输效率。

这里需要提醒各位同学一个问题,由于我在测试的时候采用的是一台机器连续发送数据来模拟高并发的场景,所以在测试的时候会发现服务器端收到的数据包的个数经常会小于包的序号,好像发生了丢包。但经过仔细分析可以发现,这种情况是因为TCP发送缓存溢出导致的丢包,也就是这个数据包根本没有发出来。也就是说,发送端发送数据过快,导致接收端缓存很快被填满,这个时候接收端会把通知窗口设置为0从而控制发送端的流量,这样新到的数据只能暂存在发送端的发送缓存中,当发送缓存溢出后,就出现了我上面提到的丢包,这个问题可以通过增大发送端缓存来缓解这个问题,

socketChannel.socket().setSendBufferSize(102400);  

当然这个话题不在本文的讨论范围,如果有兴趣的同学可以参阅《TCP/IP详解卷一》中的拥塞窗口一章。

关于源码说明,源码默认是把粘包和拆包处理这一部分注释掉了,分别位于NIOTcpServer和NIOTcpClient文件中,需要测试粘包和拆包处理程序的同学需要把这一段注释给去掉。

最后给出源码下载地址

参考

Netty精粹之TCP粘包拆包问题

这篇关于tcp的拆包,黏包解决方案的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/345607

相关文章

关于Nginx跨域问题及解决方案(CORS)

《关于Nginx跨域问题及解决方案(CORS)》文章主要介绍了跨域资源共享(CORS)机制及其在现代Web开发中的重要性,通过Nginx,可以简单地解决跨域问题,适合新手学习和应用,文章详细讲解了CO... 目录一、概述二、什么是 CORS?三、常见的跨域场景四、Nginx 如何解决 CORS 问题?五、基

Nginx启动失败:端口80被占用问题的解决方案

《Nginx启动失败:端口80被占用问题的解决方案》在Linux服务器上部署Nginx时,可能会遇到Nginx启动失败的情况,尤其是错误提示bind()to0.0.0.0:80failed,这种问题通... 目录引言问题描述问题分析解决方案1. 检查占用端口 80 的进程使用 netstat 命令使用 ss

部署Vue项目到服务器后404错误的原因及解决方案

《部署Vue项目到服务器后404错误的原因及解决方案》文章介绍了Vue项目部署步骤以及404错误的解决方案,部署步骤包括构建项目、上传文件、配置Web服务器、重启Nginx和访问域名,404错误通常是... 目录一、vue项目部署步骤二、404错误原因及解决方案错误场景原因分析解决方案一、Vue项目部署步骤

在MySQL执行UPDATE语句时遇到的错误1175的解决方案

《在MySQL执行UPDATE语句时遇到的错误1175的解决方案》MySQL安全更新模式(SafeUpdateMode)限制了UPDATE和DELETE操作,要求使用WHERE子句时必须基于主键或索引... mysql 中遇到的 Error Code: 1175 是由于启用了 安全更新模式(Safe Upd

Python安装时常见报错以及解决方案

《Python安装时常见报错以及解决方案》:本文主要介绍在安装Python、配置环境变量、使用pip以及运行Python脚本时常见的错误及其解决方案,文中介绍的非常详细,需要的朋友可以参考下... 目录一、安装 python 时常见报错及解决方案(一)安装包下载失败(二)权限不足二、配置环境变量时常见报错及

Java下载文件中文文件名乱码的解决方案(文件名包含很多%)

《Java下载文件中文文件名乱码的解决方案(文件名包含很多%)》Java下载文件时,文件名中文乱码问题通常是由于编码不正确导致的,使用`URLEncoder.encode(filepath,UTF-8... 目录Java下载文件中文文件名乱码问题一般情况下,大家都是这样为了解决这个问题最终解决总结Java下

Idea实现接口的方法上无法添加@Override注解的解决方案

《Idea实现接口的方法上无法添加@Override注解的解决方案》文章介绍了在IDEA中实现接口方法时无法添加@Override注解的问题及其解决方法,主要步骤包括更改项目结构中的Languagel... 目录Idea实现接China编程口的方法上无法添加@javascriptOverride注解错误原因解决方

MYSQL事务死锁问题排查及解决方案

《MYSQL事务死锁问题排查及解决方案》:本文主要介绍Java服务报错日志的情况,并通过一系列排查和优化措施,最终发现并解决了服务假死的问题,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录问题现象推测 1 - 客户端无错误重试配置推测 2 - 客户端超时时间过短推测 3 - mysql 版本问

Android kotlin语言实现删除文件的解决方案

《Androidkotlin语言实现删除文件的解决方案》:本文主要介绍Androidkotlin语言实现删除文件的解决方案,在项目开发过程中,尤其是需要跨平台协作的项目,那么删除用户指定的文件的... 目录一、前言二、适用环境三、模板内容1.权限申请2.Activity中的模板一、前言在项目开发过程中,尤

Linux内存泄露的原因排查和解决方案(内存管理方法)

《Linux内存泄露的原因排查和解决方案(内存管理方法)》文章主要介绍了运维团队在Linux处理LB服务内存暴涨、内存报警问题的过程,从发现问题、排查原因到制定解决方案,并从中学习了Linux内存管理... 目录一、问题二、排查过程三、解决方案四、内存管理方法1)linux内存寻址2)Linux分页机制3)