一个很棒的数据包分流方法

2023-11-23 18:30
文章标签 方法 数据包 分流 很棒

本文主要是介绍一个很棒的数据包分流方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前段时间看流量分类方向的论文,看了许多中科大王伟老师的论文。受益匪浅,尝试着去学习借鉴。
因为流量分类的基本单元一般就是单个包,整条流或者双向流。通常使用双向流Bi-Flow作为基本单元,而通过网卡接口抓取的pcap文件或者pcapng文件一般都有很多个session组成。所以分流一般都是预处理过程的第一步。

1.获取流量数据集
首先使用了开源数据集ISCX VPN and NO-VPN
ISCX开源数据集集合

2.pcapng转pcap
解压得到完整的pcap文件之后,首先要把其中的pcapng文件转化为pcap文件,可以通过脚本,或者直接用转化工具。包含的行为类型可以划分为以下几种:
在这里插入图片描述
聊天,邮件,文件传输,P2P,流媒体,语音电话共六种类型。

3.ps脚本批量处理
通过powershell脚本批量拆分pcap文件,得到每个session对应的单一文件。
脚本
实现pcap拆分的ps脚本是1_Pcap2Session.ps1。
在这里插入图片描述
即对1_Pcap中的pcap文件,调用开源工具splitcap根据TCP和UDP将其拆分为多个文件,每个session对应一个文件。splitcap在同一级目录的0_Tool文件夹中。除此之外如果在命令行后面加入-y L7代表仅提取了应用层数据。

4.常见问题
如果在windows powershell中执行ps文件出错,输入Set-ExecutionPolicy Unrestricted来改变执行权限即可。如果出现找不到文件,出现no such directory,说明文件路径有误,建议绝对路径。
在这里插入图片描述
输出的结果为每个以原pcap文件名-ALL/L7命名的文件夹中都有许多的pcap文件。
在这里插入图片描述
5.后续
这里的pcap文件对应着各自的五元组信息。得到这部分文件之后,还需要进行接下来的处理工作,因为并不是所有的会话文件都适合作为训练数据。但是分流任务的完成表示着预处理的第一步算是完成了。接下来要通过这些较为原始的文件,根据自己的需要来处理为训练输入。通过AllLayer得到的数据可以选择剔除某些部分的原始字节信息,操作更加灵活。对于后面的ProcessSession以及session2png等脚本就不介绍了,ProcessSession就涉及了王伟老师论文的实验思想,其中包括截断784个字节,padding,然后784->28*28->png,还有数据集划分等操作。
个人接下来的数据预处理更倾向于特征映射,不是原始字节转img。

这篇关于一个很棒的数据包分流方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/419898

相关文章

Linux虚拟机不显示IP地址的解决方法(亲测有效)

《Linux虚拟机不显示IP地址的解决方法(亲测有效)》本文主要介绍了通过VMware新装的Linux系统没有IP地址的解决方法,主要步骤包括:关闭虚拟机、打开VM虚拟网络编辑器、还原VMnet8或修... 目录前言步骤0.问题情况1.关闭虚拟机2.China编程打开VM虚拟网络编辑器3.1 方法一:点击还原VM

Android WebView无法加载H5页面的常见问题和解决方法

《AndroidWebView无法加载H5页面的常见问题和解决方法》AndroidWebView是一种视图组件,使得Android应用能够显示网页内容,它基于Chromium,具备现代浏览器的许多功... 目录1. WebView 简介2. 常见问题3. 网络权限设置4. 启用 JavaScript5. D

Java捕获ThreadPoolExecutor内部线程异常的四种方法

《Java捕获ThreadPoolExecutor内部线程异常的四种方法》这篇文章主要为大家详细介绍了Java捕获ThreadPoolExecutor内部线程异常的四种方法,文中的示例代码讲解详细,感... 目录方案 1方案 2方案 3方案 4结论方案 1使用 execute + try-catch 记录

Python中Windows和macOS文件路径格式不一致的解决方法

《Python中Windows和macOS文件路径格式不一致的解决方法》在Python中,Windows和macOS的文件路径字符串格式不一致主要体现在路径分隔符上,这种差异可能导致跨平台代码在处理文... 目录方法 1:使用 os.path 模块方法 2:使用 pathlib 模块(推荐)方法 3:统一使

SpringBoot项目启动错误:找不到或无法加载主类的几种解决方法

《SpringBoot项目启动错误:找不到或无法加载主类的几种解决方法》本文主要介绍了SpringBoot项目启动错误:找不到或无法加载主类的几种解决方法,具有一定的参考价值,感兴趣的可以了解一下... 目录方法1:更改IDE配置方法2:在Eclipse中清理项目方法3:使用Maven命令行在开发Sprin

JAVA SE包装类和泛型详细介绍及说明方法

《JAVASE包装类和泛型详细介绍及说明方法》:本文主要介绍JAVASE包装类和泛型的相关资料,包括基本数据类型与包装类的对应关系,以及装箱和拆箱的概念,并重点讲解了自动装箱和自动拆箱的机制,文... 目录1. 包装类1.1 基本数据类型和对应的包装类1.2 装箱和拆箱1.3 自动装箱和自动拆箱2. 泛型2

C# 委托中 Invoke/BeginInvoke/EndInvoke和DynamicInvoke 方法的区别和联系

《C#委托中Invoke/BeginInvoke/EndInvoke和DynamicInvoke方法的区别和联系》在C#中,委托(Delegate)提供了多种调用方式,包括Invoke、Begi... 目录前言一、 Invoke方法1. 定义2. 特点3. 示例代码二、 BeginInvoke 和 EndI

Python中__new__()方法适应及注意事项详解

《Python中__new__()方法适应及注意事项详解》:本文主要介绍Python中__new__()方法适应及注意事项的相关资料,new()方法是Python中的一个特殊构造方法,用于在创建对... 目录前言基本用法返回值单例模式自定义对象创建注意事项总结前言new() 方法在 python 中是一个

Python依赖库的几种离线安装方法总结

《Python依赖库的几种离线安装方法总结》:本文主要介绍如何在Python中使用pip工具进行依赖库的安装和管理,包括如何导出和导入依赖包列表、如何下载和安装单个或多个库包及其依赖,以及如何指定... 目录前言一、如何copy一个python环境二、如何下载一个包及其依赖并安装三、如何导出requirem

MyBatis与其使用方法示例详解

《MyBatis与其使用方法示例详解》MyBatis是一个支持自定义SQL的持久层框架,通过XML文件实现SQL配置和数据映射,简化了JDBC代码的编写,本文给大家介绍MyBatis与其使用方法讲解,... 目录ORM缺优分析MyBATisMyBatis的工作流程MyBatis的基本使用环境准备MyBati