软件安全漏洞分析与发现 复习笔记

2024-06-13 09:12

本文主要是介绍软件安全漏洞分析与发现 复习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1 绪论

  • 本节无考点,仅供了解。





2 基础知识

考点: 汇编码理解和撰写,三种内存地址,不同的页管理方式。windows保护模式可能出题

  • 汇编算法的阅读理解
  • 给出汇编片段,理解其意思,输入->输出
  • 保护模式的内存寻址,现代OS的分页机制
  • x86机器码转换到汇编代码
  • windows内存管理分页模式推导,系统调用
  • ELF动态代码链接延迟绑定(逆向中综合),linux下的系统调用

2.1 处理器硬件架构基础

CPU按照字长可分为16位、32位和64位。


  • 汇编指令细节这里不展开了。下面是考试要求:

    这里给个示例代码:
section .dataarray dd 1, 2, 3, 4, 5  ; 定义一个数组,包含5个元素array_len equ 5         ; 定义数组长度section .textglobal _start_start:xor eax, eax            ; 将 eax 清零,用于存储累加和xor ecx, ecx            ; 将 ecx 清零,用于索引数组元素sum_loop:cmp ecx, array_len      ; 比较索引是否达到数组长度jge end_loop            ; 如果索引 >= 数组长度,跳转到 end_loopadd eax, [array + ecx*4] ; 将当前数组元素的值加到 eaxinc ecx                 ; 索引加1jmp sum_loop            ; 跳回到 sum_loop 开始end_loop:; 这里可以添加其他代码,eax 中已经包含数组元素的累加和; 退出程序mov eax, 1int 0x80

保护模式

  • 实模式没有内存保护机制,任何程序都可以访问系统内的任意内存地址。这导致一个程序可能会覆盖另一个程序的内存,从而导致系统崩溃。
    保护模式内存寻址
    逻辑地址转线性地址


    线性地址转物理地址

1.给定一个逻辑(虚拟)地址,尝试找到它的物理地址
在现代操作系统中,虚拟地址通过分页机制映射到物理地址。这个过程涉及页目录和页表。以下是一个示例过程:

虚拟地址结构(假设 32 位系统):

虚拟地址:0x12345678
页目录索引:虚拟地址的高 10 位(0x12345678 >> 22)
页表索引:虚拟地址的中间 10 位((0x12345678 >> 12) & 0x3FF)
页内偏移:虚拟地址的低 12 位(0x12345678 & 0xFFF)
查找过程:

使用页目录索引查找页目录,找到页表地址。
使用页表索引查找页表,找到物理页框地址。
物理地址 = 物理页框地址 + 页内偏移。

2.使用程序指令无法访问物理地址,那么操作系统是如何修改页目录表和页表
操作系统运行在高特权级别(内核模式),可以直接访问和修改页目录和页表。以下是一个示例过程:

特权级

2.2 反汇编与反编译基础

略。

2.3 Windows 操作系统基础




2.4 Linux 操作系统基础

略。

3 基础分析工具介绍

略。查ppt。

4 程序切片 (重点)

考点程序切片:集中出题。
1、控制流、数据流(可达性(参考ppt中的案例)、活跃变量)和程序依赖图(包括数据依赖和控制依赖)
2、现有的切片方法的应用:基于图可达性的静态切片计算
3、不考察数据流方程
4、最好提前看一下动态切片(方法二)的例子

  • 程序切片
    • 数据流和控制流(和污点分析结合),控制流图(如何画)和程序依赖图的区别
    • 可到达定义(算法,示例)、活性分析(理解概念)
    • 静态切片
      • 数据流方程(不考察,了解即可)
      • 图可达算法
    • 动态切片(往年静态切片为主,说不定会有动态)
      • 基于程序依赖的切片(几种优化方法,和可到达定义的结合)
      • 方法三后不用看




控制流分析



在这里插入图片描述

数据流分析

可到达定义分析(考察计算题)

  • 修正:上图中的语句2 的可到达语句不包括4。



定义集合
我们先确定每个语句的 Gen 和 Kill 集合:

Gen(0) = {0}
Kill(0) = {}
Gen(1) = {1}
Kill(1) = {}
Gen(2) = {2}
Kill(2) = {}
Gen(4) = {4}
Kill(4) = {1}
Gen(5) = {5}
Kill(5) = {0}
Gen(7) = {7}
Kill(7) = {1, 4}
Gen(8) = {8}
Kill(8) = {0, 5}
Gen(9) = {9}
Kill(9) = {2}
路径分析
接下来我们分析从入口到 [9] 的所有路径:

[0] -> [1] -> [2] -> [3] -> [4] -> [5] -> [9]
[0] -> [1] -> [2] -> [3] -> [6] -> [7] -> [8] -> [9]
在每个路径上,我们计算每个语句的 In 和 Out 集合。

路径1: [0] -> [1] -> [2] -> [3] -> [4] -> [5] -> [9]
In(0) = {}
Out(0) = Gen(0) = {0}
In(1) = Out(0) = {0}
Out(1) = Gen(1) ∪ (In(1) - Kill(1)) = {1} ∪ {0} = {0, 1}
In(2) = Out(1) = {0, 1}
Out(2) = Gen(2) ∪ (In(2) - Kill(2)) = {2} ∪ {0, 1} = {0, 1, 2}
In(3) = Out(2) = {0, 1, 2}
Out(3) = In(3) = {0, 1, 2}
In(4) = Out(3) = {0, 1, 2}
Out(4) = Gen(4) ∪ (In(4) - Kill(4)) = {4} ∪ {0, 2} = {0, 2, 4}
In(5) = Out(4) = {0, 2, 4}
Out(5) = Gen(5) ∪ (In(5) - Kill(5)) = {5} ∪ {2, 4} = {2, 4, 5}
In(9) = Out(5) = {2, 4, 5}

路径2: [0] -> [1] -> [2] -> [3] -> [6] -> [7] -> [8] -> [9]
In(0) = {}
Out(0) = Gen(0) = {0}
In(1) = Out(0) = {0}
Out(1) = Gen(1) ∪ (In(1) - Kill(1)) = {1} ∪ {0} = {0, 1}
In(2) = Out(1) = {0, 1}
Out(2) = Gen(2) ∪ (In(2) - Kill(2)) = {2} ∪ {0, 1} = {0, 1, 2}
In(3) = Out(2) = {0, 1, 2}
Out(3) = In(3) = {0, 1, 2}
In(6) = Out(3) = {0, 1, 2}
Out(6) = In(6) = {0, 1, 2}
In(7) = Out(6) = {0, 1, 2}
Out(7) = Gen(7) ∪ (In(7) - Kill(7)) = {7} ∪ {0, 2} = {0, 2, 7}
In(8) = Out(7) = {0, 2, 7}
Out(8) = Gen(8) ∪ (In(8) - Kill(8)) = {8} ∪ {7} = {7, 8}
In(9) = Out(8) = {7, 8}

对于路径1和路径2,我们得出In(9) = {2, 4, 5} ∪ {7, 8} = {2, 4, 5, 7, 8}
综合所有路径 Out(9) = Gen(9) ∪ (In(9) - Kill(9)) = {4, 5, 7, 8, 9}
[9] 处的可到达定义是 {4, 5, 7, 8, 9}。

Soundness(正确性):在数据流分析中,一个分析方法是“sound”的,意味着它不会遗漏任何可能影响程序行为的重要信息。在可到达定义分析中,soundness 意味着所有实际可能到达某点的定义都应该被包含在结果中。
False Positives(误报):在可到达定义分析中,误报指的是分析认为某个定义可达,但实际上在程序执行时不可能达到。一般来说,为了保持正确性,分析方法通常会倾向于保守,即宁愿包含更多的定义(可能的误报),也不遗漏任何实际可达的定义。
该方法是 sound 的,不会遗漏任何可能的定义。由于保守的性质,可能会存在误报,但这是为了确保正确性而做出的权衡。

活性分析(理解概念,不考计算)


程序依赖图



  • 实线:控制流依赖;虚线:数据流依赖;(叉掉的是ppt错了)
  • 新增的红线是数据依赖。
  • PDG 统一不考虑指向自己的依赖边。考试不考 for 循环,换为 while。

程序切片

基于数据流方程求解程序切片(不考)


基于图可达性的静态切片计算(考点)




动态切片





N=1,循环只有一次,所以切片不应该包含7。



第二轮根本执行不到7。红色边需要删除。


方法三之后不看。考试不考。

5 污点分析

考点:污点分析:会应用程序切片的可达性分析等技术。不会出难题,会基于汇编码。

污点传播






  • 用户级监控缺陷:无法跟踪内核指令。许多安全漏洞可能涉及内核态的操作,例如缓冲区溢出、权限提升攻击等。如果监控工具无法跟踪内核态,将无法全面检测和分析这些安全漏洞,可能导致潜在的安全威胁被忽视。






当内存指针本身是污点时:任意地址读、写




6 模糊测试(了解概念即可)

考点: 模糊测试:不会出综合题。重点是AFL。

  • 模糊测试
    • 基本原理
    • AFL基本原理,实现细节(插桩,覆盖率获取)
    • 算法优化(不涉及)











略。。

反馈式模糊测试 AFL





7 符号执行技术(重点)

考点 符号执行:重点考基本思路和方法,会用符号执行分析给定程序。注意动态/静态符号执行的区别,可能会考动态符号执行。混合符号执行的概念。常考题型:执行树。

  • 符号执行
    • 主要做什么
    • 路径表达式
    • 执行树(如何画,经常出现的题型)
    • 动态符号执行(基本概念),与静态的区别,给定输入能否走到指定分支

经典符号执行






路径条件





执行树



注:上图loc:13的z值ppt里有误,以后面的ppt为准。z值此时不需要更新。





过程内分析、过程间分析


动态符号执行(考概念)



并行符号执行(非重点)

选择符号执行(非重点)



8 网络协议逆向分析

考点:考基本概念,可能会结合污点传播(基于分隔符的划分方法)、程序切片(基于字段来源回溯的方法,动态后向数据切片)。最好熟悉这一章三个方法的流程。状态机不考分析题。

  • 网络协议逆向(基本概念)
    • 和污点,切片相关的内容,可能会进行结合
      • 基于分隔符(污点)
      • 基于消息处理指令(调用栈恢复)
      • 基于字段来源回溯(切片)
    • 字段关系识别
    • 密码算法逆向恢复(基本了解)

字段划分








基于分隔符的划分方法





基于消息处理指令上下文差异的划分方法





基于字段来源回溯的划分方法




基于切片的字段来源回溯




字段间关系识别




位置型字段





字段语义恢复








协议状态机恢复



略。

密码运算逆向恢复(了解即可)





9 软件漏洞机理分析

考点: 识别代码中可能触发漏洞的脆弱点。需要掌握ppt中给出的示例

  • 软件漏洞原理
    • 漏洞类型
    • 漏洞分析利用(综合)
    • 防护机制(基本概念)
  • 软件漏洞机理
    • 脆弱点分析
    • 路径分析


  • 漏洞内容略。

10 软件漏洞利用

考点: 会考漏洞利用。不会只靠各类漏洞的概念,需要在理解概念的基础上解题。

  • 软件漏洞利用
    • 最后综合题,ppt中实例
    • 堆中脱链的计算

这篇关于软件安全漏洞分析与发现 复习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1056881

相关文章

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

软件设计师备考——计算机系统

学习内容源自「软件设计师」 上午题 #1 计算机系统_哔哩哔哩_bilibili 目录 1.1.1 计算机系统硬件基本组成 1.1.2 中央处理单元 1.CPU 的功能 1)运算器 2)控制器 RISC && CISC 流水线控制 存储器  Cache 中断 输入输出IO控制方式 程序查询方式 中断驱动方式 直接存储器方式(DMA)  ​编辑 总线 ​编辑

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

【STM32】SPI通信-软件与硬件读写SPI

SPI通信-软件与硬件读写SPI 软件SPI一、SPI通信协议1、SPI通信2、硬件电路3、移位示意图4、SPI时序基本单元(1)开始通信和结束通信(2)模式0---用的最多(3)模式1(4)模式2(5)模式3 5、SPI时序(1)写使能(2)指定地址写(3)指定地址读 二、W25Q64模块介绍1、W25Q64简介2、硬件电路3、W25Q64框图4、Flash操作注意事项软件SPI读写W2

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号

OWASP十大安全漏洞解析

OWASP(开放式Web应用程序安全项目)发布的“十大安全漏洞”列表是Web应用程序安全领域的权威指南,它总结了Web应用程序中最常见、最危险的安全隐患。以下是对OWASP十大安全漏洞的详细解析: 1. 注入漏洞(Injection) 描述:攻击者通过在应用程序的输入数据中插入恶意代码,从而控制应用程序的行为。常见的注入类型包括SQL注入、OS命令注入、LDAP注入等。 影响:可能导致数据泄