阅读笔记——《BLEEM: Packet Sequence Oriented Fuzzing for Protocol Implementations》

【参考文献】Zhengxiong Luo, Junze Yu, Feilong Zuo, Jianzhong Liu, Yu Jiang, Ting Chen, Abhik Roychoudhury, and Jiaguang Sun. Bleem: Packet sequence oriented fuzzing for protocol implementations. In 32nd USENIX Security Symposium (USENIX Security 23), pages 4481–4498, Anaheim, CA, August 2023. USENIX Association.
【所属团队】清华大学软件学院软件系统安全保障小组
【团队网站】http://www.wingtecher.com/
【注】本文仅为作者个人学习笔记，如有冒犯，请联系作者删除。

Abstract

1、Introduction

2、Protocol Fuzzing

2.1、Mutation-based Fuzzers

2.2、Generation-based Fuzzers

2.3、Challenges

3、System Overview

3.1、System Under Test (被测系统，SUT)

3.2、Test Initialization

3.3、Workflow

4、Feedback Collector

5、Guided Fuzzing

5.1、Mutation Operators

5.2、System State Tracking Graph

5.3、Guided Sequence Generation

5.4、Packet Instantiation

6、Evaluation

6.1、Implementation

6.2、Experiment Setup

6.3、Coverage Analysis

6.4、Bug-Detection Capability

6.5、Effectiveness of Sequence Generation

7、Related Work

8、Discussion

9、Conclusion

Abstract

在对协议进行模糊测试时，存在无效的反馈机制和协议状态空间探索不充分的缺陷。
本文提出BLEEM，一个面向数据包序列的墨盒模糊测试工具。BLEEM不针对单个数据包的生成，而是生成序列级的数据包。
BLEEM通过分析系统输出序列提供有效的反馈机制，通过采用包括所有相关方在内的状态空间跟踪及时引导模糊测试，并利用交互式流量信息生成具有协议逻辑感知的数据包序列。

1、Introduction

传统模糊测试工具存在以下问题：
- 生成无效的数据包，浪费资源。传统的fuzzers基于预定义的测试模型生成数据包，没有程序反馈。因此，fuzzers不知道生成的输入是否触发了新的程序状态。
  - 现有的解决方法有：
    - 识别成功的请求。通过代码覆盖率或从服务器相应提取的状态码。
    - 保留请求成功的数据包，对其进行变异操作，再输入到系统中进行测试。
  - 这些方法迁移性差，不能跨协议实现。
    - 这些反馈机制需要分析源程序或二进制文件，不能实现黑盒测试。并且这些方法的实现与协议格式紧密相关，不适合测试各种协议。
    - 一些协议的特定验证规则可能使现有的演化过程失效。例如，一些常见的协议，如TLS、DTLS和SSH，在握手过程中使用随机的nonces来防止“重放攻击”，即攻击者通过拦截、记录和再次发送先前的通信数据包来欺骗系统。在这种情况下，对先前请求成功的数据包进行变异操作所获得的新数据包就不可能产生有价值的结果。
- 由于协议是有状态的，被测系统的输入空间受其状态的严格要求。有效地遍历状态空间并覆盖各种状态转换需要精心设计的数据包序列。构造这样的数据包序列涉及到复杂的协议逻辑，例如，按照什么顺序传输数据包以及如何构造它们以保证格式和参数的正确性。
  - 现有的解决办法有：
    - Peach采用用户定义的协议模型，并严格遵循该模型中描述的操作来生成数据包序列。虽然模型涉及的协议逻辑可以得到有效覆盖，但不能执行超出模型范围的逻辑。
    - AFLNet通过对现有数据包进行变异来生成数据包序列。由于不了解协议格式，这些方法在处理高度结构化数据包的协议时难以提供有效的测试用例。
本文提出BLEEM，一个面向数据包序列的墨盒fuzzer，以解决上述问题。
- 首先，本文引入了一种通过分析系统输出的动态反馈机制。协议实现的输出可以抽象出内部协议状态。因此，我们在运行时收集目标系统的输出序列，分析输出中蕴含的语义，从而获得系统内部的状态转换。
- 其次，我们利用这些反馈来指导数据包序列的生成。我们设计了系统状态跟踪图SSTG，它在运行时动态构建，并允许BLEEM绘制已经探索的状态空间。SSTG能够为达到所需状态提供指导，并且引入了用于单个或序列级数据包的突变操作符，支持生成不同状态下的数据包。同时，我们利用从协议的交互流量中提取的信息来生成数据包序列。我们观察到由于协议逻辑是在服务器和客户端中实现的，我们可以根据双方交换的流量生成具有协议逻辑意识的数据包序列，从而保留参数依赖性，避免生成无意义的数据包。
本文贡献如下：
- 设计了一种通用的方法，通过分析系统输出序列来收集反馈。
- 设计了识别状态空间的SSTG来引导模糊测试，并提出了一种基于先验信息的协议逻辑感知的数据包序列生成办法。
- 实现了BLEEM并在广泛使用的协议实现上进行评估。结果表明，BLEEM优于最先进的技术，并且已经检测到许多安全关键漏洞。

2、Protocol Fuzzing

传统的协议模糊测试侧重于测试服务器，即Fuzzer充当客户机，不断生成数据包并将其发送到服务器。根据数据包的产生方式，这些Fuzzers可以大致分为两类：基于突变的和基于生成的。

2.1、Mutation-based Fuzzers

基于突变的Fuzzers通过随机改变从种子池中选择的测试用例来生成新的测试用例。它们不需要事先了解协议规范和消息格式，因此易于实施。
这些Fuzzers擅长测试无状态程序，如文件处理应用程序。为了实现测试，研究人员通常只针对特定的服务器状态进行测试，或简单地将发送到服务器的输入串联在一起。、
为了获得更好的性能，AFLNet在传统的fuzzers中增加了反馈回路，使fuzzers能够跟踪每个输入的执行信息，并保留有趣的输入以供进一步利用。此外，它还通过分析服务器响应中的状态码来感知状态。然而，面对高度结构化数据包的协议时，这种随机变异生成数据包的测试方法就变得不适用了。此外，这些反馈机制也不适用于黑盒模糊测试。