Android虚拟机调试器原理与实现

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
简介:

* 本文原创作者:渔村安全,本文属FreeBuf原创奖励计划,未经许可禁止转载

本文主要讲解Android虚拟机动态调试背后涉及到的技术原理,除了JDWP协议细节,还包括任意位置断点、堆栈输出、变量值获取等基础调试功能的具体实现。另外本文提供了一款新的android动态调试工具——AVMDBG,提供调试API接口,支持python脚本扩展。作为android调试技术研究过程中的实验项目,AVMDBG功能尚不完善,开源出来仅供参考,如过有bug或其他疑问反馈欢迎提交issue。

一、Android动态调试方案

在讲解android动态调试实现之前,先回顾下针对apk进行动态调试常用的几种方法,比较下不同解决方案的特点和存在的问题:

1)smali插桩大法,反编译apk后在关键位置插入smali代码,通过打印日志的形式进行调试跟踪。但是这个方法非常繁琐,除了需要编写smali代码外,每次新增日志输出点都需要重新解包重打包,而且经常会遇到apk保护导致解包失败的问题需要解决。

2)IDA在6.6版本以后支持dex文件的动态调试,但是部分功能并不完善,比如监视寄存器变量的值,需要通过watch窗口手动添加并指定类型,而且单步过程中需要留意类型变化,可能导致虚拟机意外崩溃,导致这个问题的原因在后续文章中会分析到。

3)JEB,堪称apk静态分析的神器,在2.0版本以后开始加入动态调试的功能,最新版本同时支持smali代码和native代码的调试,功能可以说非常强大,如果说缺点可能只有一个,和IDA一样都是商业软件,收费不菲。

4)andbug开源项目,5年前的项目原作者已经不再维护,原项目只支持linux环境,动态调试关键功能也有缺失,例如不支持任意代码位置断点等。使用过程中也碰到过一些bug,类似shell的交互方式使用起来并不是很顺手。后来有国内开发者anbc对该项目进行了完善改造,新增函数调用监控功能支持配置文件。

5)android studio+smalidea插件,也是一个非常不错的调试解决方案,作者通过IDE调试器插件的形式支持smali代码的动态调试,使用过程中偶尔会遇到跳行的bug。smalidea插件同样是开源项目,作者的作品还有非常知名的dex反汇编工具baksmali等。

6)xposed类的安卓代码Hook框架,可以通过在函数入口和出口处hook进行调试输出,但同样无法对函数内部代码进行断点输出。类似的项目还有cydia_substrate、frida、ddi等,也都是非常优秀的开源项目。

二、JDWP协议简述

JDWP是JavaDebug Wire Protocol (Java调试线协议)的缩写,简单来讲,就是调试器和目标虚拟机进行调试交互的通信协议,调试器通过JDWP协议来获取JAVA虚拟机中程序的信息或控制目标程序运行状态,比如函数断点设置,线程状态、变量值获取等,而目标虚拟机也在指定事件触发时通过JDWP协议通知调试器进行处理,比如断点事件消息、线程创建消息等。

  [1] JDWP协议交互简图

Android虚拟机虽然和普通java虚拟机存在不少差异,但是它的调试接口同样是基于JDWP协议的,Dalvik虚拟机JDWP服务端的实现源码位于:./android/dalvik/vm/jdwp。androidstudio、eclipse 等IDE的调试功能和DDMS的监控功能也都是基于JDWP协议实现的。

JDWP协议通信要求首先进行握手会话来表明互相的身份,调试器端发送的与虚拟机返回的数据包内容一样,内容为“JDWP-Handshake”,通过验证以后才可以继续后续的会话。

  [2] JDWP协议通信前需要进行握手会话

Android虚拟机的JDWP实现支持adb和socket两种通信方式,可以使用adb的jdwp命令进行端口转发绑定,这样就可以通过socket和调试目标进程进行通讯,命令格式为”adb forwardtcp:[port] jdwp:[pid]”。

JDWP协议的通信会话主要包含2类数据包,分别为Command packet(命令包)与Reply packet(回复包):

1)Command packet:调试器发送给虚拟机用于获取程序状态信息或控制程序运行;虚拟机发送给调试器用于通知事件触发消息。

2)Reply packet:虚拟机发送给调试器用于回复命令包的请求或者执行结果。

JDWP数据包主要包含包头和和数据两部分,包头部分格式长度固定,为11字节,数据部分为可变长度,字段结构由其包头指定的类型决定。下面详解包头各字段的含义:

  [3] JDWP数据包头结构简图

从上图可以看出,命令包和回复包的包头结构基本一致,区别在于最后2个字节,命令包拆分为2个单字节分别表示命令分组和命令序号,在回复包中则用于表示错误码,非0表示命令执行存在错误。

以java7为例说明,JDWP协议按功能划分为18组命令,总计91个不同命令请求,包含了虚拟机、引用类型、对象、线程、方法、堆栈、事件等不同类型的操作命令。JDWP协议支持的命令细节可以参考官方文档,这里不再赘述。

Android虚拟机对JDWP协议的支持实现并不完整,当然调试需要的绝大部分关键命令都是支持的,具体信息可以参考安卓dalvik虚拟机源码:./android/dalvik/vm/jdwp/JdwpHandler.cpp,下图是dalvik虚拟机(以android4.2版本为准)支持的命令请求类型表:

  [4] JDWP协议命令表简图(以android4.2版本支持为准)

虽然上面图表中的命令类型比较多,但JDWP协议本身并不算复杂,按协议标准进行组包请求即可,下面以获取目标虚拟机版本信息的命令“VirtualMachine:version”为例,演示一次JDWP协议的交互通信过程:

  [5] “VirtualMachine:version”命令返回数据的注解

从上图的命令注解中可以看出,“VirtualMachine:version”请求命令没有附加数据,回复包数据中包含5个字段,通信数据包解析过程如下图:

  [6]“VirtualMachine:version”命令通信数据包解析

从上图的解析示意中,我们最终获取到目标虚拟机的版本信息,这中间有2点需要注意:

1)数据包中数据使用大端模式;

2)基本数据类型的内存结构,例如string,使用[长度]+[字符数据]的形式;

下面我们整理下JDWP协议中使用到的其他基本数据类型,在后续的命令请求与数据包解析中都会频繁使用到。其中有些数据类型的长度是由虚拟机实现定义的,比如ObjectID等,可以通过“VirtualMachine:IDSizes”命令进行获取。下图整理的数据类型说明以Android虚拟机的实现为标准:

  [7] JDWP协议使用到基本数据类型

三、动态调试的核心 —— 任意代码位置断点

针对简单apk进行逆向时静态分析就足够胜任,但是碰到下面几种情况的时候,“任意代码位置断点”的动态调试分析则更加合适:

1)需要对代码中的关键参数、变量值进行观察,例如加密后的字符串。

2)对偏底层的公共函数库进行hook输出,快速筛选定位可疑调用,例如API调用监控等。

3)在代码规模比较庞大、调用逻辑比较复杂的情况下,需要使用堆栈跟踪对可疑关键点的调用路径梳理确认。

“任意代码位置断点”功能不单指代码断点的调试事件通知,还会涉及到虚拟机栈结构、寄存器使用、参数变量值获取以及堆栈跟踪等方面的功能,但是其中很多知识点限于篇幅无法在本文中全部讲解透彻,这里推荐两篇关于Dalvik虚拟机的文章可以作为扩展阅读:《深入理解Android之Java虚拟机Dalvik》、《Dalvik虚拟机进程和线程的创建过程分析》。

下面重点讲解断点功能的实现,其中的关键点可以归结为以下几个问题:

1) 如何设置和处理断点事件?

断点设置需要用到的命令是“EventRequest:Set”,该命令支持多种事件请求,包括断点、单步、类加载、方法进出、字段访问、线程、异常等多种事件,设置成功以后目标虚拟机会返回RequestID,并且在事件触发时会发送相应的事件信息给调试器请求处理(Event:Composite),各类事件命令的具体格式可以参考官方文档。下面以断点为例进行讲解事件设置,首先看下事件命令请求的结构字段:

  [8] 断点命令请求的数据包字段结构

上面的断点事件我们只设置了一个过滤器,就是断点位置Location,这个结构体用于指明触发事件的代码位置,包含类型标记,ClassID,MethodID以及代码偏移DexPc。

1.其中的ClassID和MethodID两个字段的值可以通过“VirtualMachine: ClassesBySignature”命令与“ReferenceType: MethodsWithGeneric”命令获取。

  [9] 获取ClassID与MethodId的演示代码

2.代码偏移位置DexPc值可以使用反汇编工具baksmali的“-l”参数获取。下图红圈中的数字就是代码偏移位置。

  [10] backsmali反汇编结果中的代码偏移标记

当虚拟机运行到我们设置的断点位置以后,会发送“Event: Composite”命令给调试器,目标虚拟机发送的命令中会包含线事件类型、请求序号、线程序号以及代码位置等信息,其中请求序号和断点命令返回的请求序号是对应的,调试器可以根据请求序号进行相应后续处理,例如获取线程堆栈、变量值等,最后需要恢复虚拟机的运行状态。断点事件报告的字段结构如下图:

  [11] 断点事件报告的数据包字段结构

2) 如果获取当前函数调用栈信息

通过获取当前线程的调用栈信息可以定位目标函数的调用路径和源头,对于逻辑层次复杂的逆向分析非常有用。对应的JDWP命令为“ThreadReference:Frames”,该命令的请求包与返回包字段比较简单,结构如下:

  [12] “ThreadReference:Frames”命令相关包的字段结构

返回数据为栈帧数组,每一层栈帧信息包含栈帧ID和栈帧位置2个字段,第一层栈帧一般为当前函数,其栈帧ID在后面堆栈获取变量值命令中需要使用。栈帧信息解析后输出的例子如下:

  [13] “ThreadReference:Frames”返回数据的解析结果

3) 如何获取函数参数值与变量值

dalvik虚拟机和普通java虚拟机最大的区别之一应该是dalvik是基于寄存器架构的,可以观察dex反汇编后的smali代码内容,参数传递、变量赋值全部都是对寄存器的操作。关于smali语法与寄存器变量等方面的基础知识,推荐几篇文章作为前置阅读:《smali-Registers》、《smali-TypesMethodsAndFields》、《Smali学习笔记》,本文就不再赘述。

从当前堆栈中获取寄存器值需要使用“StackFrame:GetValues”命令,下面我们解析下该命令的请求包、返回包的字段结构:

  [14] “StackFrame: GetValues”命令的注解

该命令请求中的有几个关键字段需要详细解释:

1)ThreadId,返回包中触发断点事件被挂起的线程ID。

2)FrameId,可以通过“ThreadReference: Frames”命令获取,从返回的栈列表中取第一层栈帧,即可获得的我们需要的当前栈帧ID。

3)Slot,变量偏移位置,这个字段是“StackFrame: GetValues”命中最为关键的字段,对于Debug版的apk可以通过“Method: VariableTable”命令获取,但是逆向分析遇到的几乎都是Release版本,是不包含这些调试辅助信息的,关于参数和变量对应偏移位置slot的计算方法,我们可以尝试从dalvik虚拟机源码中寻找答案。

dalvik虚拟机处理“StackFrame: GetValues”命令的函数为handleSF_GetValues,handleSF_GetValues函数主要负责解析请求包的字段信息,扩展返回数据的内存空间,最后调用dvmDbgGetLocalValue获取变量值。下面我们跟踪slot参数的传递使用过程来分析它的含义。

  [15] dvmDbgGetLocalValue函数的代码解析

从上图的dvmDbgGetLocalValue函数代码解析过程中,我们有以下几点发现:

1) frameId值就是当前栈指针的内存地址,函数调用过程中使用的寄存器(参数与局部变量)相当于此处的内存映射,而slot值就相当于映射偏移索引号。参数使用最后的N个寄存器(内存段高地址),局部变量使用从v0开始的前(M-N)个寄存器(注意参数占用2个寄存器的情况)。

2) Slot偏移值会经过untweakSlot函数处理,这可能是针对Eclipse的变通方案。1000偏移被重定向到0,而0偏移被重定向到参数偏移起始处,在计算slot索引值时需要注意到这一点。

3) 获取变量值支持的几种类型细节如下:

boolean、byte、short、char、int、float类型的变量直接根据slot偏移取值,大小为4字节,占用1个寄存器;

array、object类型根据slot偏移取值为Object指针,查表获得ObjectId返回,大小为4字节,占用1个寄存器;

double、long类型根据slot偏移取值,大小为8字节,占用2个寄存器。

4) IDA的watch窗口指定变量类型取值后可能导致崩溃的原因在这里也可以找到,在进入其他函数调用过程时,没有及时手动修正watch窗口指定的寄存器类型,取值过程由于读取异常抛出导致虚拟机退出。

以下为2个函数的参数与局部变量slot偏移结果的对比,其中一个是普通成员函数,另外一个为静态成员函数,可以通过这两个例子加深对slot计算的理解:

  [16] 普通成员函数参数与变量slot解析

  [17] 静态成员函数参数与变量slot解析

四、全新的android动态调试工具——AVMDBG

AVMDBG是android虚拟机调试技术研究过程中一个实验项目,目前只支持dalvik虚拟机,已实现代码断点、堆栈输出、参数变量值获取等基础功能。

项目地址:https://github.com/cheetahsec/avmdbg

项目说明:AVMDBG的目标是打造一款轻量级的的android虚拟机调试器,底层使用C++编写,通过Python扩展的方式提供调试接口,可以通过编写python脚本实现对安卓app的快速动态调试,当前版本主要提供以下API:

1.bool attach(string&processName);

功能: 附加到目标进程

2.void waitLoop();

功能: 循环等待调试事件

3.bool setBreakPoint(py::dict&breakPoint);

功能: 设置断点事件

4.py::list getStackFrames(ObjectIdthreadId);

功能: 获取当前线程堆栈,可在断点回调函数中使用

5.py::dictgetRegisterValue(py::dict& Context, string& regName, u1varType);

功能: 获取寄存器变量的值,需要指定寄存器名称(V命名或P命名法)以及变量类型

6.py::listgetObjectFieldValues(ObjectId objectId);

功能: 获取对象的成员变量信息,参数为对象ID

7.py::dict getArrayObjectValue(ObjectIdobjectId);

功能: 获取数组类型变量的信息

8.py::str getStringValue(ObjectIdobjectId);

功能:获取字符串String类型变量的值

详细的使用说明可以参考项目文档和测试demo,以下为部分测试代码展示:

  [18] AVMDBG功能测试代码

  [19] AVMDBG测试输出结果

五、参考文档

1)《深入Java调试体系》

2)《Java(tm) Debug WireProtocol》

3)《深入理解Android之Java虚拟机Dalvik》

4)《Dalvik虚拟机进程和线程的创建过程分析》

5)《smali-Registers》、《smali-TypesMethodsAndFields》

6)《Android dalvik虚拟机源代码》


本文转自d1net(转载)

相关文章
|
3月前
|
安全 Android开发 Kotlin
Android经典实战之SurfaceView原理和实践
本文介绍了 `SurfaceView` 这一强大的 UI 组件,尤其适合高性能绘制任务,如视频播放和游戏。文章详细讲解了 `SurfaceView` 的原理、与 `Surface` 类的关系及其实现示例,并强调了使用时需注意的线程安全、生命周期管理和性能优化等问题。
172 8
|
19天前
|
前端开发 数据处理 Android开发
Flutter前端开发中的调试技巧与工具使用方法,涵盖调试的重要性、基本技巧如打印日志与断点调试、常用调试工具如Android Studio/VS Code调试器和Flutter Inspector的介绍
本文深入探讨了Flutter前端开发中的调试技巧与工具使用方法,涵盖调试的重要性、基本技巧如打印日志与断点调试、常用调试工具如Android Studio/VS Code调试器和Flutter Inspector的介绍,以及具体操作步骤、常见问题解决、高级调试技巧、团队协作中的调试应用和未来发展趋势,旨在帮助开发者提高调试效率,提升应用质量。
40 8
|
1月前
|
缓存 Java 数据库
Android的ANR原理
【10月更文挑战第18天】了解 ANR 的原理对于开发高质量的 Android 应用至关重要。通过合理的设计和优化,可以有效避免 ANR 的发生,提升应用的性能和用户体验。
59 8
|
2月前
|
存储 Dart Java
Dart 虚拟机运行原理
【10月更文挑战第20天】Dart 虚拟机通过一系列复杂的机制和操作,确保 Dart 代码能够准确、高效地执行。它为 Dart 语言的广泛应用提供了坚实的基础和可靠的运行环境
32 6
|
2月前
|
XML 前端开发 Android开发
Android View的绘制流程和原理详细解说
Android View的绘制流程和原理详细解说
44 3
|
3月前
|
ARouter 测试技术 API
Android经典面试题之组件化原理、优缺点、实现方法?
本文介绍了组件化在Android开发中的应用,详细阐述了其原理、优缺点及实现方式,包括模块化、接口编程、依赖注入、路由机制等内容,并提供了具体代码示例。
49 2
|
3月前
|
编解码 前端开发 Android开发
Android经典实战之TextureView原理和高级用法
本文介绍了 `TextureView` 的原理和特点,包括其硬件加速渲染的优势及与其他视图叠加使用的灵活性,并提供了视频播放和自定义绘制的示例代码。通过合理管理生命周期和资源,`TextureView` 可实现高效流畅的图形和视频渲染。
264 12
|
2月前
|
Java 调度 Android开发
Android面试题之Kotlin中async 和 await实现并发的原理和面试总结
本文首发于公众号“AntDream”,详细解析了Kotlin协程中`async`与`await`的原理及其非阻塞特性,并提供了相关面试题及答案。协程作为轻量级线程,由Kotlin运行时库管理,`async`用于启动协程并返回`Deferred`对象,`await`则用于等待该对象完成并获取结果。文章还探讨了协程与传统线程的区别,并展示了如何取消协程任务及正确释放资源。
35 0
|
4月前
|
存储 监控 数据库
Android经典实战之OkDownload的文件分段下载及合成原理
本文介绍了 OkDownload,一个高效的 Android 下载引擎,支持多线程下载、断点续传等功能。文章详细描述了文件分段下载及合成原理,包括任务创建、断点续传、并行下载等步骤,并展示了如何通过多种机制保证下载的稳定性和完整性。
132 0
|
5月前
|
SQL 安全 Java
Android经典面试题之Kotlin中object关键字实现的是什么类型的单例模式?原理是什么?怎么实现双重检验锁单例模式?
Kotlin 单例模式概览 在 Kotlin 中,`object` 关键字轻松实现单例,提供线程安全的“饿汉式”单例。例如: 要延迟初始化,可使用 `companion object` 和 `lazy` 委托: 对于参数化的线程安全单例,结合 `@Volatile` 和 `synchronized`
65 6