热修复技术对比及阿里百川HtFix 2.0深入剖析

简介: 近两年来,热修复技术在安卓开发圈儿成为焦点。随之而来的是,相关的解决方案也不断涌现。为此,本文将热修复的几大流派分别做较深入的阐述,以使关注这一技术的开发同学有更深的了解。
近两年来,热修复技术在安卓开发圈儿成为焦点。随之而来的是,相关的解决方案也不断涌现。为此,本文将热修复的几大流派分别做较深入的阐述,以使关注这一技术的开发同学有更深的了解。

在正式切入话题之前,我们先来看看传统的开发流程究竟有哪些痛点。概括之,可以用三个“太”来描述:1.重新发布版本的代价太大;2.用户下载安装的成本太高;3.BUG修复不及时造成用户体验太差。

正因为如此,热修复技术才得以施展,并被广大开发者追捧。那么,热修复开发流程具有怎样的优势?总结起来,也有三点。

第一, 无需重新发版,而且实时高效。
第二, 用户对修复过程无感知,也无需下载新的应用,总之,代价非常小。
第三, 修复的成功率高,可以吧损失降至最低。

哎呀,热修复技术真是棒棒哒。但是热修复技术虽好,可不能“贪杯”,毕竟流派较多,哪款才适合呢?

目前,市面上主流的几个热修复流派有这些,阿里andfix、美团Robust、QQ空间和微信Tinker。那,咱们就一起来看看这些技术方案都有哪些优缺点?

阿里andfix   

hook本地方法. 并没有整体替换class。1. 打开链接库得到操作句柄, 获取native层内部函数, 得到classobject对象. 2. 修复访问权限属性为public 3. 得到新旧方法的指针, 新方法指向目标方法, 实现方法的替换

优点:1. 不侵入打包, 性能无损耗;2. 即时生效。

缺点:1. 需要针对dalvik虚拟机和art虚拟机做适配,需要考虑指令集的兼容问题,需要native代码支持,兼容性上会有一定的影响; 2. 不支持新增类方法/字段,以及修改<init>方法,也不支持对资源的替换。

美团Robust   

类似Instant Run原理, 每个产品代码的每个函数都在编译打包阶段自动的插入了一段代码。

客户端拿到patch.dex后,用DexClassLoader加载patch.dex. 其中的changeQuickRedirect字段赋值为用patch.dex中的StatePatch.java这个class new出来的对象。这就是打patch的主要过程。

优点:正常的使用DexClassLoader,兼容性高,未反射注入,实时生效。

缺点:1. 原来能被ProGuard内联的函数不能被内联了,所以可能导致方法数的增加,原来没超过65536但是后面可能就操作了65536限制,同时apk的体积也会一定程度的增大;2. so和资源的替换暂时不支持;3. 侵入式打包。

QQ空间       

类似Multidex, 注入, 插桩. 大致的过程就是:把BUG方法修复以后,放到一个单独的DEX里,插入到dexElements数组的最前面,让虚拟机去加载修复完后的方法。

davilk: 但是有一个问题是,当两个调用关系的类不在同一个DEX时,就会产生异常报错。我们知道,在APK安装时,davilk虚拟机通过dexopt将classes.dex优化成odex文件,然后才会执行。在这个过程中,会进行类的verify操作,如果调用关系的类都在同一个DEX中的话就会被打上CLASS_ISPREVERIFIED的标志,然后才会写入odex文件。所以,为了可以正常的进行打补丁修复,必须避免类被打上CLASS_ISPREVERIFIED标志,具体的做法就是单独放一个类在另外DEX中,让其他类调用。但是虽然阻止了被打上CLASS_ISPREVERIFIED标志, 但是运行时加载类做verify与optimize所以效率低下. 特别是应用刚启动的情况下需要加载大量类的情况下就会花不少时间。

art: Art采用了新的方式,插桩对代码的执行效率并没有什么影响。但是若补丁中的类出现修改类变量或者方法,可能会导致出现内存地址错乱的问题。为了解决这个问题我们需要将修改了变量、方法以及接口的类的父类以及调用这个类的所有类都加入到补丁包中。

优点:兼容性高

缺点:1. 不支持实时生效;2. avilk下类加载性能问题;3. art下补丁包包很大;4. 侵入式打包。

微信Tinker   

dex merge,微信针对QQ空间超级补丁技术的不足提出了一个提供DEX差量包,整体替换DEX的方案。主要的原理是与QQ空间超级补丁技术基本相同,区别在于不再将patch.dex增加到elements数组中,而是差量的方式给出patch.dex,然后将patch.dex与应用的classes.dex合并,然后整体替换掉旧的DEX,达到修复的目的。

优点:1. 自研DexDiff算法, 深度利用Dex的格式来减少差异的大小。它的粒度是Dex格式的每一项,可以充分利用原本Dex的信息,而BsDiff的粒度是文件 补丁包足够小。2. 有效防止了qq空间导致的加载效率下降问题。3. 侵入式打包。

缺点:1. 不支持即时生效;2. 需要给应用开启新的进程才能进行合并,并且很容易因为内存消耗等原因合并失败;3. 合并时占用额外磁盘空间,对于多DEX的应用来说,如果修改了多个DEX文件,就需要下发多个patch.dex与对应的classes.dex进行合并操作时,这种情况会更严重。

这里来一张图,一目了然~~
367dc4f9c96a92e19a4cbd7c68281229f02bd87b
咦,这表格里面怎么多了一个东东?百川HotFix是什么鬼?

阿里百川HotFix

百川HotFix是在阿里AndFix的基础上,增加了补丁管理后台。我们可以在下面的图中看到我们的服务后台功能,可以上传补丁。补丁必须跟版本号绑定,同时提供了补丁控制功能, 比如停止发布/继续发布/灰度/全量发布等功能。 

同时HotFix基于手淘的实践针对andfix做了大量优化,性能上提高了兼容和稳定性,功能上比如支持新增类和基于类方法作为粒度所以有更小的补丁包,开源的andfix补丁包是以类作为粒度。

事实上,阿里百川HotFix也在不断演进之中,最新的2.0版已经突破了很多限制,比如,不支持资源修复,so修复;不支持新增类方法/类字段等。现在这些都不是问题啦,而且它还在依然在不断进化!

相较于最初的1.X版本,阿里百川HotFix  2.0可谓发生了“翻天覆地”的变化。有哪些?请看。

* 将1.x版本的所有限制全部取消;
* 不仅仅只基于AndFix而是自由切换方案;
* 不管资源/SO文件/类修复都能做到实时生效;
* 傻瓜式接入, 完全不侵入你的打包过程, 可视化UI界面打补丁。

这么一个好东东究竟啥时候有啊?别急,2017年1月中旬就会上线,到时候就可以“你有我有全都有了!”

另外,阿里百川HotFix还有一些“计划”。

1、更小的补丁包,比如尝试so和资源文件做bsdiff。
2、支持四大组件的代理。
3、更好的性能和稳定兼容性。

你以为这样就完了?No,下面再给大家分享一下阿里百川HotFix的一些具体修复方案。

百川Hotfix2.X 类修复方案

补丁工具检测补丁冷部署or热部署

* 由于热部署andfix修复正在运行的方法有crash的风险, 所以补丁工具提供参数由业务方来决定是否尝试走热部署, 如果用户patch的方法没有被高频调用同时又有实时生效的需求, 那么可以优先选择走热部署方案

热部署 ->andfix支持的代码变更

* 此时走优化后的andfix方案
> 也就是目前hotfix1.0的方案

冷部署 ->andfix不支持代码变更

* davilk下hack本地方法native层绕过dvmresolveclass
> patch dex追加到PathClassLoad的dexElements中, 同时我们知道插桩的解决方案会影响到运行时性能的原因在于:app内的所有类都预埋引用一个独立dex的空类,导致安装dexopt阶段的preverify失败,运行时将再次verify+optimize. 所以我们选择了hack本地方法native层绕过dvmresolveclass方法的方式。 

* art下直接合成dex,采用手淘目前成熟的art动态部署方案 
> 不同于微信tinker的dex merge方案, dex merge其实很占用应用内存, 所以最终会导致dex merge失败, 实际上art上默认已经支持多dex的合并, 我们只需要把patch dex跟原来apk中的dex合并成完整的新dex, 然后去替换PathClassLoad的dexElements即可.

阿里百川Hotfix2.X SO文件修复方案

* art下预load原来so, 再load补丁so
* davilk下预load补丁so, 再load原来的so 
* 关键:  综合机型支持的abis和补丁包中的abis共同决定补丁so的新libPath

davilk和art下so文件加载的方式不一样, 导致了需要区分art和davilk做不同的处理. 实际上我们还有另外一个so补丁的方案, 这里暂时不对外透露 

更好的性能

* SOPatchManager.load(String libPath) ->代替  System.load(String pathName)
* SOPatchManager.loadLibrary(String libName) ->代替  System.loadLibrary(String libName)

我们知道一个so文件如果load两次那么本地内存的使用会变大. 所以我们提供了替代System加载so文件的方法, 我们建议所有的so文件加载都通过这个方法, 那么加载so文件的时候只会尝试去加载指定目录下去的补丁so, 而不会去加载安装apk中的so文件

阿里百川Hotfix2.X 资源文件修复方案

Android资源文件的特点

* 资源id编码于resources.arsc文件中,排布紧密。按照排布顺序进行自动编号
* res目录保存所有带id的资源文件。布局文件为二进制形式的xml文件,xml以资源id的方式引用其他资源
* assets目录存放所有原始文件,不带id
* aapt进行资源的构造,包括自动分配资源id与R文件的生成,默认情况下,每次编译不保证和之前包中的id一致

目前市面上普遍采用的三种方式。

* 差量合成完整的资源包,运行时完整加载资源。 缺点:合成资源占用时间和内存,容易引起卡顿。
* 修改aapt,对以后可能新增的资源提前留空,运行时patch包中新增资源id对应留出的位置。 缺点:需改变打包流程,修改代码并编译替换sdk中的aapt。打包侵入太强,且留空占用一定磁盘空间。留空多少是预先定好的,无法改变。
* 插件化,组件化资源。 缺点:资源需要划分模块,提前规划。杀鸡焉用牛刀?

一个优秀的资源热修复方案应该做到:

* 补丁包尽可能地小。加载补丁迅速,性能好,内存和时间消耗极小。
* 不改变打包流程,保持sdk工具链的完整性。
* 开发透明,开发者无感知。不需要事先固定资源id。
* 方便易用,傻瓜式操作。一键完成patch工作。

阿里百川资源热修复

* 直接基于新旧两个apk来构造补丁包,不需要改造aapt,对编译过程无要求。
* 精确比较各个资源id的使用情况,最大程度利用原先基线包资源,补丁包中只包含新增和修改的资源。
* 运行时无需合成操作,快速应用生效。不影响性能。
* 不仅仅是简单修复,对于任意程度、乃至天翻地覆的修改都能适用。只是补丁文件会比较大。
* 使用方便,只需要选取新旧两个apk,一键生成补丁。
* 兼容Android所有机型,稳定性好。
* 配合类修复方案, 我们能够做到资源修复的实时生效

需要注意的地方

* 如果事先自己做了资源混淆,需要保证新旧包混淆的关系保持一致,否则打补丁时会找不到原来基线包中资源,而将非新增资源视为新增资源,导致补丁包变大。
* 建议每次打包时设置去除无用的资源。这样即可以减小包大小,同时也保证补丁包中新增资源都是有用的。
* AndroidManifest中引用的资源无法改变。有些资源如icon是安装时固定的,目前所有补丁方案都无法进行改变。而另一些资源,如Theme,我们可以提取AndroidManifest中的资源信息,通过代码的方式进行设置。

阿里百川HotFix管理后台服务
  
* 补丁灰度发布/正式发布  
> 发布前可以通过本地/扫码两种方式验证之后再发布上线, 本地补丁模式是指补丁可以放到任何一个指定的目录下即可. 扫码模式是扫描二维码生成一个下载url, 然后直接下载这个时候不需要和服务器验证身份.  灰度发布指定具体的用户数然后随机推送

* 补丁回滚  
> 回滚到目标补丁版本, 所有该应用版本下的设备都会回滚到目标补丁的版本。

* 补丁安全
> 1. 平台托管RSA秘钥  2. 补丁加载安全签名校验

我们后续提供的服务

* 补丁自定义平台无关AES秘钥
> 更安全, 此时打补丁的时候用户可以填入自定义AES秘钥, 然后SDK初始化的时候填入这个秘钥即可. 我们阿里百川平台完全不知道你的秘钥, 所以你们的补丁在我们的后台是绝对安全的. 

* 补丁条件下发 
> 1. 分系统版本 比如一个bug只在android5.0上复现, 那么可能只想对android5.0下发补丁
> 2. 分渠道  比如只想对某个具体的渠道, 豌豆荚/小米不同的渠道进行分发 
> 3. 自定义TAG 上述几个是默认提供的条件, 当然我们提供了更加自由的方式, 你可以对任何一个补丁打tag, 然后客户端只能请求下载到后台指定tag的补丁.   

* 实时显示补丁加载成功率等数据
> 后续可能会上报补丁加载失败详情, 方便排查问题. 

* 一键清除补丁  
> 使用回滚功能必需要具备一下几个条件:1. 当前的版本已停止发布 2. 该版本之前存在至少一个历史版本 所以如果第一个补丁就下发错误的话, 补丁回滚就无能为力了, 所以我们提供一键清除补丁的功能。

好了,分享就到这里了,干货还是很多的,大家慢慢消化吧~~~
目录
相关文章
|
人工智能 自然语言处理 安全
国内首发,阿里云魔搭社区上架百川智能Baichuan 2系列模型
国内首发,阿里云魔搭社区上架百川智能Baichuan 2系列模型
1080 0
|
4月前
|
人工智能 架构师 IDE
阿里云通义灵码重磅升级,能自主修BUG、开发应用的AI程序员来了
通义灵码AI编程能力再进化,说几句话就能开发网页
6759 9
|
6月前
|
Web App开发 Shell Python
重磅来袭!MoneyPrinterPlus一键发布短视频到视频号,抖音,快手,小红书上线了
一键发布短视频到视频号,抖音,快手,小红书,MoneyPrinterPlus解放你的双手。
重磅来袭!MoneyPrinterPlus一键发布短视频到视频号,抖音,快手,小红书上线了
|
7月前
|
人工智能 运维 开发者
CodeFuse 开源官网上线啦~
CodeFuse是一个致力于开发大型代码语言模型以支持软件全生命周期的项目,涵盖设计、编码、测试等阶段,旨在提供创新的解决方案,优化开发者体验。其开源官网提供项目背景、相关AI开发项目展示、详细文档及贡献指南。团队已推出多个代码模型和开源工具,并在相关领域有学术成果和行业奖项。感兴趣者可通过GitHub、HuggingFace和魔搭社区主页联系或关注。
109 0
CodeFuse 开源官网上线啦~
|
8月前
|
机器学习/深度学习 人工智能 异构计算
阿里等发布基于3D的人物图片转视频模型Champ
【4月更文挑战第21天】阿里联合南京大学、复旦大学发布创新模型Champ,实现3D人物图片转视频的突破。Champ运用SMPL模型与潜在扩散框架,提升形状对齐和运动引导能力,生成高质量人物动画,尤其擅长捕捉姿势和形状变化。模型通过细节处理增强面部表情和手指动作等细节,但面部和手部建模仍有提升空间。研究团队已进行效率优化,推动实际应用。[项目地址](https://fudan-generative-vision.github.io/champ/#/) | [论文地址](https://arxiv.org/abs/2403.14781)
138 1
|
消息中间件 自然语言处理 Cloud Native
基于大语言模型的 AIGC学习助手,重磅上线云原生消息社区!
你是否不知道怎么开始上手学习RocketMQ 5.0?不清楚从哪里找示例代码?是不是也经常找不到原理文档?
|
机器学习/深度学习 算法 测试技术
蚂蚁集团开源代码大模型CodeFuse!(含魔搭体验和最佳实践)
蚂蚁集团在刚刚结束的2023外滩大会上开源了代码大模型CodeFuse,目前在魔搭社区可下载、体验。
|
人工智能 自然语言处理 算法
|
人工智能 自然语言处理 开发者
国内首发,百川13B大模型上架魔搭
国内首发,百川13B大模型上架魔搭
重磅升级|云效BizDevOps产品焕新亮点一览
10大亮点,覆盖业务、产品、技术多种角色
344 0
重磅升级|云效BizDevOps产品焕新亮点一览