引言
本文首发于携程技术公众号 干货 | Trip.com APP 启动优化实践
本文是个人对启动的一点总结,细节不会披露太多,如需了解更多可私信。
App启动是用户对我们 Trip.com App的第一印象,对于用户体验尤为重要,所以我们花了很多时间在启动时间的优化上。
下面我们会先分析App启动的过程,在了解启动流程的基础上制定大的优化原则和小的具体方案,希望对大家有所帮助。
App启动的流程分析
想做启动优化,那就先要了解清楚启动的各个流程,然后才能针对各个环节去做针对性措施。
借用WWDC对启动阶段的定义图
System Interface
- 加载App可执行文件
Load dylibs
加载动态链接器
dyld
,dyld
会递归加载App依赖的动态库,然后执行符号绑定Rebase
,Bind
。一般应用会加载 100 到 400 个 dylib 文件,幸运是大部分是系统库,且系统会在操作系统启动时会计算和缓存系统动态库。Apple为了解决安全问题,引入
ASLR
和Code Sign
,如果不作符号修正,程序将没法正常运行,所以会有Rebase和Bind过程。Rebase
在镜像内部调整指针的指向,其实就是将内部指针都加上偏移量(Slide=实际新地址-旧地址)
Bind
修正指外部的指针,比如上图中malloc,这个符号不存在于我们App的Mach-O中,需要从外部的镜像中获取,这时候就需要Bind操作把这个关联起来。
libSystem init
调用系统的的一些初始化方法,这部分一般时间比较固定,可以不用太关注。
Runtime Init
Objc和Swift的初始化
通过
_dyld_objc_notify_register
注册回调,在image加载完时初始化语言相关。加载category
在上面语言初始化完之后,会加载所有category,处理category的所有方法,协议和属性等。
调用所有+load
也是通过向dyld 注册回调,在image加载完时,通过
load_images
触发,处理该image相关的所有+load方法,按照继承层级依次调用:父类+load→子类+load→category +load,注意category的+load不会覆盖原类。调用C++的构造函数属性函数
attribute((constructor))
UIKit Init
- 实例化 UIApplication 和 UIApplicationDelegate
- 开始事件处理和系统集成
Application Init
这部分是我们熟悉的UIApplicationDelegate的几个生命周期调用:
- application:willFinishLaunchingWithOptions:
- application:didFinishLaunchingWithOptions:
- applicationDidBecomeActive:
- scene:willConnectToSession:options:
- sceneWillEnterForeground:
- sceneDidBecomeActive:
Initial Frame Render
这里是App渲染第一帧,主要做了创建、布局和绘制视图的工作,并把准备好的第一帧提交给渲染层渲染。这里面布局计算,图片解码,图层树的递归commit到Render Server等都是可能影响耗时的点,所以要特别注意。
Extended
这里按照苹果的定义,是异步获取数据展示界面的逻辑。比如我们首页要从网络请求数据然后展示最新数据在页面上。
针对启动的各个流程我们能做什么
总体原则
不管哪个流程,我们都想尽量遵循下面两个原则:
删
删的原则是指,对App启动和运行不是必须的任务,或者跟首页渲染第一帧无关的任务,都从启动流程中删除。对于删除的任务,可以进行懒加载的形式,需要时再调用;也可以换到其他的时机去触发,比如首页渲染完之后。
压
压的原则是指,对App启动和运行必须的任务,或者直接影响首页渲染第一帧的任务,都尽可能压缩其运行时间。至于做法,可以是优化方法内的实现,使其运行更快;也可以将方法执行的线程切换到子线程,以并发的形式降低其对整个启动过程的影响。
具体方案
减少动态库
动态库的加载在启动阶段是必须的,所以我们要尽量减少非必要的动态库。针对这个,我们做了以下几点:
梳理所有动态库,将用不到的或者可以简单替代的动态库删除
可以通过
otool -L xxx.app/xxx
或者打开打包后的在产物的xxx.app/Frameworks路径中找到所有动态库,逐个筛选,将其中可以废弃和替代的动态库删除。通过推进社区(第三方SDK)将现有动态库转成静态库
因为依赖了第三方SDK,我们是不包含的源码的,所以这部分我们需要推进社区提供静态库的版本,或者通过cocoapods等工具打包SDK的静态库版本。
将我们自己的SDK编译成静态库
对于我们自己的SDK,因为有源码,所以直接修改
MACH_O_TYPE
为Static Library
重新打包即可。App最低支持系统版本升级到12.2
因为iOS在12.2版本及以上才内置了Swift的支持,所以在此之前Swift的动态库都是随着App下发的,也在xxx.app/Frameworks 里。
当然,这个决策是会直接应用到用户和订单的,所以是要有数据支持的,我们是根据用户占比到达某个阈值才支持12.2的。如果允许,甚至可以升级到iOS 13,因为iOS13以上dlyd3做了很多加载和缓存的优化。
删除无用代码
如果符号越多,很显然Rebase和Bind的处理时间就会越长,Objc的初始化也受影响,所以我们需要尽可能减少代码:
- 通过逆向二进制或者生成linkmap,解析所有方法(TEXT.text)和引用到的方法(DATA objc_selrefs),找出无用方法删除
- 解析所有类(DATA.objc_classlist)和引用到的类(DATA.objc_classrefs),找出无用的类删除
- 使用第三方工具或者clang扫描重复代码,精简去重
- 使用
LLVM_LTO
和GCC_OPTIMIZATION_LEVEL
等其他编译选项优化二进制大小
合并category
合并category,可以减少category加载时的耗时。不过这部分收益不大,并且也会影响编程习惯,所以我们并没有投入很多时间,不再赘述。
删除+load
以前会有很多代码为了省事,加到了+load中,这部分很显然占用启动时间,所以尽量要把这其中的代码转移,可以放到initialize中懒加载,或者放到启动任务中并发执行,这样尽量减少这部分的影响。
Xcode调试时,可以通过正则添加所有+load方法的断点br s -r "\+\[.+ load\]$"
,然后使用br list
打印出所有+load列表,这样方便我们定位所有+load。
UIApplication子类优化
为了减少UIKit Init的时间,可以对UIApplication的子类初始化工作优化。我们这部分不存在,所以没有做什么工作。
启动任务并发
想象以下,如果application:didFinishLaunchingWithOptions:
里面执行的所有启动任务不作任何处理,那么代码框架将会很乱,你的优化也只能单点单点去做。
所以我们将application:didFinishLaunchingWithOptions:
阶段所有方法任务化,一个任务做一种类型的事。任务拆分好之后,就可以根据任务之间的相关性,选择哪些任务是可以并发执行,哪些任务是必须有依赖关系前后执行。
以前:
现在:
当然,任务的拆分颗粒度也很重要,拆分太粗的话,很难达到最优的组合,可能一个任务里的方法之间仍然有并行的空间。拆分太细的话,也有可能导致同一时间并发数太多,造成额外的线程切换开销。
I/O处理
尤其要注意启动阶段的I/O,一般出现于读取磁盘中的文件,比如配置文件等。
使用Instrument→App Launch 去查看启动过程就会发现,如果主线程执行出现很多灰色的块,那就是I/O,找到这些I/O产生的方法,尽量在子线程并发执行,避免阻塞主线程。
首页数据的预加载和懒加载
首页上有很多数据要加载,比如图片,上次缓存在本地的数据等等,这些数据的加载如果在写代码时不作特殊处理,那会在主线程执行,不知不觉就会有很多耗时
预加载
对首页渲染必须的数据,比如一个icon,或者一个翻译的数据,我们通过在启动任务(之前提到的拆分的并发任务)中新增加一个预加载启动任务,专门负责在
application:didFinishLaunchingWithOptions:
的过程中并发执行数据的获取。因为获取数据大多比较耗时,所以放在子线程充分利用启动阶段的空闲。同时这类任务大多数是I/O操作,并不会占用太多CPU资源。更进一步,其实可以对首页用到的资源在运行时作个标记,记录到磁盘,下次启动的时候读取这个记录,对用到的资源进行提前预加载,这样避免hard code很多资源名在代码中。
懒加载
首页的数据往往很多,但并不是一开始要全部用到。可以对数据作区分,和第一屏展示无关的,使用懒加载,真正用到的时候再去加载。
二进制重排
page fault
由于虚拟内存的机制,应用启动时不会把所有数据加载到内存,而是以页为单位逐步从磁盘中加载,内存中的虚拟地址和磁盘中的物理地址有个映射关系。当程序执行时,如果发现要访问的东西不在内存里,就会触发一次
page fault
,去磁盘中加载新的一页。启动阶段有很多方法要调用,而这些方法在Mach-O中的的位置又是在编译时确认的。如果有10个方法刚好在不同页,可能就要产生10次
page fault
。
二进制重排要做的就是将启动阶段要用到的方法,在编译时提前确定,通过.order文件告诉编译器,这样这些方法会排布在Mach-O的最前面,之前的10次page fault
和可能就变成一两次page fault
。
通过在Other C Flags中添加-fsanitize-coverage=func,trace-pc-guard
再通过__sanitizer_cov_trace_pc_guard
记录启动阶段所有方法的调用,再将这些写入到.order文件中,在Xcode的ORDER_FILE
设置中配置即可生效。
通过测试,我们的二进制重排大概优化100-200ms。
其他通用手段
针对启动任务和首页渲染阶段,通用的手段是通过instrument,profile出耗时长的任务,对任务针对性地作方法优化。如果有的方法是第三方库的,那就需要推进社区去更新。我们在做的过程中就给Firebase和Google的一些SDK提了很多issue,幸运的是对方开发人员配合很积极,对我们帮助很大。
成果如何
通过长期的优化,以上手段全部用完之后,我们的启动时间从原来的2秒,优化到1秒以内。
总结
在优化启动时间的过程中,我们的收获不仅是对启动时间的优化,也对系统的启动机制有了更深的了解,同时优化了我们自己的代码,使其变得更加更加健壮和高性能。