使用配置文件引導(dǎo)優(yōu)化(PGO)

原文:https://source.android.com/devices/tech/perf/pgo

Android編譯系統(tǒng)支持在具有blueprint構(gòu)建規(guī)則的Android native 模塊上使用Clang的配置文件引導(dǎo)優(yōu)化(PGO)煎楣。本文描述Clang PGO如何持續(xù)生成和更新用于PGO的配置文件,以及如何將PGO與編譯系統(tǒng)集成(使用用例)太援。

關(guān)于Clang PGO

Clang可以使用兩種類型的配置文件執(zhí)行配置文件引導(dǎo)優(yōu)化:

  • 基于檢測的配置文件是從檢測的目標程序生成的寺擂。這些配置文件很詳細漾橙,并且會產(chǎn)生高運行時開銷杈帐。
  • 基于采樣的配置文件通常通過采樣硬件計數(shù)器來生成闰蛔。它們會產(chǎn)生低運行時開銷僵控,并且無需對二進制文件進行任何檢測或修改即可收集香到。它們沒有基于檢測的配置文件詳細。

所有配置文件應(yīng)該從應(yīng)用程序的典型行為的代表性工作負載生成报破。雖然Clang同時支持基于AST的(-fprofile-instr-generate)和基于LLVM IR的(-fprofile-generate)悠就,Android僅支持基于LLVM IR的基于檢測的PGO。

構(gòu)建配置文件集合需要以下標志:

  • -fprofile-generate用于基于IR的儀器充易。使用此選項梗脾,后端使用加權(quán)最小生成樹方法來減少檢測點的數(shù)量并優(yōu)化它們在低權(quán)重邊緣的位置(對于鏈接步驟也使用此選項)。Clang驅(qū)動程序自動將運行時配置(libclang_rt.profile-*arch*-android.a)傳遞給鏈接器蔽氨。該庫包含在程序退出時將配置文件寫入磁盤的例程藐唠。
  • -gline-tables-only 用于基于采樣的配置文件收集,以生成最少的調(diào)試信息

配置文件可使用-fprofile-instr-use=*pathname*-fprofile-instr-use=*pathname*來用于PGO鹉究,分別對應(yīng)基于檢測的配置文件和基于采樣的配置文件宇立。

注:當對代碼進行更改時,如果Clang無法再使用配置文件數(shù)據(jù)自赔,則會生成 -Wprofile-instr-out-of-date警告妈嘹。

使用PGO

使用PGO涉及以下步驟:

  1. 通過傳遞-fprofile-generate給編譯器和鏈接器來構(gòu)建帶有檢測的庫/可執(zhí)行文件 。
  2. 通過在檢測二進制文件上運行代表性工作負載來收集配置文件
  3. 使用該llvm-profdata實用程序?qū)ε渲梦募M行后處理(有關(guān)詳細信息绍妨,請參閱處理LLVM配置文件)润脸。
  4. 通過傳遞-fprofile-use=<>.profdata給編譯器和鏈接器來將配置文件應(yīng)用于PGO 。

對于Android中的PGO他去,應(yīng)該離線收集配置文件并與代碼一起檢查以確北醒保可重現(xiàn)的構(gòu)建。配置文件可以用作代碼演變灾测,但必須定期重新生成(或者每當Clang警告配置文件是陳舊的時)爆价。

收集配置文件

Clang可以使用通過運行基準測試收集的配置文件,使用庫的檢測構(gòu)建媳搪,或者在運行基準測試時通過采樣硬件計數(shù)器铭段。目前,Android不支持使用基于采樣的配置文件集合秦爆,因此您必須使用經(jīng)過檢測的構(gòu)建來收集配置文件:

  1. 確定基準和由該基準共同行使的一組庫序愚。
  2. 添加pgo屬性到基準和庫(詳細信息如下)。
  3. 使用以下方法生成帶有這些庫的檢測副本的Android構(gòu)建:
make ANDROID_PGO_INSTRUMENT=benchmark

*benchmark*是一個占位符等限,用于標識在構(gòu)建期間檢測的庫集合爸吮。實際的代表性輸入(以及可能與被基準測試的庫鏈接的另一個可執(zhí)行文件)并非特定于PGO芬膝,超出了本文檔的范圍。

  1. 在設(shè)備上Flash或同步已檢測的構(gòu)建拗胜。
  2. 運行基準測試以收集配置文件蔗候。
  3. 使用該llvm-profdata工具(下面討論)對配置文件進行后處理,并準備好將其簽入源樹埂软。

在構(gòu)建期間使用配置

在Android樹中檢查配置文件toolchain/pgo-profiles锈遥。該名稱應(yīng)與庫profile_filepgo屬性的子屬性中指定的名稱匹配 。構(gòu)建庫時勘畔,構(gòu)建系統(tǒng)會自動將配置文件傳遞給Clang所灸。該ANDROID_PGO_DISABLE_PROFILE_USE 環(huán)境變量可以被設(shè)置為true來暫時禁用PGO和衡量其性能優(yōu)勢。

要指定其他特定于產(chǎn)品的配置文件目錄炫七,請將它們附加到BoardConfig.mk里的make變量PGO_ADDITIONAL_PROFILE_DIRECTORIES中爬立。如果指定其他路徑,這些路徑配置文件覆蓋在toolchain/pgo-profiles中的路徑万哪。

使用dist目標來make生成發(fā)布映像時侠驯,構(gòu)建系統(tǒng)會將缺失的配置文件的名稱寫入$DIST_DIR/pgo_profile_file_missing.txt。您可以檢查此文件以查看意外刪除的配置文件(靜默禁用PGO)奕巍。

在Android.bp文件中啟用PGO

要在Android.bp文件中為native 模塊啟用PGO 吟策,只需指定pgo屬性即可。此屬性具有以下子屬性:

屬性 描述
instrumentation PGO使用檢測則設(shè)置為true的止。默認是 false檩坚。
sampling 目前不受支持。PGO使用采樣設(shè)置為true诅福。默認是false匾委。
benchmarks 字符串列表。如果在ANDROID_PGO_INSTRUMENT構(gòu)建選項中指定了列表中的任何基準氓润,則構(gòu)建此模塊用于分析赂乐。
profile_file 用于PGO的配置文件(相對于toolchain/pgo-profile)。構(gòu)建通過添加此文件至$DIST_DIR/pgo_profile_file_missing.txt 來警告此文件不存在咖气,除非enable_profile_use屬性設(shè)置為false ANDROID_PGO_NO_PROFILE_USE構(gòu)建變量設(shè)置為true
enable_profile_use 若在構(gòu)建期間不應(yīng)使用配置文件則設(shè)置為false沪猴。可以在引導(dǎo)期間使用以啟用配置文件收集或暫時禁用PGO采章。默認是true
cflags 在檢測的構(gòu)建期間使用的其他標志的列表壶辜。

帶PGO的模塊示例:

cc_library {
    name: "libexample",
    srcs: [
        "src1.cpp",
        "src2.cpp",
    ],
    static: [
        "libstatic1",
        "libstatic2",
    ],
    shared: [
        "libshared1",
    ]
    pgo: {
        instrumentation: true,
        benchmarks: [
            "benchmark1",
            "benchmark2",
        ],
        profile_file: "example.profdata",
    }
}

如果基準benchmark1和benchmark2 行使代表行為庫libstatic1悯舟, libstatic2或者libshared1,則這些庫的pgo屬性也包含基準砸民。Android.bp中的defaults模塊可include一個一系列庫的共通pgo定義抵怎,以避免多個模塊重復(fù)相同的構(gòu)建規(guī)則奋救。

為一個架構(gòu)選擇不同的配置文件或選擇性地禁用PGO,需要指定每個體系結(jié)構(gòu)的profile_file反惕, enable_profile_use以及cflags屬性尝艘。例如(架構(gòu)目標以粗體顯示):

cc_library {
    name: "libexample",
    srcs: [
          "src1.cpp",
          "src2.cpp",
    ],
    static: [
          "libstatic1",
          "libstatic2",
    ],
    shared: [
          "libshared1",
    ],
    pgo: {
         instrumentation: true,
         benchmarks: [
              "benchmark1",
              "benchmark2",
         ],
    }

    target: {
         android_arm: {
              pgo: {
                   profile_file: "example_arm.profdata",
              }
         },
         android_arm64: {
              pgo: {
                   profile_file: "example_arm64.profdata",
              }
         }
    }
}

要在基于檢測的分析期間解析對分析運行時庫的引用,請將構(gòu)建標志 -fprofile-generate傳遞給鏈接器姿染。使用PGO檢測的靜態(tài)庫背亥,所有共享庫以及直接依賴于靜態(tài)庫的任何二進制文件也必須為PGO進行檢測。但是悬赏,此類共享庫或可執(zhí)行文件不需要使用PGO配置文件狡汉,并且其enable_profile_use屬性可以被設(shè)置為false。除此限制外闽颇,您可以將PGO應(yīng)用于任何靜態(tài)庫盾戴,共享庫或可執(zhí)行文件。

處理LLVM配置文件

執(zhí)行一個檢測庫或可執(zhí)行文件在/data/local/tmp中生成一個名為default_*unique_id*_0.profraw的配置文件 (其中unique_id是此庫唯一的數(shù)字哈希值)兵多。如果此文件已存在尖啡,則分析運行時會在編寫配置文件時將新配置文件與舊配置文件合并。要更改配置文件的位置剩膘,請在運行時設(shè)置LLVM_PROFILE_FILE環(huán)境變量衅斩。

[llvm-profdata](https://llvm.org/docs/CommandGuide/llvm-profdata.html)實用程序用于將.profraw文件(并可能合并多個.profraw文件)轉(zhuǎn)換為.profdata 文件:

llvm-profdata merge -output=profile.profdata <.profraw and/or .profdata files>

然后*profile.profdata* 可被簽入源碼樹以便在構(gòu)建時使用。

如果在基準測試期間加載了多個檢測二進制文件/庫援雇,則每個庫都會生成一個具有唯一ID 的獨立.profraw文件矛渴。通常,所有這些文件都可以合并為單個 .profdata文件并用于PGO構(gòu)建惫搏。如果庫由另一個基準測試執(zhí)行具温,則必須使用兩個基準測試的配置文件優(yōu)化該庫。在這種情況下筐赔,show 選項llvm-profdata是有用的:

llvm-profdata merge -output=default_unique_id.profdata default_unique_id_0.profraw
llvm-profdata show -all-functions default_unique_id.profdata

要將unique_id映射到單個庫铣猩,請在每個unique_idshow輸出中搜索該庫唯一的函數(shù)名稱。

案例研究:ART的PGO

案例研究將ART作為一個相關(guān)的例子; 但是茴丰,它并不能準確描述為ART或其相互依賴性分析的實際庫集达皿。

ART中的dex2oat預(yù)編譯器依賴于 libart-compiler.so,而后者依賴于 libart.so贿肩。ART運行時主要在 libart.so中實現(xiàn)峦椰。編譯器和運行時的基準將是不同的:

基準 配置庫
dex2oat dex2oat(可執(zhí)行), libart-compiler.so汰规,libart.so
art_runtime libart.so
  1. 將以下pgo屬性添加到dex2oat汤功, libart-compiler.so
    pgo: {
        instrumentation: true,
        benchmarks: ["dex2oat",],
        profile_file: "dex2oat.profdata",
    }
  1. 將以下pgo屬性添加到libart.so
    pgo: {
        instrumentation: true,
        benchmarks: ["art_runtime", "dex2oat",],
        profile_file: "libart.profdata",
    }
  1. 使用以下方法為dex2oatart_runtime基準創(chuàng)建檢測構(gòu)建:
    make ANDROID_PGO_INSTRUMENT=dex2oat
    make ANDROID_PGO_INSTRUMENT=art_runtime

或者,使用以下方法創(chuàng)建一個具有所有庫檢測的單個檢測構(gòu)建:

    make ANDROID_PGO_INSTRUMENT=dex2oat,art_runtime
    (or)
    make ANDROID_PGO_INSTRUMENT=ALL

第二個命令構(gòu)建所有啟用PGO的模塊以進行性能分析溜哮。

  1. 運行基準測試dex2oatart_runtime以獲得:
    • 來自dex2oatdex2oat_exe.profdata滔金, dex2oat_libart-compiler.profdatadexeoat_libart.profdata)的三個.profraw文件色解,使用處理LLVM配置文件中描述的方法進行標識。
    • 單個art_runtime_libart.profdata文件餐茵。
  2. dex2oat可執(zhí)行文件和 libart-compiler.so使用生成一個通用的profdata文件:
llvm-profdata merge -output=dex2oat.profdata \
    dex2oat_exe.profdata dex2oat_libart-compiler.profdata
  1. 通過合并兩個基準測試中的配置文件來獲取libart.so的配置文件:
llvm-profdata merge -output=libart.profdata \
    dex2oat_libart.profdata art_runtime_libart.profdata

libart.so的兩個配置文件的原始計數(shù)可能是不同的科阎,因為基準測試用例的數(shù)量和運行的持續(xù)時間不同。在這種情況下忿族,您可以使用加權(quán)合并:

llvm-profdata merge -output=libart.profdata \
    -weighted-input=2,dex2oat_libart.profdata \
    -weighted-input=1,art_runtime_libart.profdata

上面的命令為 dex2oat配置文件賦予兩倍的權(quán)重锣笨。實際權(quán)值應(yīng)根據(jù)域知識或?qū)嶒灤_定。

  1. dex2oat.profdatalibart.profdata配置文件簽入到toolchain/pgo-profiles以便構(gòu)建時使用肠阱。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末票唆,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子屹徘,更是在濱河造成了極大的恐慌走趋,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件噪伊,死亡現(xiàn)場離奇詭異簿煌,居然都是意外死亡,警方通過查閱死者的電腦和手機鉴吹,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進店門姨伟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人豆励,你說我怎么就攤上這事夺荒。” “怎么了良蒸?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵技扼,是天一觀的道長。 經(jīng)常有香客問我嫩痰,道長剿吻,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任串纺,我火速辦了婚禮丽旅,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘纺棺。我一直安慰自己榄笙,他們只是感情好,可當我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布祷蝌。 她就那樣靜靜地躺著办斑,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上乡翅,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天,我揣著相機與錄音罪郊,去河邊找鬼蠕蚜。 笑死,一個胖子當著我的面吹牛悔橄,可吹牛的內(nèi)容都是我干的靶累。 我是一名探鬼主播稻扬,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼款熬,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了坟冲?” 一聲冷哼從身側(cè)響起睛挚,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤邪蛔,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后扎狱,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體侧到,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年淤击,在試婚紗的時候發(fā)現(xiàn)自己被綠了匠抗。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡污抬,死狀恐怖汞贸,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情印机,我是刑警寧澤矢腻,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站耳贬,受9級特大地震影響踏堡,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜咒劲,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一顷蟆、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧腐魂,春花似錦帐偎、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春漫贞,著一層夾襖步出監(jiān)牢的瞬間甸箱,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工迅脐, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留芍殖,地道東北人。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓谴蔑,卻偏偏與公主長得像豌骏,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子隐锭,可洞房花燭夜當晚...
    茶點故事閱讀 45,685評論 2 360

推薦閱讀更多精彩內(nèi)容

  • LLVM 簡介 LLVM 全稱是 Low Level Virtual Machine窃躲,它是源自 the Unive...
    juniway閱讀 37,909評論 0 21
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn)钦睡,斷路器蒂窒,智...
    卡卡羅2017閱讀 134,707評論 18 139
  • 關(guān)于Mongodb的全面總結(jié) MongoDB的內(nèi)部構(gòu)造《MongoDB The Definitive Guide》...
    中v中閱讀 31,947評論 2 89
  • mean to add the formatted="false" attribute?.[ 46% 47325/...
    ProZoom閱讀 2,701評論 0 3
  • 本周,我完成了: 1赎婚、四五周的數(shù)學(xué)討論 2刘绣、英語趣配音 3、看了《我們的小狼朋...
    梁朵閱讀 191評論 0 1