崩潰幌衣!去調(diào)試一個無法重現(xiàn)的錯誤矾削?

2018 年 10 月 10 日的這天,我們的團隊發(fā)布了一個新版本的 React Native 應(yīng)用程序豁护。我們很高興又為我們的用戶交付了新功能哼凯。

但是,恐怖的事情發(fā)生了楚里!

發(fā)布幾個小時后断部,我們突然收到很多 Android 崩潰事件。

Android 版本上發(fā)生了 10000 次崩潰

我們的崩潰報告工具Sentry像著火了一樣!

所有的新錯誤都是類似“JSApplicationIllegalArgumentException Error while updating property ‘left’ in shadow node of type: RCTView”這樣的班缎。

在 React Native 中蝴光,如果你使用錯誤的類型設(shè)置屬性,通常會發(fā)生這種情況吝梅。但是虱疏,為什么我們在測試應(yīng)用程序時沒有發(fā)現(xiàn)這個錯誤?我們的新版本已經(jīng)在多個設(shè)備上測試過了苏携。

此外做瞪,錯誤似乎是隨機的,似乎在遇到屬性和陰影節(jié)點類型的組合時會發(fā)生這個錯誤。以下是其中的 3 個錯誤:

根據(jù) Sentry 的報告装蓬,這些錯誤似乎在任意設(shè)備和任意 Android 版本上都會發(fā)生著拭。

大多數(shù)Android 8.0.0崩潰但這與我們的用戶群一致

大多數(shù)Android 8.0.0崩潰但這與我們的用戶群一致

讓我們來重現(xiàn)錯誤

修復(fù)錯誤的第一步是重現(xiàn)錯誤。所幸的是牍帚,因為有 Sentry 日志儡遮,我們知道用戶在觸發(fā)崩潰之前正在做什么。

絕大多數(shù)的崩潰都是發(fā)生在用戶打開應(yīng)用程序的時候暗赶。

現(xiàn)在我們也嘗試重現(xiàn)一下鄙币。我們在 6 臺不同的 Android 設(shè)備上安裝從應(yīng)用商店下載的 App,可惜的是蹂随,并沒有發(fā)生崩潰十嘿!而且,在開發(fā)模式下就更不可能在本地重現(xiàn)這個錯誤了岳锁。

看來這樣做似乎毫無意義绩衷。無論如何,崩潰似乎是隨機發(fā)生的激率。發(fā)生崩潰的概率約為 10%咳燕,也就是說,基本上啟動 App10 次會有一次發(fā)生崩潰乒躺。

分析堆棧跟蹤信息

為了能夠重現(xiàn)崩潰招盲,我們試著去了解問題出在哪里。


好吧聪蘸,如前所述宪肖,我們遇到了幾個不一樣的錯誤。它們都有類似但不完全相同的堆棧跟蹤信息健爬。

我們先來分析第一個:

java.lang.ArrayIndexOutOfBoundsException: length=10; index=-1
    at android.support.v4.util.Pools$SimplePool.release(Pools.java:116)
    at com.facebook.react.bridge.DynamicFromMap.recycle(DynamicFromMap.java:40)
    at com.facebook.react.uimanager.LayoutShadowNode.setHeight(LayoutShadowNode.java:168)
    at java.lang.reflect.Method.invoke(Method.java)
    ...

java.lang.reflect.InvocationTargetException: null
    at java.lang.reflect.Method.invoke(Method.java)
    ...

com.facebook.react.bridge.JSApplicationIllegalArgumentException: Error while updating property 'height' in shadow node of type: RNSVGSvgView
    at com.facebook.react.uimanager.ViewManagersPropertyCache$PropSetter.updateShadowNodeProp(ViewManagersPropertyCache.java:113)
    ...

我們找到了發(fā)生錯誤的地方:android/support/v4/util/Pools.java。

我們已經(jīng)非常深入到 Android 支持庫么介,但不確定現(xiàn)在可以從中推斷出多少信息娜遵。

使用另一種方式

另一種方法是檢查我們在新版本代碼中所做的修改,特別是那些會影響原生 Android 代碼的修改壤短。我們發(fā)現(xiàn)了 2 個可能性:

  • 我們升級了 Native Navigation设拟,這是一種在 Android 上為每個屏幕使用原生片段的導(dǎo)航解決方案;

  • 我們升級了 react-native-svg久脯。有一些與 SVG 組件相關(guān)的異常纳胧,但有些與它沒有關(guān)系,所以很難說帘撰。

因為無法重現(xiàn)錯誤跑慕,我們最好的選擇是:

  • 回退 2 個庫中的一個;

  • 只發(fā)布給 10%的用戶;

  • 與這些用戶確認核行,看看新版本有沒有發(fā)生崩潰牢硅。這樣就可以驗證我們的假設(shè)。

要回退哪個庫呢芝雪?

一種辦法是通過拋硬幣來決定减余,但我們真的要這么做嗎?

深究這一點

好吧惩系,讓我們深入挖掘之前的堆棧跟蹤信息位岔,看看是否可以確定選擇回退哪個庫。

/**
 * Simple (non-synchronized) pool of objects.
 *
 * @param  The pooled type.
 */
public static class SimplePool implements Pool {
    private final Object[] mPool;

    private int mPoolSize;

    ...

    @Override
    public boolean release(T instance) {
        if (isInPool(instance)) {
            throw new IllegalStateException("Already in the pool!");
        }
        if (mPoolSize < mPool.length) {測試學(xué)習(xí)交流175317069君(qun)羊
            mPool[mPoolSize] = instance;
            mPoolSize++;
            return true;
        }
        return false;
    }
    

以上是崩潰發(fā)生的地方堡牡。錯誤是java.lang.ArrayIndexOutOfBoundsException: length=10; index=-1赃承,意思是說,mPool 是一個大小為 10 的數(shù)組悴侵,但 mPoolSize = -1瞧剖。

除了上面的 recycle 方法之外,可以修改 mPoolSize 的另一個地方是 SimplePool 類的 acquire 方法:


public T acquire() {
    if (mPoolSize > 0) {
        final int lastPooledIndex = mPoolSize - 1;
        T instance = (T) mPool[lastPooledIndex];
        mPool[lastPooledIndex] = null;
        mPoolSize--;
        return instance;
    }
    return null;
}

因此可免,導(dǎo)致 mPoolSize 變?yōu)?-1 的唯一可能是在 mPoolSize=0 時繼續(xù)執(zhí)行 mPoolSize–抓于。 但在 mPoolSize > 0 時,這種情況怎么可能會發(fā)生呢浇借?

我們在 Android Studio 中設(shè)置了一個斷點捉撮,并檢查啟動應(yīng)用程序時發(fā)生了什么。我的意思是妇垢,因為有一個 if 條件巾遭,這段代碼不應(yīng)該會出現(xiàn)故障!

最后闯估,啟示灼舍!

DynamicFromMap有一個靜態(tài)引用SimplePool。

private static final Pools.SimplePool<DynamicFromMap> sPool = new Pools.SimplePool<>(10);

如果對軟件測試涨薪、接口測試骑素、自動化測試、性能測試刚夺、LR腳本開發(fā)献丑、面試經(jīng)驗交流。感興趣可以175317069侠姑,群內(nèi)會有不定期的發(fā)放免費的資料鏈接创橄,這些資料都是從各個技術(shù)網(wǎng)站搜集、整理出來的莽红,如果你有好的學(xué)習(xí)資料可以私聊發(fā)我妥畏,我會注明出處之后分享給大家。

在幾十次點擊播放按鈕后,我們可以通過精心放置的斷點查看SimplePool.acquire并通過React Native SimplePool.release調(diào)用mqt_native_modules線程來管理React組件的樣式屬性(在組件下面width)

但同時也被主線程調(diào)用咖熟!

從上面我們可以看到圃酵,它被用于更新主線程上的 fill prop,這個屬性通常屬于 react-native-svg 組件馍管!實際上郭赐,react-native-svg 只在版本 7 之后才開始使用 DynamicFromMap 來提高原生 svg 動畫的性能。

函數(shù)實際上被 2 個線程調(diào)用确沸,但 DynamicFromMap 沒有以線程安全的方式使用 SimplePool捌锭。“線程安全”又是什么鬼罗捎?

線程安全理論

因為 JavaScript 是單線程的观谦,因此 JavaScript 開發(fā)人員通常不需要處理線程安全問題。

另一方面桨菜,Java 支持并發(fā)或多線程概念豁状。多個線程可以在單個程序中運行,并且可能會并發(fā)訪問公共數(shù)據(jù)結(jié)構(gòu)倒得,可能會導(dǎo)致意外的結(jié)果泻红。

讓我們舉一個簡單的例子,在下圖中霞掺,線程 A 和線程 B 都:

  • 將整數(shù)讀入內(nèi)存谊路;

  • 增加它的價值;

  • 將它返回菩彬。

在線程 A 完成更新之前缠劝,線程 B 可能會訪問數(shù)據(jù)的值。我們期望它們是兩個單獨的遞增值操作骗灶,最終結(jié)果為 19惨恭,但結(jié)果可能會是 18。對于這樣情況矿卑,數(shù)據(jù)的最終狀態(tài)取決于線程操作的順序喉恋,稱為競態(tài)條件。競態(tài)條件的問題在于它們不一定總是會發(fā)生母廷。對于上述的情況,線程 B 在遞增值之前還有更多的工作要做糊肤,為線程 A 提供足夠的時間來更新值琴昆。這就解釋了重現(xiàn)崩潰的隨機性和不可能性。

如果操作可以由很多線程同時完成馆揉,則數(shù)據(jù)結(jié)構(gòu)被認為是線程安全的业舍,就不會有出現(xiàn)競態(tài)條件的風(fēng)險。

當(dāng)一個線程讀取一個特定數(shù)據(jù)元素時,不應(yīng)該讓其他線程修改或刪除這個元素(這稱為原子性)舷暮。在我們之前的示例中态罪,如果更新周期是原子的,就可以避免出現(xiàn)競態(tài)條件下面。線程 B 將等待線程 A 完成操作复颈。

在我們的例子中,這是可能發(fā)生的事情:

由于 DynamicFromMap 持有對 SimplePool 的靜態(tài)引用沥割,因此不同線程的多個 DynamicFromMap 調(diào)用導(dǎo)致可以同時調(diào)用 SimplePool 的 acquire 方法耗啦。

在上圖中,線程 A 調(diào)用 acquire 方法机杜,得出條件為 true帜讲,但尚未減小 mPoolSize 的值(與線程 B 共享),而線程 B 同時調(diào)用該方法椒拗,并得出相同的條件似将。然后每個單獨的調(diào)用都將減少 mPoolSize 的值,這就是為什么你會獲得一個錯誤的值蚀苛。

修復(fù)錯誤

我們在 react-native 上發(fā)現(xiàn)了一個未合并的 PR在验,這個 PR 修復(fù)了線程安全問題。

然后枉阵,我們部署了一個修補版本的 react native译红,將其發(fā)布給我們的用戶。崩潰問題終于得到了解決兴溜!

這個修復(fù)將包含在 React Native 的下一個小版本 0.57 中侦厚。

為了修復(fù)這個錯誤,我們確實做出了很大的努力拙徽,但這也是一個深入了解 react-native 和 react-native-svg 的絕佳機會刨沦。一個好的調(diào)試器和一些很好的斷點很長的路要走。希望你也學(xué)到了一些有用的東西膘怕!

擴展閱讀

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末来破,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子忘古,更是在濱河造成了極大的恐慌徘禁,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,029評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件髓堪,死亡現(xiàn)場離奇詭異送朱,居然都是意外死亡娘荡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,395評論 3 385
  • 文/潘曉璐 我一進店門驶沼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來炮沐,“玉大人,你說我怎么就攤上這事回怜〈竽辏” “怎么了?”我有些...
    開封第一講書人閱讀 157,570評論 0 348
  • 文/不壞的土叔 我叫張陵鹉戚,是天一觀的道長鲜戒。 經(jīng)常有香客問我,道長抹凳,這世上最難降的妖魔是什么遏餐? 我笑而不...
    開封第一講書人閱讀 56,535評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮赢底,結(jié)果婚禮上失都,老公的妹妹穿的比我還像新娘。我一直安慰自己幸冻,他們只是感情好粹庞,可當(dāng)我...
    茶點故事閱讀 65,650評論 6 386
  • 文/花漫 我一把揭開白布绎谦。 她就那樣靜靜地躺著沙咏,像睡著了一般畔规。 火紅的嫁衣襯著肌膚如雪擦俐。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,850評論 1 290
  • 那天慎皱,我揣著相機與錄音提陶,去河邊找鬼左驾。 笑死延刘,一個胖子當(dāng)著我的面吹牛漫试,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播碘赖,決...
    沈念sama閱讀 39,006評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼驾荣,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了普泡?” 一聲冷哼從身側(cè)響起播掷,我...
    開封第一講書人閱讀 37,747評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎撼班,沒想到半個月后叮趴,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,207評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡权烧,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,536評論 2 327
  • 正文 我和宋清朗相戀三年眯亦,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片般码。...
    茶點故事閱讀 38,683評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡妻率,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出板祝,到底是詐尸還是另有隱情宫静,我是刑警寧澤,帶...
    沈念sama閱讀 34,342評論 4 330
  • 正文 年R本政府宣布券时,位于F島的核電站孤里,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏橘洞。R本人自食惡果不足惜捌袜,卻給世界環(huán)境...
    茶點故事閱讀 39,964評論 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望炸枣。 院中可真熱鬧虏等,春花似錦、人聲如沸适肠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,772評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽侯养。三九已至敦跌,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間逛揩,已是汗流浹背柠傍。 一陣腳步聲響...
    開封第一講書人閱讀 32,004評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留息尺,地道東北人携兵。 一個月前我還...
    沈念sama閱讀 46,401評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像搂誉,于是被迫代替她去往敵國和親徐紧。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,566評論 2 349

推薦閱讀更多精彩內(nèi)容