什么是NativeCrash
Android端crash可分為Java crash和Native crash什荣,我們通常說的crash一般指的是Java層crash篮奄,Native crash主要指C/C++代碼(其在Android工程中以動態(tài)鏈接庫的形式存在)的崩潰鳄梅,一般難以抓取策治。下圖為Android系統(tǒng)框架圖拐云,NativeCrash主要就是在圖中紅框部分發(fā)生的崩潰田炭。
Android中C/C++開發(fā)部分稱之為NDK查吊,Android開發(fā)中引入NDK一般是基于如下考慮:
數據安全:java層代碼易被反編譯谐区,而C/C++庫反匯難度較大。
性能考慮:將要求高性能的應用邏輯使用C開發(fā)逻卖,提高應用程序的執(zhí)行效率卢佣。
便于移植:用C/C++寫得庫可以方便在其他的嵌入式平臺上再次使用
google-breakpad工作原理
對于NativeCrash,其復現(xiàn)難度大箭阶,且需要手機root權限(Native崩潰日志存儲在手機的/data/tombstones目錄下)虚茶。本文主要介紹兩種方法獲取Android端線上Native Crash的崩潰信息,分別是基于開源工具google-breakpad和基于c/c++信號異常處理仇参。
首先介紹在開源工具google-breakpad的基礎上嘹叫,實時抓取線上Native crash的dmp日志,并對dmp日志進行上傳诈乒、解析罩扇、分類、聚合的過程怕磨。下圖為google-breakpad的工作原理圖喂饥。Breakpad有三個主要組件:
- Client 需要包含到應用程序中,它可以獲取當前線程的狀態(tài)和當前加載的可執(zhí)行文件和共享庫的ID寫轉儲文件肠鲫,控制程序發(fā)送Native崩潰時员帮,產生minidump文件。
- Symbol dumper讀取由編譯器產生的調試信息导饲,并生成一個使用Breakpad格式的符號文件捞高。
- minidump processor 讀取minidump文件,根據相應的符號文件渣锦,解析產生了一個可讀的C/C++堆棧硝岗。
關于google-breakpad的工作原理可詳見如下鏈接
http://blog.csdn.net/wpc320/article/details/8290501
線上native crash收集實現(xiàn)方案
上圖給出NativeCrash收集的整體實現(xiàn)方案。APP中接入提供的SDK袋毙,包含一個通用SO和一個JAR,當APP中發(fā)生NDK崩潰時型檀,會在手機端生成一個dmp文件,待下次APP重啟后听盖,將此dmp文件上傳至服務端胀溺,在服務端進行解析裂七、分類、聚合月幌、可讀展示等過程碍讯⌒危總的來說扯躺,可分為三個模塊。
? 客戶端sdk
客戶端sdk主要包含一個通用so和jar蝎困,通用so主要是基于google-breakpad進行簡單封裝录语,使其通用化,jar主要提供上傳dmp文件的功能禾乘。通用so采用NDK編程澎埠,主要代碼片段如下:
JNI_OnLoad
jint JNI_OnLoad(JavaVM* vm, void* reserved) {
JNIEnv* env = NULL;
jint result = -1;
if (vm->GetEnv((void**) &env, JNI_VERSION_1_4) != JNI_OK) {
goto bail;
}
if (register_nativecrash(env) < 0) {
goto bail;
}
fields.jvm = vm;
result = JNI_VERSION_1_4;
bail: return result;
}
register_nativecrash:注冊native方法
static int register_nativecrash(JNIEnv *env) {
return registerNativeMethods(env, CLASSPATH, gMethods,sizeof(gMethods) / sizeof(gMethods[0]));
}
static int registerNativeMethods(JNIEnv* env, const char* className,JNINativeMethod* gMethods, int numMethods) {
jclass clazz;
clazz = env->FindClass(className);
if (clazz == NULL) {
return JNI_FALSE;
}
if (env->RegisterNatives(clazz, gMethods, numMethods) < 0) {
return JNI_FALSE;
}
fields.clazz = (jclass) env->NewGlobalRef(clazz);
if (fields.clazz == NULL) {
return JNI_FALSE;
}
return JNI_TRUE;
}
設置dmp文件存放目錄
#include "client/linux/handler/exception_handler.h"
#include "client/linux/handler/minidump_descriptor.h"
static void Java_com_baidu_nativecrash_NativeCrash_setNativeCrashDir(JNIEnv* env, jobject thiz, jstring dir) {
if (dir == NULL) {
__android_log_print(ANDROID_LOG_ERROR, LOG_TAG,"native crash dir is null");
jniThrowException(env, "java/lang/IllegalArgumentException", NULL);
return;
}
const char *filepathStr = env->GetStringUTFChars(dir, NULL);
if (filepathStr == NULL) { // Out of memory
__android_log_print(ANDROID_LOG_ERROR, LOG_TAG,"native crash filepathStr is null");
jniThrowException(env, "java/lang/IllegalArgumentException", NULL);
return;
}
if (filepathStr && (strlen(filepathStr) > 0)) {
__android_log_print(ANDROID_LOG_DEBUG, LOG_TAG, "native crash %s",filepathStr);
static google_breakpad::MinidumpDescriptor descriptor(filepathStr);
static google_breakpad::ExceptionHandler eh(descriptor, NULL,
DumpCallback, NULL, true, -1);
}
}
DumpCallback回調方法中可以向Jave層回傳一些其他額外信息。
android.mk
MY_ROOT_PATH := $(call my-dir)
include $(MY_ROOT_PATH)/../google-breakpad/android/jni/Android.mk
LOCAL_PATH := $(MY_ROOT_PATH)
include $(CLEAR_VARS)
LOCAL_MODULE := nativecrash
LOCAL_SRC_FILES := nativecrash_jni.cpp
LOCAL_C_INCLUDES := \
$(LOCAL_PATH)/../google-breakpad/src/common/android/include \
$(LOCAL_PATH)/../google-breakpad/src
LOCAL_CPPFLAGS := -Os -fvisibility=hidden
LOCAL_CFLAGS := -Os -fvisibility=hidden
LOCAL_CFLAGS += -Wno-psabi
LOCAL_STATIC_LIBRARIES += breakpad_client
include $(BUILD_SHARED_LIBRARY)
Application.mk
APP_ABI := armeabi-v7a armeabi mips x86
APP_STL := stlport_static
APP_OPTIM := release
APP_CPPFLAGS += -Wno-error=format-security
? native日志上傳
客戶端dmp文件上傳的服務端采用百度云服務始藕,主要用來接收客戶端上傳的dmp文件并保存蒲稳。注意,這里dmp文件上傳時機為APP重啟后伍派,在wifi的情況下上傳(dmp文件較大江耀,非wifi上傳不合理)。接收客戶端上傳的dmp文件并存儲后寫庫诉植,數據庫中需要兩個表祥国,分別是用來保存dmp文件的存儲記錄表以及dmp文件解析后的日志分類表。
? 日志解析分類
解析過程:每隔3min讀取日志存儲記錄表最近30條未解析記錄晾腔,進行解析舌稀,dmp解析需要用到breakpad的minidump processor提供的解析方法,故需事先編譯breakpad源碼灼擂,生成解析所需tool壁查,解析完成后,修改解析狀態(tài)剔应。解析腳本需要輪詢執(zhí)行潮罪,通過linux下crontab進行設置。解析過程參考如下鏈接领斥。
http://blog.csdn.net/brook0344/article/details/20126351分類過程:每隔3min讀取存儲記錄表最近20條已解析記錄嫉到,進行分類。分類算法主要是將解析后的崩潰堆棧信息的棧頂文本作為關鍵字月洛,進行分類何恶,可大大簡化文本分類過程。我們可以認為在同一處崩潰的堆棧信息是一致的嚼黔,也即可以認為棧頂文本相同的崩潰细层,是同一類崩潰惜辑。分類完成后,寫入日志分類表疫赎。
-
日志展示:讀取日志分類表盛撑,按分類的崩潰次數逆序排序,展示結果捧搞。
以上是基于google-breakpad的NativeCrash日志收集方法的全過程抵卫,google-breakpad是夸平臺開源工具,體量較大胎撇,在其基礎上生成的通用SO和dmp日志也都較大介粘,對于sdk大小有嚴格要求的APP,可能不是很方便晚树。下一節(jié)介紹體量較小的基于c/c++異常信號處理的NativeCrash日志收集方法姻采。