文獻(xiàn)閱讀2: Proteomic and Metabolomic Characterization of COVID-19 Patient Sera

1. 樣本組成

99份病毒滅活處理的血清樣本:分為對照(健康)組、疑似但實(shí)為普通流感組氮墨、新冠感染輕癥組甩鳄、新冠感染重癥組。


臨床信息表-1

臨床信息表-2

2. 樣本處理過程

  • 5 μL serum 溶解在 50 μL lysis buffer (8 M urea in 100 mM triethylammonium bicarbonate, TEAB) 悍手;還原、烷基化袍患、兩步trypsin酶切坦康、 TMTpro 16-plex標(biāo)記;
  • 預(yù)分120個(gè)組分诡延,最終合并為40個(gè)組分滞欠,Q Exactive HF-X DDA檢測;
  • PD搜庫: Homo sapiens fasta database downloaded from UniprotKB on 07 Jan 2020 and the SARS-CoV-2 virus fasta downloaded from NCBI (version NC_045512.2).
  • The peptide-spectrum-match allowed 1% target false discovery rate (FDR) (strict) and 5% target FDR (relaxed). Normalization was performed against the total peptide amount.
  • Quality control:The quality of proteomic data was ensured at multiple levels.
    a. First, a mouse liver digest was used for instrument performance evaluation.
    b. We also run water samples (buffer A) as blanks every 4 injections to avoid carry-over.
    c. Serum samples of four patient groups from both training and validation cohorts were randomly distributed in eight different batches.
    d. Six samples were injected in technical replicates.
  • non-target metabolomics 代謝組學(xué)分析:每個(gè)樣本分成四份肆良,進(jìn)行四種檢測:two for analysis using two separate reverse-phase /ultra-performance liquid chromatography (RP/UPLC)-MS/MS methods with positive ion-mode electrospray ionization (ESI), one for analysis using RP/ UPLC-MS/MS with negative-ion mode ESI, and one for analysis using hydrophilic interaction liquid chromatography (HILIC)/UPLC-MS/MS with negative-ion mode ESI.
  • 統(tǒng)計(jì)學(xué)分析
    a . 差異倍數(shù)選擇:Log2 fold-change (log2 FC) was calculated on the mean of the same patient group for each pair of comparing
    groups. The statistical significantly changed proteins or metabolites were selected using the criteria of adjust p value less than 0.05 indicated and absolute log2 FC larger than 0.25.
    b. t-test:Two-sided unpaired Welch’s t test was performed for each pair of comparing groups and adjusted p values were calculated using Benjamini & Hochberg correction.
    c. 機(jī)器學(xué)習(xí):From the training cohort, the important features were selected with mean decrease accuracy larger than 3 using random forest containing a thousand trees using R package randomForest (version 4.6.14) random forest analysis with 10-fold cross validation as binary classification of paired severe and non-severe group using combined differentially regulated proteins and metabolites features. The random forest analysis was further performed for a hundred times on the matrix with only the selected important features using normalized additive predicting probability as the final predicting probability and the larger probability as the predictive label. Those selected important features were used for the random forest analysis on the independent validation cohort.

3. Results

為了有效地對單細(xì)胞測序數(shù)據(jù)進(jìn)行各種處理分析筛璧,特別是細(xì)胞亞型的鑒定,通常需要首先對單細(xì)胞測序數(shù)據(jù)進(jìn)行降維惹恃。單細(xì)胞測序數(shù)據(jù)的降維方法主要可分為兩大類:
1夭谤、Dimensionality reduction(降維),降維方法通常是把高維數(shù)據(jù)通過優(yōu)化保留原始數(shù)據(jù)中的關(guān)鍵特征后投射到低維空間巫糙,從而可以通過二維或三維的形式把數(shù)據(jù)展示出來朗儒。
常用的降維方法有:
1)PCA(Principle Component Analysis),主成分分析,是一種線性的降維方法醉锄;
2)t-SNE(T-distributed stochastic neighbor embedding)乏悄,是一種非線性的降維方法;
3)UMAP (uniform manifold approximation and projection) (Becht et al., 2018, Nat. Biotechnol.),
4)scvis (Ding et al., 2018, Nat. Commun.)
2恳不、Feature selection(特征選擇)檩小,主要是通過去除信息含量少的基因而保留信息含量最多的基因來降低數(shù)據(jù)的維度。
常用的Feature selection的方法有:
1)基于先驗(yàn)信息的方法(如已知細(xì)胞的亞型)妆够。比如通過SCDE軟件鑒定已知不同細(xì)胞亞型間的差異表達(dá)基因识啦,然后再基于差異表達(dá)基因來聚類分析等负蚊。
2)非監(jiān)督方法神妹。又可細(xì)分為:
(i) 基于highly variable genes (HVG) ;
(ii) 基于spike-in家妆,如scLVM (Buettner et al., 2015)和BASiCS (Vallejos et al., 2015)等鸵荠;
(iii)基于 dropout,如M3Drop (Andrews and Hemberg, 2018)伤极。
參考:https://www.cnblogs.com/aipufu/articles/11470334.html

  • Part 1. Proteomic and metabolomic profiling of COVID-19 sera
    蛋白質(zhì)組共鑒定到894個(gè)蛋白和941個(gè)代謝物蛹找,查看QC樣本CV,及UMAP降維后樣本分布情況哨坪。
    Figure S1
  • Part 2. Identification of severe patients using machine learning
    選取部分?jǐn)?shù)據(jù)蛋白質(zhì)組及代謝組數(shù)據(jù)作為訓(xùn)練集進(jìn)行隨機(jī)森林機(jī)器學(xué)習(xí)來區(qū)分重癥新冠患者庸疾,找到29個(gè)重要的變量,包括22個(gè)蛋白和7個(gè)代謝物当编。用建立好的模型對另外10個(gè)做驗(yàn)證届慈。
    機(jī)器學(xué)習(xí)樣本分配
    機(jī)器學(xué)習(xí)的結(jié)果和模型評估結(jié)果
  • Part 3. Proteomic and metabolomic changes in severe COVID-19 sera
    新冠患者與非新冠患者共105個(gè)差異蛋白和373個(gè)差異代謝物,其中有93個(gè)蛋白和204個(gè)代謝物與新冠的嚴(yán)重程度相關(guān)忿偷;93個(gè)差異蛋白主要富集在activation of the complement system, macrophage function and platelet degranulation三條信號通路中金顿,包括50個(gè)蛋白;相應(yīng)的鲤桥,代謝物中82個(gè)在上述三條信號通路中揍拆。文章剩余部分便是對這三條信號通路進(jìn)行具體闡述了,不再一一介紹茶凳。
    Differentially expressed proteins in different patient groups in the training cohort.

    Differentially expressed metabolites in different patient groups in the training cohort.

    Proteins and metabolites regulated in COVID-19 patients but not in non-COVID-19 patients.

    Dysregulated proteins in COVID-19 sera.

    Dysregulated metabolites in COVID-19 sera.

    Key proteins and metabolites characterized in severe COVID-19 patients in a working model.

    Identification of specific clusters of proteins and metabolites in COVID-19 patients. 791 proteins (A) and 941 metabolites (B) were clustered using mFuzz into 16 significant discrete clusters, respectively.

4. 后記

整篇文章的分析并不復(fù)雜嫂拴,整體思路:QC(數(shù)據(jù)可信)?? 機(jī)器學(xué)習(xí)區(qū)分患者與正常人(分組)?? 差異蛋白o(hù)r代謝物,尤其是與疾病嚴(yán)重程度相關(guān)的差異蛋白贮喧。(差異分子)??pathway 分析顷牌,闡述疾病的主要病理特征。
從蛋白質(zhì)組學(xué)的數(shù)據(jù)來看塞淹,這文章選取的差異倍數(shù)并不是很大窟蓝,log(fold change)=1/4(可能是考慮到16標(biāo)的壓縮效應(yīng),我的10標(biāo)都選的是1.2倍),最好有另外一種技術(shù)進(jìn)行驗(yàn)證才更有說服力运挫;機(jī)器學(xué)習(xí)的樣本數(shù)較少状共。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市谁帕,隨后出現(xiàn)的幾起案子峡继,更是在濱河造成了極大的恐慌,老刑警劉巖匈挖,帶你破解...
    沈念sama閱讀 206,602評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件碾牌,死亡現(xiàn)場離奇詭異,居然都是意外死亡儡循,警方通過查閱死者的電腦和手機(jī)舶吗,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,442評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來择膝,“玉大人誓琼,你說我怎么就攤上這事‰茸剑” “怎么了腹侣?”我有些...
    開封第一講書人閱讀 152,878評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長齿穗。 經(jīng)常有香客問我傲隶,道長,這世上最難降的妖魔是什么窃页? 我笑而不...
    開封第一講書人閱讀 55,306評論 1 279
  • 正文 為了忘掉前任跺株,我火速辦了婚禮,結(jié)果婚禮上腮出,老公的妹妹穿的比我還像新娘帖鸦。我一直安慰自己,他們只是感情好胚嘲,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,330評論 5 373
  • 文/花漫 我一把揭開白布作儿。 她就那樣靜靜地躺著,像睡著了一般馋劈。 火紅的嫁衣襯著肌膚如雪攻锰。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,071評論 1 285
  • 那天妓雾,我揣著相機(jī)與錄音娶吞,去河邊找鬼。 笑死械姻,一個(gè)胖子當(dāng)著我的面吹牛妒蛇,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 38,382評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼绣夺,長吁一口氣:“原來是場噩夢啊……” “哼吏奸!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起陶耍,我...
    開封第一講書人閱讀 37,006評論 0 259
  • 序言:老撾萬榮一對情侶失蹤奋蔚,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后烈钞,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體泊碑,經(jīng)...
    沈念sama閱讀 43,512評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,965評論 2 325
  • 正文 我和宋清朗相戀三年毯欣,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了馒过。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,094評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡仪媒,死狀恐怖沉桌,靈堂內(nèi)的尸體忽然破棺而出谢鹊,到底是詐尸還是另有隱情算吩,我是刑警寧澤,帶...
    沈念sama閱讀 33,732評論 4 323
  • 正文 年R本政府宣布佃扼,位于F島的核電站偎巢,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏兼耀。R本人自食惡果不足惜压昼,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,283評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望瘤运。 院中可真熱鬧窍霞,春花似錦、人聲如沸拯坟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,286評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽郁季。三九已至冷溃,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間梦裂,已是汗流浹背似枕。 一陣腳步聲響...
    開封第一講書人閱讀 31,512評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留年柠,地道東北人凿歼。 一個(gè)月前我還...
    沈念sama閱讀 45,536評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親答憔。 傳聞我的和親對象是個(gè)殘疾皇子牵咙,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,828評論 2 345

推薦閱讀更多精彩內(nèi)容

  • pyspark.sql模塊 模塊上下文 Spark SQL和DataFrames的重要類: pyspark.sql...
    mpro閱讀 9,446評論 0 13
  • 今天是小春的婚禮,我下午趕到吃晚飯攀唯。給紅包給小春洁桌,他說不要,同學(xué)都不說紅包侯嘀。我很驚訝另凌,少有人能做到這一點(diǎn)的。他說戒幔,...
    靜夢辰光閱讀 195評論 0 0
  • 傷心難過時(shí)吠谢, 有人安慰你,這就是幸福诗茎! 身處困境中工坊, 有人幫助你,這就是幸福敢订! 生病難受時(shí)王污, 有人照顧你,這就是幸...
    輕舟ling閱讀 273評論 0 5
  • 每一個(gè)孩子就是一本經(jīng)書楚午,是為母者終身奉讀的經(jīng)昭齐。這本經(jīng)書好不好讀,就看母親的耐心矾柜、愛心阱驾、運(yùn)氣及造化了」置铮——《親愛的安...
    糖糖羅閱讀 62評論 0 0
  • 在講解牛股前咱們先回顧一下今天的盤面情況 今日早盤滬深兩市小幅低開之后缆瓣,滬深兩市開盤后維持了近一小時(shí)的窄幅整理喧枷,在...
    財(cái)濤說閱讀 194評論 0 0