0.寫前在前面的話
?如題催跪,記錄一下從零開始學(xué)習(xí)AI大模型的過程咳秉。
?開始這個(gè)筆記的緣由,來自Datawhale公眾號的文章
?作為一個(gè)已經(jīng)工作的苦命人留搔,沒有暑假,那就給自己創(chuàng)造一個(gè)暑假技掏。說起暑假的標(biāo)志之一,那就是夏令營项鬼。參加個(gè)夏令營哑梳,就當(dāng)是過個(gè)暑假吧,為這平凡而悶熱的時(shí)光增添一點(diǎn)樂趣和快樂吧绘盟。
?看了一眼鸠真,跟當(dāng)前工作最相關(guān)的,那就是分子性質(zhì)預(yù)測挑戰(zhàn)賽龄毡,最近一直想整理一下分子對接的相關(guān)內(nèi)容吠卷,被各種事務(wù)拖延,趁著這個(gè)夏令營沦零,趕緊完成吧祭隔。
1.學(xué)習(xí)方法和規(guī)劃
1.1 定目標(biāo)
?作為一個(gè)半路出家的小白,不僅沒有計(jì)算機(jī)及編程的基礎(chǔ)路操,甚至連很多基本概念都不太懂疾渴,所以即使有速通教程,跑完后還是會一臉懵屯仗。在這里搞坝,我推薦一種入門新學(xué)科新領(lǐng)域的方法,那就是從結(jié)果倒推魁袜。簡言之桩撮,就是先確定終點(diǎn),然后從終點(diǎn)一直往起點(diǎn)走慌核。比如這次距境,我的目標(biāo)是把分子對接的流程和分子性質(zhì)預(yù)測的內(nèi)容結(jié)合起來申尼。先不要管這個(gè)目標(biāo)能不能實(shí)現(xiàn)垮卓,先在定個(gè)錨點(diǎn),目標(biāo)如果不合適师幕,在后續(xù)前進(jìn)過程中再不斷調(diào)整粟按,勝過一直在起點(diǎn)猶豫不前。
1.2 看教程
?Datawhale真的出了個(gè)手把手的教程霹粥,看著速通教程灭将,連鼠標(biāo)往哪點(diǎn)都告訴你了,真的是后控,牽條狗都能跑完庙曙。但其實(shí)這個(gè)教程里還有很多隱藏的內(nèi)容的彩蛋,多點(diǎn)幾下浩淘,收獲更多捌朴。自從進(jìn)入代碼領(lǐng)域吴攒,我發(fā)現(xiàn)其實(shí)很多問題,都可以在開發(fā)教程里找到砂蔽,所以洼怔,遇事不決,去教程學(xué)左驾。
1.3 去犯錯(cuò)
學(xué)習(xí)镣隶,就是一個(gè)犯錯(cuò)和糾錯(cuò)的過程。從錯(cuò)誤中學(xué)習(xí)诡右,尤其是學(xué)代碼安岂,那一條條報(bào)錯(cuò)和每一次的解決報(bào)錯(cuò)的過程,就是成長的印跡帆吻,也就是所謂的改bug嗜闻。不要怕出錯(cuò),大膽去試桅锄,遇到不懂的琉雳,就反復(fù)去看教程。
2.一些小結(jié)
2.1 幾個(gè)常用的平臺鏈接
S1提交結(jié)果
S2PP飛槳baseline流程
S3打卡鏈接
2.2 一些概念
baseline:中文翻譯是基礎(chǔ)友瘤,起點(diǎn)翠肘。在大模型中,baseline就是后續(xù)升級的基準(zhǔn)點(diǎn)辫秧,更多內(nèi)容可以參考機(jī)器學(xué)習(xí)中的baseline束倍。
PROCT:(蛋白水解靶向嵌合體,proteolysis targeting chimeria)盟戏,是一個(gè)雙功能分子绪妹,由靶蛋白配體和E3泛素連接酶配體通過連接臂相連。PROTAC分子在進(jìn)入細(xì)胞后柿究,其結(jié)構(gòu)中靶向目標(biāo)蛋白的配體可特異性地與靶蛋白結(jié)合邮旷,另一端可以募集E3連接酶,形成目標(biāo)靶蛋白-PROTAC-E3連接酶三元復(fù)合物蝇摸。其中E3連接酶可介導(dǎo)泛素結(jié)合酶E2對目標(biāo)靶蛋白泛素化婶肩,經(jīng)過多輪泛素化后就有了多個(gè)泛素標(biāo)簽,三元復(fù)合物解離后貌夕,多聚泛素化的蛋白會被蛋白酶體識別從而有選擇性地降解靶蛋白的水平律歼。PROTAC 技術(shù)可用于靶向多種蛋白質(zhì),包括轉(zhuǎn)錄因子啡专、骨架蛋白险毁、酶和調(diào)節(jié)蛋白。這項(xiàng)技術(shù)從癌癥到神經(jīng)元疾病等不同領(lǐng)域都有應(yīng)用。
Dmax:最大目標(biāo)降解水平
DC50:半最大值降解濃度
參考文獻(xiàn):
Zou Y, Ma D, Wang Y. The PROTAC technology in drug development. Cell Biochem Funct. 2019;37(1):21-30. doi:10.1002/cbf.3369
Li K, Crews CM. PROTACs: past, present and future. Chem Soc Rev. 2022;51(12):5214-5236. Published 2022 Jun 20. doi:10.1039/d2cs00193d
最后畔况,帶上個(gè)tag #ai夏令營#datawhale#夏令營离唐,一起過暑假吧,打工人问窃。