目前的知識(shí)體系太碎片先较,不足以支撐一個(gè)完整的研究。
把當(dāng)前接觸到的一些概念記錄一下:
文本摘要(核心問(wèn)題)
文本(code 片段卵皂?)
Q1. code 片段怎么來(lái)(現(xiàn)有數(shù)據(jù)集)秩铆;
???? 所以怎么處理這些 代碼片段(結(jié)構(gòu)化文本+純語(yǔ)義內(nèi)容)园爷;
Q2. 片段大小(長(zhǎng)文本還是短文本)
需要去看文章試下水革娄;
Q3. 現(xiàn)有的方法模型(我怎么去創(chuàng)新翘地、idea怎么來(lái)?族阅?篓跛?)
生成式摘要:輸出的內(nèi)容不局限于原文出現(xiàn)的句子;
抽取式摘要: 從原文中抽取體現(xiàn)能夠主題思想的句子坦刀。
稍微新的技術(shù) bert (需要稍微系統(tǒng)性地學(xué)下)在上述兩者的中應(yīng)用愧沟??
to do(后續(xù)完善鲤遥,需要了解的東西有點(diǎn)多c逅隆)
代碼摘要做不了就去做(bug定位)~
目前主要任務(wù)在于(學(xué)習(xí)NLP地模型基礎(chǔ),看文獻(xiàn)8悄巍;煳搿)