【AI大模型】羊駝大模型詳解

LLaMa系列模型

  • 羊駝模型(鼻祖是LLaMa模型斧蜕,F(xiàn)acebook公司開源模型):即將成為大模型的安卓荤傲,國內95%的大模型都是羊駝套殼蚣录。
  • GPT系列(OpenAI公司):相當于大模型的iOS(不開源)糕非。

LLaMa模型結構:前面的詞預測后面的詞,經典的解碼結構千绪。位置編碼用的是旋轉自編碼。

大語言模型為什么取名為LLaMa(美洲鴕)梗脾?
LLM發(fā)音困難荸型。兩個LL跟繞口令一樣挑戰(zhàn)舌頭。大家想給它加點原音炸茧,幫助發(fā)音瑞妇。有人加了A稿静,就是LLaMa。

  1. LLaMa是2023年Meta發(fā)布的基礎LLM模型辕狰,該模型有四個版本改备,分別是7B、13B蔓倍、33B绍妨、65B參數的模型。(LLaMa模型是從零開始訓練的基礎模型柬脸,國內大多數模型都是套殼LLaMa模型)

2.模型的優(yōu)點:

  • 開源他去。相比之前的大模型,LLaMa完全是在公共開源預訓練數據上訓練(通用性比較強倒堕,沒有使用封閉的數據)
  • 推理效率也是LLaMa的一個亮點灾测,可以在單卡V100完成推理(降低了硬件使用門檻,讓大模型平民化垦巴,訓練模型的成本大大降低)媳搪。

3.模型的訓練和數據:
65B的模型使用2048塊A100 80G的GPU,訓練21天左右骤宣。(訓練成本還是比較高的秦爆,訓練的數據集同GPT一樣)


LLaMa模型訓練的數據集
  1. 模型下載地址:https://huggingface.co (國內鏡像網站:https://hf-mirror.com/models

Alpaca模型

  • Alpaca是斯坦福從Meta的LLaMA 7B微調而來的全新模型(套殼是微調模型,LLaMA是全調的基礎模型)憔披,僅用了52k數據等限,性能約等于GPT-3.5。
  • 訓練成本奇低芬膝,不到600美元望门。(大模型屌絲化)
  • 在8個80GB A100 上訓練了3個小時,不到100美元;
  • 生成數據使用OpenAl的API锰霜,500美元筹误。(正常是人工來標注數據,人工的成本很高癣缅;這里數據標注使用了OpenAl的接口厨剪,問題問ChatGPT3,用它的回答作為標注數據來進行微調友存,訓練出Alpaca模型)

國內很多大模型都是學Alpaca模型的玩法祷膳,套殼LLaMA模型低成本訓練出自己的模型。


Alpaca模型的訓練流程

Alpaca模型使用了GPT3來標注數據

Vicuna模型

Vicuna模型簡介
Vicuna模型訓練流程

Vicuna模型使用了GPT4來做評估(效果更好)

GPT5短時間暫時不會有爬立,因為GPT4已經突破了人類現(xiàn)在的硬件資源的一個極限钾唬。

羊駝系列模型對比

羊駝系列模型對比

華駝大模型(國內的醫(yī)療大模型)

華駝大模型

百川大模型(搜狗王小川搞的大模型)

LLaMa + 中文數據

業(yè)內有句俗話:一開源就自主研發(fā),不開源就卡脖子

LLaMa2的提升

模型的提升一般模型本身沒有多大的進化, 主要的提升是堆數據堆算力抡秆,使模型進行進化奕巍。


LLaMa2.0的訓練也使用了ChatGPT的訓練那套方法:

  • 第一步:首先對LLaMa模型通過問答對進行有監(jiān)督的訓練
  • 第二步:訓練一個排序模型(就是通過人來標注這個模型輸出的數據,讓這個模型輸出的答案更加符合人類的認知儒士;通過人來對這些輸出的結果打分的止,來調整這個模型,讓這個模型的輸出結果更加符合人的認知)着撩;這個強化模型诅福,就相當于具備了人的情商,理解了人類的喜好拖叙。
  • 第三步:用具備人類喜好的這個模型氓润,再來去微調LLaMa,讓這個LLaMa模型輸出的結果更加符合人的認知(相當于具備了情商)薯鳍,這樣就訓練出LLaMa2.0咖气。

微調的效果為什么會好?
原生的基礎LLaMa用的語料是通用語料挖滤。在自己的數據上進行微調崩溪,讓模型能夠滿足自己的需求。微調的本質并不是能把模型效果變好斩松,微調的目的是讓模型更適應于我們的數據伶唯。

完整的大模型課程:《AI大模型訓練營》


最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市惧盹,隨后出現(xiàn)的幾起案子乳幸,更是在濱河造成了極大的恐慌,老刑警劉巖岭参,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件反惕,死亡現(xiàn)場離奇詭異,居然都是意外死亡演侯,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進店門背亥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來秒际,“玉大人,你說我怎么就攤上這事狡汉÷玻” “怎么了?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵盾戴,是天一觀的道長寄锐。 經常有香客問我,道長,這世上最難降的妖魔是什么橄仆? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任剩膘,我火速辦了婚禮,結果婚禮上盆顾,老公的妹妹穿的比我還像新娘怠褐。我一直安慰自己,他們只是感情好您宪,可當我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布奈懒。 她就那樣靜靜地躺著,像睡著了一般宪巨。 火紅的嫁衣襯著肌膚如雪磷杏。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天捏卓,我揣著相機與錄音极祸,去河邊找鬼。 笑死天吓,一個胖子當著我的面吹牛贿肩,可吹牛的內容都是我干的。 我是一名探鬼主播龄寞,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼汰规,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了物邑?” 一聲冷哼從身側響起溜哮,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎色解,沒想到半個月后茂嗓,有當地人在樹林里發(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡科阎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年述吸,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片锣笨。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡蝌矛,死狀恐怖,靈堂內的尸體忽然破棺而出错英,到底是詐尸還是另有隱情入撒,我是刑警寧澤,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布椭岩,位于F島的核電站茅逮,受9級特大地震影響璃赡,放射性物質發(fā)生泄漏。R本人自食惡果不足惜献雅,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一碉考、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧惩琉,春花似錦豆励、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至伍玖,卻和暖如春嫩痰,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背窍箍。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工串纺, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人椰棘。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓纺棺,卻偏偏與公主長得像,于是被迫代替她去往敵國和親邪狞。 傳聞我的和親對象是個殘疾皇子祷蝌,可洞房花燭夜當晚...
    茶點故事閱讀 45,685評論 2 360

推薦閱讀更多精彩內容

  • 2023年7月14日達視津氣象 2023年7月14日達視津氣象 朋友們好!今天是2023.7.14星期五帆卓,農歷五月...
    余則徐閱讀 70評論 0 0
  • 中原焦點團隊袁劍雷網初40期堅持分享第109天(2023年7月14日星期五)SFBT整個解決式談話的共構互動過程巨朦,...
    袁劍雷閱讀 33評論 0 0
  • 昨天晚上熬夜在準備最近參加的一個比賽,比賽總共有兩個測試數據集剑令,昨天晚上先是在一個數據集上進行了測試糊啡,另一個數據集...
    大頭貓閱讀 90評論 0 0
  • 祝瀾 2025天 2023-7-14 讀書筆記: 咨詢是一個專業(yè),它有理論吁津、有技術棚蓄,需要透過很多個個案實踐,被...
    祝瀾閱讀 86評論 0 0
  • 2023年人人都能做的紅利項目來了碍脏,你只需要把這些旅游卡提供給商家做活動福利和拓客引流的客戶癣疟,每次旅客出行呢,你就...
    c27fb2b52f4f閱讀 48評論 0 0