DeepSeek-V3决侈、R1 系列模型
DeepSeek-V3 是 DeepSeek 發(fā)布的 MoE(Mixture-of-Experts)大語言模型螺垢,總參數(shù)量為671B,每個 token 激活的參數(shù)量為37B赖歌。為了實現(xiàn)高效的推理和成本效益的訓練枉圃,DeepSeek-V3 采用了 MLA(Multi-head Latent Attention)和 DeepSeekMoE 架構。此外庐冯,DeepSeek-V3 首次引入了一種無需輔助損失的負載均衡策略孽亲,并設定了多token預測的訓練目標,以提升性能展父。DeepSeek-V3在14.8萬億個多樣且高質(zhì)量的token上對模型進行了預訓練返劲,隨后通過監(jiān)督微調(diào)(SFT)和強化學習來充分發(fā)揮其潛力。
DeepSeek-R1 是 DeepSeek 發(fā)布的高性能AI推理模型栖茉,在后訓練階段大規(guī)模使用強化學習技術篮绿,顯著提升了模型的推理能力,在數(shù)學吕漂、代碼亲配、自然語言推理等任務上,其性能與 OpenAI 的 o1 正式版相當。
DeepSeek-R1具有660B的參數(shù)量弃榨,DeepSeek 開源 660B 模型的同時菩收,通過模型蒸餾梨睁,微調(diào)了若干參數(shù)量較小的開源模型鲸睛,其中包括:
模型 | 基礎模型 |
---|---|
DeepSeek-R1-Distill-Qwen-1.5B | Qwen2.5-Math-1.5B |
DeepSeek-R1-Distill-Qwen-7B | Qwen2.5-Math-7B |
DeepSeek-R1-Distill-Llama-8B | Llama-3.1-8B |
DeepSeek-R1-Distill-Qwen-14B | Qwen2.5-14B |
DeepSeek-R1-Distill-Qwen-32B | Qwen2.5-32B |
DeepSeek-R1-Distill-Llama-70B | Llama-3.3-70B-Instruct |
目前PAI Model Gallery已經(jīng)支持DeepSeek-V3、DeepSeek-R1以及所有蒸餾小參數(shù)模型(DeepSeek-R1-Distill)的一鍵部署坡贺。
PAI Model Gallery 簡介
Model Gallery 是阿里云人工智能平臺 PAI 的產(chǎn)品組件官辈,它集成了國內(nèi)外 AI 開源社區(qū)中優(yōu)質(zhì)的預訓練模型,涵蓋了 LLM遍坟、AIGC拳亿、CV、NLP 等各個領域愿伴,如Qwen肺魁,DeepSeek等系列模型。通過 PAI 對這些模型的適配隔节,用戶可以零代碼實現(xiàn)從訓練到部署再到推理的全過程鹅经,簡化了模型的開發(fā)流程,為開發(fā)者和企業(yè)用戶帶來了更快怎诫、更高效瘾晃、更便捷的 AI 開發(fā)和應用體驗。
PAI Model Gallery 訪問地址:https://pai.console.aliyun.com/#/quick-start/models
PAI Model Gallery 一鍵部署 DeepSeek-V3幻妓、DeepSeek-R1
- 進入 Model Gallery 頁面(鏈接:https://pai.console.aliyun.com/#/quick-start/models)
- 登錄 PAI 控制臺蹦误。
- 在頂部左上角根據(jù)實際情況選擇地域。
- 在左側導航欄選擇工作空間列表肉津,單擊指定工作空間名稱强胰,進入對應工作空間內(nèi)。
- 在左側導航欄選擇快速開始 > Model Gallery妹沙。
- 在 Model Gallery 頁面的模型列表中偶洋,單擊找到并點擊需要部署的模型卡片,例如“DeepSeek-R1-Distill-Qwen-7B”模型初烘,進入模型詳情頁面涡真。
- 單擊右上角部署:目前DeepSeek-R1支持采用vLLM加速部署;DeepSeek-V3支持vLLM加速部署以及Web應用部署肾筐;DeepSeek-R1蒸餾小模型支持采用BladeLLM(阿里云PAI自研高性能推理框架)和vLLM加速部署哆料。選擇部署方式和部署資源后,即可一鍵部署服務吗铐,生成一個PAI-EAS服務东亦。
- 使用推理服務。部署成功后,在服務頁面可以點擊“查看調(diào)用信息”獲取調(diào)用的Endpoint和Token典阵,想了解服務調(diào)用方式可以點擊預訓練模型鏈接奋渔,返回模型介紹頁查看調(diào)用方式說明。
歡迎各位開發(fā)者持續(xù)關注和使用 PAI-Model Gallery壮啊,Model Gallery會不斷上線 SOTA 模型嫉鲸。如果您有任何模型需求,歡迎您聯(lián)系我們歹啼。您可搜索釘釘群號79680024618)玄渗,加入PAI-Model Gallery用戶交流群。