MatrixOnEarth - 簡書

MatrixOnEarth

IP屬地：臺灣

Intel 顯卡單機(jī)多卡 FSDP 模型 checkpointing 時 Assert Out
現(xiàn)象使用 Hugging Face Trainer 在單機(jī)多卡環(huán)境下對 LLAMA2-7B 進(jìn)行 LoRA finetuning 時荒澡，在第一次...

60 0 0
輔助式文本生成 - 文本生成新范式
輔助式文本生成 - 文本生成新范式 @(NLP)[文本生成] 引言 LLM 要跨越從早期采用者到大眾市場的鴻溝拐辽，其必要條件是價格大眾化梨州，也就是降...

0.3 58 0 1

使用開源 LLM 充當(dāng) LangChain 智能體
太長不看版開源 LLM 現(xiàn)已達(dá)到一定的性能水平囱晴，可堪作為智能體工作流的推理引擎详囤。在我們的測試基準(zhǔn)上霜定，Mixtral[https://huggi...

306 0 0
詳解 MoE
隨著 Mixtral 8x7B 的發(fā)布（公告[https://mistral.ai/news/mixtral-of-experts/]噩翠，模型卡[...

1339 0 0
亂彈 LLM 的工程化
亂彈 LLM 的工程化 @(Thoughts) 僅為個人觀點(diǎn)巡球，亂彈而已言沐。這一波 LLM 狂熱很有意思，從現(xiàn)象上來看跟智能手機(jī) + 移動互聯(lián)網(wǎng)那...

425 0 0
Transformer 估算 101
@(Engineering Practice) 本文主要介紹用于估算 transformer 類模型計算量需求和內(nèi)存需求的相關(guān)數(shù)學(xué)方法酣栈。引言 ...

266 0 0
優(yōu)化故事: BLOOM 模型推理
優(yōu)化故事: BLOOM 模型推理 @(Engineering Practice) 經(jīng)過“九九八十一難”险胰，大模型終于煉成。下一步就是架設(shè)服務(wù)矿筝，準(zhǔn)備...

508 0 0

BLOOM 訓(xùn)練背后的技術(shù)
BLOOM 訓(xùn)練背后的技術(shù) @(Engineering Practice) 假設(shè)你現(xiàn)在有了數(shù)據(jù)起便，也搞到了預(yù)算，一切就緒窖维，準(zhǔn)備開始訓(xùn)練一個大模型榆综，...

758 0 0
ChatGPT 與 AIGC 簡問亂答
ChatGPT 與 AIGC 簡問亂答 ** 僅代表個人觀點(diǎn)。 ** [Q1] ChatGPT 最近非持罚火爆鼻疮，2 個月突破 1 億月活，從產(chǎn)品形...

320 0 0