MatrixOnEarth - 簡(jiǎn)書(shū)

MatrixOnEarth

IP屬地：俄勒岡州

Intel 顯卡單機(jī)多卡 FSDP 模型 checkpointing 時(shí) Assert Out
現(xiàn)象使用 Hugging Face Trainer 在單機(jī)多卡環(huán)境下對(duì) LLAMA2-7B 進(jìn)行 LoRA finetuning 時(shí)唆鸡，在第一次...

78 0 0
輔助式文本生成 - 文本生成新范式
輔助式文本生成 - 文本生成新范式 @(NLP)[文本生成] 引言 LLM 要跨越從早期采用者到大眾市場(chǎng)的鴻溝更胖，其必要條件是價(jià)格大眾化，也就是降...

0.3 69 0 1

使用開(kāi)源 LLM 充當(dāng) LangChain 智能體
太長(zhǎng)不看版開(kāi)源 LLM 現(xiàn)已達(dá)到一定的性能水平汇恤，可堪作為智能體工作流的推理引擎灵巧。在我們的測(cè)試基準(zhǔn)上捏题，Mixtral[https://huggi...

335 0 0
詳解 MoE
隨著 Mixtral 8x7B 的發(fā)布（公告[https://mistral.ai/news/mixtral-of-experts/]脑题，模型卡[...

1477 0 0
亂彈 LLM 的工程化
亂彈 LLM 的工程化 @(Thoughts) 僅為個(gè)人觀點(diǎn)，亂彈而已屏轰。這一波 LLM 狂熱很有意思颊郎，從現(xiàn)象上來(lái)看跟智能手機(jī) + 移動(dòng)互聯(lián)網(wǎng)那...

445 0 0
Transformer 估算 101
@(Engineering Practice) 本文主要介紹用于估算 transformer 類(lèi)模型計(jì)算量需求和內(nèi)存需求的相關(guān)數(shù)學(xué)方法。引言 ...

297 0 0
優(yōu)化故事: BLOOM 模型推理
優(yōu)化故事: BLOOM 模型推理 @(Engineering Practice) 經(jīng)過(guò)“九九八十一難”霎苗，大模型終于煉成姆吭。下一步就是架設(shè)服務(wù)，準(zhǔn)備...

524 0 0

BLOOM 訓(xùn)練背后的技術(shù)
BLOOM 訓(xùn)練背后的技術(shù) @(Engineering Practice) 假設(shè)你現(xiàn)在有了數(shù)據(jù)叨粘，也搞到了預(yù)算猾编，一切就緒瘤睹，準(zhǔn)備開(kāi)始訓(xùn)練一個(gè)大模型升敲，...

774 0 0
ChatGPT 與 AIGC 簡(jiǎn)問(wèn)亂答
ChatGPT 與 AIGC 簡(jiǎn)問(wèn)亂答 ** 僅代表個(gè)人觀點(diǎn)。 ** [Q1] ChatGPT 最近非澈浯火爆驴党，2 個(gè)月突破 1 億月活，從產(chǎn)品形...

323 0 0