RAG一般流程 將用于檢索的知識(shí)庫(kù)(文檔)拆為小(幾百個(gè)token)的文本塊Chunk 對(duì)文本塊進(jìn)行 TF-IDF 編碼,建立索引 語義嵌入Embedding,存儲(chǔ)到向量數(shù)據(jù)...
LangChain 是一個(gè)用于開發(fā)由語言模型驅(qū)動(dòng)的應(yīng)用程序的框架,它旨在幫助開發(fā)者更容易地構(gòu)建还蹲、實(shí)驗(yàn)和部署大模型應(yīng)用程序。LangChain 的架構(gòu)設(shè)計(jì)靈活且可擴(kuò)展,涵蓋了從...
Poetry 是一個(gè)用于Python的依賴管理和打包工具簿煌,它通過一個(gè)pyproject.toml文件來管理項(xiàng)目依賴,簡(jiǎn)化了依賴管理的過程鉴吹。Poetry 旨在解決傳統(tǒng)工具(如p...
Kubeflow是運(yùn)行在K8S之上的一套技術(shù)棧姨伟,通過各種組件實(shí)現(xiàn)機(jī)器學(xué)習(xí)模型的訓(xùn)練和推理部署到云原生的模型平臺(tái)。 Kubeflow組件 Kubeflow提供了一大堆組件豆励,涵蓋...
LlamaIndex 是一個(gè)RAG檢索增強(qiáng)生成框架夺荒, 提供了必要的抽象,可以更輕松地?cái)z取良蒸、構(gòu)建和訪問私有或特定領(lǐng)域的數(shù)據(jù)般堆,以便將這些數(shù)據(jù)安全可靠地注入 LLM 中,以實(shí)現(xiàn)更準(zhǔn)...
模型是一把尺子诚啃,好的策略可以承受一個(gè)不太準(zhǔn)的尺子淮摔。 類似做評(píng)分的純表格數(shù)據(jù),特別是連續(xù)變量特征適合樹模型始赎,深度模型效果一般和橙。 深度模型適合處理離散特征,可以embedding...
對(duì)于LLM大模型應(yīng)用來說造垛,提示工程prompting engineering 是基本的魔招,也是很重要的工具,對(duì)于模型智力和推理能力有著至關(guān)重要的影響五辽。 從手工開發(fā)和維護(hù)prom...
從0到1搭建一個(gè)智能體办斑,寫一個(gè)能幫忙買火車票的智能體AI Agent,火車票相關(guān)API均為Mock杆逗∠绯幔基于LongChain框架,使用ReAct的Prompt模版罪郊。 安裝 & ...
智能體 智能體AI Agents指能夠感知環(huán)境蠕蚜、做出決策并采取行動(dòng)以實(shí)現(xiàn)特定目標(biāo)的智能系統(tǒng)。自動(dòng)駕駛汽車就是一種典型的智能體悔橄。大模型LLM是智能體的“大腦”靶累,能夠處理復(fù)雜的任...
數(shù)據(jù)集準(zhǔn)備和預(yù)處理 通過dataset包加載數(shù)據(jù)集定義Dataset.map要使用的預(yù)處理函數(shù)定義DataCollator來用于構(gòu)造訓(xùn)練batch 加載預(yù)訓(xùn)練模型 隨機(jī)初始化...
直接使用Huggingface的Pipeline這個(gè)神器來輕松使用Transformer處理各種NLP問題簡(jiǎn)直太方便了睛挚。 通過AutoModel來直接從checkpoint導(dǎo)...
一般transformer模型有三個(gè)部分組成:1.tokennizer邪蛔,2.Model,3.Post processing [圖片上傳失敗...(image-92e142-1...
Kubernetes指定docker的Entrypoint 下表給出了 Docker 與 Kubernetes 中對(duì)應(yīng)的字段名稱竞川。 如果要覆蓋默認(rèn)的 Entrypoint 與...
consul 相信大家已經(jīng)知道了店溢,在日常的開發(fā)以及運(yùn)維中也會(huì)常常聽到 consul 這個(gè)詞叁熔,但是不是所有的人都知道它是什么?它在運(yùn)維中扮演了什么樣的角色呢床牧? 首先荣回,我們來看下...
Ceph Ceph是一個(gè)可靠、自動(dòng)重均衡戈咳、自動(dòng)恢復(fù)的分布式存儲(chǔ)系統(tǒng)心软。Ceph沒有單點(diǎn)故障的問題,數(shù)據(jù)強(qiáng)一致性著蛙,在部分節(jié)點(diǎn)出現(xiàn)故障的時(shí)候依然能夠正常存取文件删铃。 高可用性:Cep...