基于大語言模型+RAG實現(xiàn)的日程管理

? ? ?大家是否有這樣的煩惱,每天會議或待辦事項眾多这刷,為了把這些待辦事項記住我們需要采用日歷這些軟件來幫我們管理或通知事項婉烟。那么問題來了,不同的人通知的不同事項寫得五花八門崭歧,有沒有辦法把別人發(fā)過來的通知自動解析隅很,自動推送到自己手機上呢?

?????? 答案是有的率碾,我們采用大模型進行文本解析叔营,然后結(jié)合檢索增強生成(RAG)對LLM進行準(zhǔn)確性提升,從而達到使用簡單所宰、準(zhǔn)確性逐漸提高的目的绒尊。下面我將介紹如何完全基于免費公有云進行全流程開發(fā)。

一仔粥、 web和后臺程序

Cloudflare Pages是Cloudflare公司推出的一個靜態(tài)網(wǎng)站托管服務(wù),專門為開發(fā)者提供構(gòu)建和部署現(xiàn)代化婴谱、高性能網(wǎng)站的解決方案。隨后在pages引入了funtion躯泰,至此也支持workers這樣的應(yīng)用谭羔,成為了一個前、后臺應(yīng)用都能實現(xiàn)的網(wǎng)站平臺麦向。

在使用的過程中我發(fā)現(xiàn)一個很厲害的功能瘟裸,在本地調(diào)試時也能自動引用大模型生成能力。

二诵竭、大語言模型

Cloudflare 的Workers AI支持30多種20B以下模型话告,每天有足夠的調(diào)用量,以學(xué)習(xí)為目的基本夠用卵慰。根據(jù)提供的文本沙郭,LLM根據(jù)要求返回JSON格式的會議主題、開始時間裳朋、結(jié)束時間病线、會議地點等。模型采用@cf/qwen/qwen1.5-14b-chat-awq鲤嫡,提示詞如下:

? let messages = [

? ? {? ? ? role: 'system',? ? ? content: '你是一個AI日程安排助手氧苍,請根據(jù)我提供的內(nèi)容提取日程信息,并用JSON格式返回泛范, 格式為 {"SUMMARY":"日程主題让虐、簡介、總結(jié)或概括", "DTSTART":"日程開始時間罢荡,格式為:20240525T063000","DTEND":"日程結(jié)束時間赡突,格式為:20240525T063000","DESCRIPTION","日程詳細(xì)描述信息","LOCATION":"會議地點"}' },

? ? {? ? role: 'system',? ? ?content:? '只回復(fù)json格式的內(nèi)容即可,今天的日期是:' + getTodayDate() + ';如果沒有說明會議結(jié)束時間或會議時長,默認(rèn)為開始時間加1小時;如果沒有說明會議具體幾點開始則會議從當(dāng)天0點開始24點結(jié)束,dtstart和dtend只能按要求的日期格式回答,采用東八區(qū)時間对扶,不要采用,無法提取的內(nèi)容不要回復(fù)該字段'? }

? ]

三、 RAG

引入檢索增強生成(RAG)目的時為了提升日程解析的準(zhǔn)確性惭缰,當(dāng)你使用越多的時候浪南,系統(tǒng)會自動把你之前修正過的對話作為上下文提供給llm,從而快速提升模型輸出的準(zhǔn)確性漱受,例如下圖1络凿,第一次問會議地點識別為“1會議室”,但是我們幫它修正為“第一會議室”昂羡,后續(xù)再問“1會”的時候LLM就會自動識別為“第一會議室”絮记,這就是RAG能夠減輕幻覺,提升準(zhǔn)確性的好處虐先。

RAG第一步是量化怨愤,直接采用Workers AI的量化模型,向量數(shù)據(jù)庫采用https://qdrant.tech/免費服務(wù)蛹批,向量數(shù)據(jù)庫是一種專門設(shè)計用于高效存儲和查詢高維向量的數(shù)據(jù)庫撰洗。在傳統(tǒng)的OLTP和OLAP數(shù)據(jù)庫中數(shù)據(jù)以行和列的方式組織(這些被稱為表),查詢是基于這些列中的值進行的腐芍。然而差导,在某些應(yīng)用中,如圖像識別猪勇、自然語言處理和推薦系統(tǒng)柿汛,數(shù)據(jù)通常以高維空間中的向量形式表示,這些向量加上一個ID和有效負(fù)載埠对,就是我們存儲在類似于Qdrant的向量數(shù)據(jù)庫中的元素。

地址修正為“第一會議室”裁替,后續(xù)再次調(diào)用就會自動修正项玛。


四、 ICS文件保存

日歷文件以ICS作為后綴弱判,采用Cloudflare R2作為文件存儲空間襟沮。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市昌腰,隨后出現(xiàn)的幾起案子开伏,更是在濱河造成了極大的恐慌,老刑警劉巖遭商,帶你破解...
    沈念sama閱讀 221,635評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件固灵,死亡現(xiàn)場離奇詭異,居然都是意外死亡劫流,警方通過查閱死者的電腦和手機巫玻,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,543評論 3 399
  • 文/潘曉璐 我一進店門丛忆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人仍秤,你說我怎么就攤上這事熄诡。” “怎么了诗力?”我有些...
    開封第一講書人閱讀 168,083評論 0 360
  • 文/不壞的土叔 我叫張陵凰浮,是天一觀的道長。 經(jīng)常有香客問我苇本,道長袜茧,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,640評論 1 296
  • 正文 為了忘掉前任圈澈,我火速辦了婚禮惫周,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘康栈。我一直安慰自己递递,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 68,640評論 6 397
  • 文/花漫 我一把揭開白布啥么。 她就那樣靜靜地躺著登舞,像睡著了一般。 火紅的嫁衣襯著肌膚如雪悬荣。 梳的紋絲不亂的頭發(fā)上菠秒,一...
    開封第一講書人閱讀 52,262評論 1 308
  • 那天,我揣著相機與錄音氯迂,去河邊找鬼践叠。 笑死,一個胖子當(dāng)著我的面吹牛嚼蚀,可吹牛的內(nèi)容都是我干的禁灼。 我是一名探鬼主播,決...
    沈念sama閱讀 40,833評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼轿曙,長吁一口氣:“原來是場噩夢啊……” “哼弄捕!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起导帝,我...
    開封第一講書人閱讀 39,736評論 0 276
  • 序言:老撾萬榮一對情侶失蹤守谓,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后您单,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體斋荞,經(jīng)...
    沈念sama閱讀 46,280評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,369評論 3 340
  • 正文 我和宋清朗相戀三年虐秦,在試婚紗的時候發(fā)現(xiàn)自己被綠了譬猫。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片讯檐。...
    茶點故事閱讀 40,503評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖染服,靈堂內(nèi)的尸體忽然破棺而出别洪,到底是詐尸還是另有隱情,我是刑警寧澤柳刮,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布挖垛,位于F島的核電站,受9級特大地震影響秉颗,放射性物質(zhì)發(fā)生泄漏痢毒。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,870評論 3 333
  • 文/蒙蒙 一蚕甥、第九天 我趴在偏房一處隱蔽的房頂上張望哪替。 院中可真熱鬧,春花似錦菇怀、人聲如沸凭舶。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,340評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽帅霜。三九已至,卻和暖如春呼伸,著一層夾襖步出監(jiān)牢的瞬間身冀,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,460評論 1 272
  • 我被黑心中介騙來泰國打工括享, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留搂根,地道東北人。 一個月前我還...
    沈念sama閱讀 48,909評論 3 376
  • 正文 我出身青樓铃辖,卻偏偏與公主長得像剩愧,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子澳叉,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,512評論 2 359

推薦閱讀更多精彩內(nèi)容