今天是2025年的元宵節(jié)葵孤,隨筆把開年的思考做一個記錄。
2025年春節(jié)期間deepseek火了,今天從自己的思考角度分享一些觀點惊橱,其中有遙不可及文化大佬的觀點引用,也有身邊行業(yè)大咖們的碎片分享叠骑,就不一一做出處說明李皇。
人的知識結(jié)構(gòu):知識、方法宙枷、智慧掉房。知識屬于社會,智慧屬于個人慰丛。知識可以授受卓囚,方法靠示范,智慧靠啟迪诅病。比如計算機硬盤里哪亿,我們有非常多的文檔,它是知識贤笆,必須加上程序是方法蝇棉,結(jié)合起來才有智慧。
--易中天
推理能力
計算機技術(shù)一直在提升人類處理信息的效率芥永,而今天大模型時代是提供了人類處理信息的“推理能力”篡殷,把計算機向智慧體進化。
我所理解的計算機處理信息的階段埋涧,劃分為:信息階段板辽、認知階段、推理階段棘催。
我們以:滴滴想開車去北京劲弦。這一個需求背景,來設(shè)想醇坝。
計算機的單機時代邑跪、互聯(lián)網(wǎng)時代、移動互聯(lián)網(wǎng)時代都是處于:信息處理階段呼猪。只是這三個時代演進中呀袱,計算設(shè)備的形態(tài)變革,信息處理本質(zhì)上沒有大的超越郑叠。今天的時間節(jié)點來看信息階段很好理解了夜赵;在認知階段,做為程序的開發(fā)者乡革,必須自己去設(shè)計和理解“我想開車去北京”的背后需求寇僧,然后再寫一段代碼去實現(xiàn)導(dǎo)航信息摊腋、天氣信息的獲取,整合后提供給用戶使用嘁傀。認知=認識+知道兴蒸。一段文字、一張圖片细办、一段視頻橙凳、一段語音等(下文統(tǒng)稱為:信息載體),認知階段就完成:認識信息載體是什么類型笑撞,知道信息載體包含的信息岛啸。
文字推理能力
大模型誕生以前,通過nlp技術(shù)茴肥,計算機可以理解“文本”背后的邏輯和語意關(guān)系了坚踩,比如:滴滴想開車去北京。在信息處理階段瓤狐,計算機只能單純的知道這7個文字瞬铸,文字僅僅是文字,不是一句話础锐,更不知道這句話表達的含義嗓节;如果您是滴滴同學(xué),你自己還得使用導(dǎo)航軟件看下路況和最佳路徑皆警,然后再通過天氣app查詢下未來12小時內(nèi)天氣情況拦宣。注意,這三件事情耀怜,都得滴滴同學(xué)一個步驟一個步驟的去完成恢着,然后他自己去判斷:現(xiàn)在出發(fā)是否可行桐愉,到達北京的時間點和天氣自己是否可以不凍感冒财破。
大模型出來后,計算機來到了推理階段从诲。大模型可以通過“滴滴想開車去北京”推理出來進一步信息:開車去北京就需要知道:基于當(dāng)前時間點左痢,未來10小時內(nèi)的路況和導(dǎo)航信息、天氣信息系洛,這兩個信息具備了俊性,可以提升:滴滴想開車去北京的成功率和順暢度。同時描扯,還可以根據(jù)路況和天氣情況給滴滴同學(xué)建議出發(fā)的時間點和導(dǎo)航最優(yōu)路況定页。后面這一步,在今天通過大模型就非常簡單的實現(xiàn)了绽诚,并且是全自動在一個地方完成典徊,不需要切換多個app杭煎。
圖片推理能力
大模型誕生以前,通過openCV技術(shù)卒落,計算機可以理解“圖片”包含的信息羡铲,但是,僅僅是知道了圖片包含的信息儡毕,就沒有然后了也切。然后的事情,還得靠程序員繼續(xù)規(guī)劃和設(shè)計業(yè)務(wù)邏輯腰湾,才可以完成一些相對復(fù)雜的業(yè)務(wù)需求雷恃。
先看以下兩張圖片:
在信息階段,計算機完成:圖片的生成檐盟、存儲褂萧、處理、分享等葵萎。在認知階段导犹,計算機完成:圖片識別。圖1識別結(jié)果是:兩個杯子和一部移動電話羡忘。圖片2識別結(jié)果(假設(shè)是使用的yolo做對象人識別)是:11個人谎痢,1個足球,N個觀眾卷雕。然后节猿,就沒有然后了,后端程序接收到識別結(jié)果后漫雕,基于業(yè)務(wù)需求再去寫具體的業(yè)務(wù)需求滨嘱。
比如圖1輸出:杯子1+黑色,杯子2+白色浸间,移動電話+黑色太雨,程序再結(jié)合識別結(jié)果去干后續(xù)任務(wù):計數(shù)、顏色區(qū)分魁蒜、材質(zhì)區(qū)分等囊扳。比如圖2輸出:人11+(黃色、黑色兜看、白色锥咸、紅色),足球1+白色细移,程序再結(jié)合識別結(jié)果去干后續(xù)任務(wù):人數(shù)統(tǒng)計搏予、基于顏色的球隊區(qū)分、進攻防守區(qū)分等弧轧。注意雪侥,前面兩個示例的“后續(xù)任務(wù)”都是需要程序員代碼實現(xiàn)(此處忽略產(chǎn)品經(jīng)理等流程)球涛。
如果基于當(dāng)前圖片識別結(jié)果,再能推理判斷下這個圖片背后的更多信息和邏輯關(guān)系校镐,再進一步行動和決策就更具科學(xué)性亿扁。這是人類期待的計算達到的高度。以前的技術(shù)在后半截的處理是有技術(shù)障礙的鸟廓,今天的大模型出來后从祝,補充了這部分的技術(shù)障礙。
到了大模型時代引谜,接入DS后牍陌,大模型基于“圖1+圖2”的輸入,自動理解圖片员咽,然后我們附件需要實現(xiàn)的提示詞毒涧,計算機就會完成以前需要多個程序塊才能完成的復(fù)制任務(wù)。
比如圖1贝室,把圖1輸入大模型契讲;同時,再輸入一個提示詞:告訴我上述圖片中包含了什么滑频?分別分析出他們的材質(zhì)和顏色捡偏。同時,再分析一下這個圖片會有什么潛在風(fēng)險峡迷?
圖2银伟,把圖2輸入大模型;同時绘搞,再輸入一個提示詞:以目前圖片的情況彤避,結(jié)合附件excel提供的兩支球隊最近1年的戰(zhàn)績數(shù)據(jù),幫我預(yù)測本場球賽的比分夯辖。(本場比賽的當(dāng)前比分琉预、比賽時長等信息都位于圖片左上角,大模型自己識別)
ps:嘗試過幾個視覺模型楼雹,效果都沒達到筆者預(yù)期的效果模孩,所以就不分享示例截圖了尖阔。但這只是一個時間問題贮缅。
好了,前面通過2個簡單的示例來說明大模型在:感知和推理方面帶來的巨大變革介却。一是記錄自己最近的思考筆記谴供,二來通過通俗易懂的語言解釋大模型,供能看到我朋友圈的每一位好朋友們齿坷,快速高效理解AI原理桂肌。說小點数焊,不至于在販賣焦慮的大環(huán)境下焦慮,撥開迷霧看本質(zhì)崎场。說大點佩耳,更多的好朋友們理解了大模型,如何優(yōu)化自己的工作效率谭跨,優(yōu)化自己的產(chǎn)品等等干厚。最后分享身邊大咖們的觀點結(jié)束此文(我得準備過節(jié)去),更多信息和思考后面再行補充吧螃宙。
有個說法蛮瞄,用于評價是AI+還是+AI
1,去掉AI谆扎,產(chǎn)品就掛了挂捅,就是AI+
2,去掉AI堂湖,產(chǎn)品變傻了闲先,就是+AI
結(jié)論:AI+是雜交生命,+AI是平替續(xù)命无蜂。
--某大咖
符號不一定是信息饵蒂,信息不一定是數(shù)據(jù),數(shù)據(jù)不一定是知識酱讶,知識絕對不等于智慧退盯。
在AI平權(quán)時代,大家都可以利用好AI工具泻肯,好干工作渊迁,干好工作。
---------------------------------20250218補充視覺大模型識別結(jié)果--------------------------------
劉子潤于長安
2025-02-12