年初以來,AI大模型概念持續(xù)引發(fā)市場關注沛厨,相關上市公司股價持續(xù)上揚宙地。在透露正在研發(fā)類ChatGPT對話機器人兩個月后,阿里終于亮出了自己的研究成果逆皮,這也再度推高了中文大模型的熱度宅粥。
4月7日中午,沒有高調(diào)召開發(fā)布會电谣,而是通過官方微信秽梅,阿里云宣布自研大模型“通義千問”正式開始邀請用戶測試體驗。據(jù)稱辰企,現(xiàn)階段“通義千問”模型主要定向邀請企業(yè)用戶進行體驗測試风纠。
觀察者網(wǎng)也率先拿到了“通義千問”的首批測試資格,并對其進行了深度實測牢贸。
在測試中竹观,“通義千問”提到,它是達摩院自主研發(fā)的超大規(guī)模語言模型潜索,能夠回答問題臭增、創(chuàng)作文字,也能表達觀點竹习、撰寫代碼誊抛。
但這也間接說明,“通義千問”主攻文本生成整陌,并沒有文生圖拗窃、圖生文的多模態(tài)功能瞎领。
當被問及什么時候開始被訓練時,“通義千問”透露随夸,它是在2016年被創(chuàng)造出來的九默,當時被訓練成能夠回答各種問題和提供幫助的人工智能語言模型。
但它似乎對自己在哪里被訓練的有點說不太清宾毒。
在被問及參數(shù)量時驼修,“通義千問”表示,其參數(shù)量相對較多诈铛,由于涉及敏感內(nèi)容乙各,具體的參數(shù)量數(shù)值并不能透露,“我可以生成各種類型的文本幢竹,如文章耳峦、故事、詩歌妨退、故事等妇萄,并能夠根據(jù)不同的場景和需求進行變換和擴展”。
市場反應方面咬荷,今日(4月7日)港股沒有開盤冠句。
不過A股的人工智能概念股,再度火熱幸乒。ChatGPT懦底、游戲、文化傳媒方向領漲罕扎,據(jù)不完全統(tǒng)計聚唐,中文在線、神州泰岳20CM漲停腔召,奧飛娛樂杆查、上海電影漲停,方直科技臀蛛、光云科技大漲超10%亲桦。
多角度測試,“通義千問”表現(xiàn)如何浊仆?
由于AI大模型擅長回答各種問題客峭,觀察者網(wǎng)也從多個角度對“通義千問”進行了測試。
比如抡柿,我們問它是否知道觀察者網(wǎng)舔琅。“通義千問”表示洲劣,“是的备蚓,我知道觀察者網(wǎng)课蔬。觀察者網(wǎng)是一家致力于提供新聞和信息的新聞門戶網(wǎng)站,它提供了大量的國內(nèi)外新聞和深度分析郊尝,并致力于推動社會進步和改變购笆。”
但“通義千問”好像并不能憑借簡單指令生成商業(yè)宣傳口號虚循。
隨后我們將話題轉向體育領域。
被問道“梅西在阿根廷國家隊進了幾個球”样傍,“通義千問”稱横缔,根據(jù)可靠的數(shù)據(jù),梅西在阿根廷國家隊的進球數(shù)量是很多的衫哥。不過由于“具體的進球數(shù)量數(shù)值茎刚,可能會因為時間的推移而有所變化”,“通義千問”婉拒了為我們提供準確答案的請求撤逢。
當被要求“生成一張打籃球的圖片”膛锭,“通義千問”表示,作為文本AI模型蚊荣,它沒有能力生成圖片初狰。
這一點也證實了“通義千問”不具備多模態(tài)功能。
我們也讓“通義千問”試圖回答和自己其他大模型的能力對比問題互例。
無論是對比文心一言還是ChatGPT奢入,“通義千問”都顯得很主動,它先是介紹了自己的優(yōu)勢媳叨,最后再積極地表示腥光,自己可以更好地滿足用戶的需求。
不過如果要求苛刻一點糊秆,不難發(fā)現(xiàn)武福,兩個問題的答案有很多相似之處。
當被問及“怎么看待現(xiàn)在大模型的火熱”痘番?“通義千問”稱捉片,它認為大模型的火熱是一個好現(xiàn)象,大模型可以幫助我們更好地理解世界夫偶,提高我們的工作效率界睁,拓展我們的認知邊界。但這也帶來了一些問題兵拢,比如人工智能的倫理問題翻斟、隱私問題等。因此说铃,我們需要認真思考如何在技術的發(fā)展中平衡安全访惜、發(fā)展和責任嘹履。
這也驗證了“通義千問”表達觀點的功能。
最后的系列問題涵蓋成語典故债热、詩詞接龍砾嫉、傳統(tǒng)美食等,“通義千問”小小地翻車了幾次窒篱。
例如它將東施效顰的東施焕刮,解釋為“美女”,這不太符合不少人對這一典故的基本印象墙杯。在《莊子》等典籍中配并,對這個故事中“東施”一類的角色,描述也是“其里之丑人”高镐。
在有關傳統(tǒng)文化方面溉旋,“通義千問”沒有正確給出“停車坐愛楓林晚”的下句。
對于“曹操什么時候三顧茅廬的”這樣的“坑”嫉髓,“通義千問”也未能識別提問者主動設置的“陷阱”观腊。