2017年5月20日,在這個(gè)浪漫的日子里冶忱,集智AI第三期《自然語(yǔ)言處理與產(chǎn)業(yè)應(yīng)用》課程開(kāi)始了庆揪。一群熱愛(ài)人工智能的小伙伴們放棄了約會(huì),放棄了玩耍义矛,一起來(lái)到美麗的北京亦莊鋒創(chuàng)產(chǎn)業(yè)園发笔,探討如何讓機(jī)器更好地理解語(yǔ)言。
首先凉翻,集智AI學(xué)園的園長(zhǎng)張倩為此次課程做了開(kāi)幕了讨,并邀請(qǐng)了鋒創(chuàng)科技有總裁張寒燕女士做了致辭。
張寒燕女士介紹了深知無(wú)限人工智能研究院制轰,并熱情的歡迎廣大科技人才和人工智能創(chuàng)業(yè)者入駐鋒創(chuàng)前计。
上午的課程由聯(lián)想人工智能實(shí)驗(yàn)室負(fù)責(zé)人徐飛玉老師給大家?guī)?lái)《自然語(yǔ)言處理與產(chǎn)業(yè)應(yīng)用》。徐老師優(yōu)雅垃杖、大方男杈、有風(fēng)度,她的課深深地吸引了我們调俘。
徐老師并沒(méi)有一上來(lái)就講那些艱深的語(yǔ)言處理技術(shù)伶棒,而是從語(yǔ)言的基本原理旺垒、語(yǔ)言的多義性切入,引起了大家濃厚的興趣肤无。語(yǔ)言是一門(mén)復(fù)雜的學(xué)科先蒋,不同的表達(dá)、語(yǔ)境舅锄、涵義甚至連人類都不能完全掌握鞭达,這也讓我們明白了一個(gè)好的語(yǔ)言類AI一定是融合了計(jì)算機(jī)科學(xué)學(xué)、語(yǔ)言學(xué)皇忿、心理學(xué)的“技術(shù)+人文”綜合體畴蹭,絕不僅僅只是幾行代碼那么簡(jiǎn)單。
接下來(lái)徐飛玉老師給我們講解了文本分析技術(shù)鳍烁,如何借助行業(yè)專家的幫助找到想抽取的信息叨襟,如何找到標(biāo)注好的語(yǔ)料,如何把非結(jié)構(gòu)的文本變成結(jié)構(gòu)化的信息幔荒,每一個(gè)步驟徐老師都講得非常耐心和仔細(xì)糊闽。最后,針對(duì)文本大數(shù)據(jù)分析爹梁,徐老師給出了自己的觀點(diǎn)右犹。文本大數(shù)據(jù)具有大容量、多種類姚垃、高速度的特點(diǎn)念链,在處理的過(guò)程中可以把非結(jié)構(gòu)化的文本查詢處理成結(jié)構(gòu)化的查詢檢索和答案引擎,要搜集和建立海量信息知識(shí)庫(kù)积糯,并且把非結(jié)構(gòu)數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)結(jié)合在一起掂墓,最終做到高效、強(qiáng)大看成、可擴(kuò)展君编、域自適應(yīng)。徐老師說(shuō)開(kāi)發(fā)技術(shù)一定要細(xì)川慌,不能希望一個(gè)model解決所有問(wèn)題吃嘿,給了同學(xué)們很深的啟發(fā)和思考。
下午的課程是另一位大咖是華院數(shù)據(jù)首席數(shù)據(jù)科學(xué)家尹相志老師給大家?guī)?lái)的《中文自然語(yǔ)言理解傳統(tǒng)任務(wù)》梦重。
在深度學(xué)習(xí)大行其道的今天兑燥,很多技術(shù)工程師都希望把大數(shù)據(jù)丟給神經(jīng)網(wǎng)絡(luò),通過(guò)調(diào)參直接得到好的結(jié)果忍饰,但是尹老師告訴我們技術(shù)無(wú)貴賤贪嫂,融合才是王道寺庄。語(yǔ)言不能脫離語(yǔ)意與場(chǎng)景而獨(dú)立存在艾蓝,因此在理解自然語(yǔ)言的任務(wù)上力崇,傳統(tǒng)方法會(huì)是前沿突破的重要關(guān)鍵。尹老師給我們講解了中文自然語(yǔ)言理解的最重要的基礎(chǔ)——中文分詞的方法赢织,如何在分詞的過(guò)程中同時(shí)考慮詞性放在一起理解亮靴,如何構(gòu)建詞向量,如何根據(jù)漢字的形音結(jié)構(gòu)探索中文字向量于置。英文有26個(gè)字母茧吊,日語(yǔ)有50多個(gè)片假名,而中文的常用字卻有2萬(wàn)多個(gè)八毯,并且中文是世界上少見(jiàn)的一種字和詞全部連在一起表達(dá)搓侄、中間沒(méi)有空格的語(yǔ)言。漢字是老祖宗留給我們的寶貴的文化遺產(chǎn)话速,中文的理解具有很高的壁壘讶踪,這是無(wú)數(shù)中國(guó)科學(xué)家和技術(shù)工程師集合智慧想要去攀登的高峰。
最后一部分課程是張江老師的《AI思維與AI創(chuàng)業(yè)》泊交。
張江老師深刻地指出在AI的大潮下乳讥,我們應(yīng)該樹(shù)立機(jī)器學(xué)習(xí)思維,機(jī)器學(xué)習(xí)就是計(jì)算的逆運(yùn)算廓俭,用有限的數(shù)據(jù)生成無(wú)限的數(shù)據(jù)云石,只管相關(guān)不管因果。而深度網(wǎng)絡(luò)中不同的權(quán)重記憶了數(shù)據(jù)中不同層次的模式研乒,傳統(tǒng)機(jī)器學(xué)習(xí)的本質(zhì)就是特征工程汹忠,由人來(lái)確定提取特征的規(guī)則,深度學(xué)習(xí)的本質(zhì)在于特征學(xué)習(xí)告嘲,將提取特征的任務(wù)交給機(jī)器來(lái)完成错维。更進(jìn)一步,學(xué)習(xí)得到的特征還可以遷移橄唬,于是便有了遷移學(xué)習(xí)赋焕。深度學(xué)習(xí)可以看成是一種端到端的模型,輸入端仰楚、輸出端可以分別是圖片隆判、語(yǔ)音、文本僧界,不同類型的輸入輸出組合便給了我們系統(tǒng)性地創(chuàng)造深度學(xué)習(xí)應(yīng)用的方法侨嘀。自由提問(wèn)環(huán)節(jié),大家對(duì)人工智能的威脅捂襟、是否有終極算法等問(wèn)題展開(kāi)了腦洞大開(kāi)的討論咬腕,大家各抒己見(jiàn),氣氛十分熱烈葬荷。
一天的課程結(jié)束了涨共,晚餐期間大家一起交流著心得體會(huì)纽帖,集智AI俱樂(lè)部不僅帶給我們很多知識(shí)的干貨,更讓我們結(jié)識(shí)了志同道合的小伙伴举反,非常感謝集智這個(gè)大家庭懊直。
下期課程專題《人工智能與金融》
敬請(qǐng)期待
資訊課程可添加園長(zhǎng)微信號(hào)cancyqian