第一章 文字的發(fā)展史與信息的關(guān)系
本章主要描述了文字和語言的發(fā)展歷史懊亡,
1.語言的發(fā)展歷史:
在遠(yuǎn)古時(shí)候通過聲音來提醒同伴瞧掺,隨著社會(huì)的發(fā)展需要表達(dá)的信息越來越多幾種聲音是表達(dá)不了所以就產(chǎn)生了語言。
2.文字的發(fā)展歷史:
祖先們學(xué)習(xí)新的事物健霹,語言越來越豐富越來越抽象形成了很多詞匯旺上。而太多的詞匯記不住就產(chǎn)生了文字。
埃及產(chǎn)生了象形文字骤公,隨著社會(huì)的發(fā)展象形文字無法表達(dá)就產(chǎn)生了第一次的概括和歸類,比如一次多義扬跋。
象形文字到拼音文字
人類描述物體從具體的外形進(jìn)化到了抽象的概念阶捆。我們祖先對(duì)文字的編碼也非常合理常用詞短。
第二章 規(guī)則與統(tǒng)計(jì)
前段時(shí)間自然語音處理把精力都花在了對(duì)語言本身的研究上,比如語義分析和知識(shí)表示洒试。
語言發(fā)展過程中上下文有關(guān)文法倍奢,所以文法特別復(fù)雜挖掘起來相當(dāng)困難。
后來自然語言領(lǐng)域采用另外一種思路即從現(xiàn)有預(yù)料中統(tǒng)計(jì)詞和句子出現(xiàn)的概率來識(shí)別語音垒棋。
看到這我想到如下具體場(chǎng)景問題:
1.比如機(jī)器翻譯英->中卒煞,我怎么知道這個(gè)英文句子跟哪個(gè)中文對(duì)應(yīng)呢?
2.語音識(shí)別叼架,聲音轉(zhuǎn)文字什么樣的聲音用什么文字表達(dá)出來呢畔裕?