1 語音 圖像 文本
語音識別 光學字符識別 轉化為文本
2 中文分詞、詞性標注绳瘟、命名實體識別
圍繞詞語進行的分析——統(tǒng)稱【詞法分析】
- 中文分詞:將文本分割為有意義的詞語
- 詞性標注:確定每個詞語的類別和淺層的歧義消除
- 命名實體識別:識別出一些較長的專有名詞
2.1信息抽取
詞法分析之后络断,文本已經(jīng)呈現(xiàn)出部分結構化的趨勢(計算機看到的是有意義的單詞列表毡琉,并且每個單詞還附有自己的詞性以及其他標簽)
根據(jù)單詞與標簽蕾久,抽取出一部分有用的信息
2.2文本分類與文本聚類
2.3句法分析
2.3.1語義分析與篇章分析
語義分析側重語義而非語法,包括詞義消歧歌豺、語義角色標注推穷、語義依存分析
其他高級任務
自動問答、自動摘要类咧、機器翻譯