1.1 為什么要學習NLP
NLP:Natural Language Processing汰具,自然語言處理
(2014年,NLP處在技術成熟度曲線的頂部)
應用示例
· 拼寫校正 ? ? ? ? ? ? ? ? ? ?· 搜索引擎 ? ? ? ? ? ? ? ?· 語音引擎
· 垃圾郵件分類 ? ? ? ? ? ?· 新聞推送 ? ? ? ? ? ? ? ?· 機器翻譯
??
NLP工具列表
·GATE ? ? ? ? ? ? ? ? ? ?·Mallet ? ? ? ? ? ? ·Open NLP ? ? ? ? ? ? ·UIMA
·斯坦福工具包 ? ? ?·Genism ? ? ? ? ? ·自然語言工具包(NLTK)?
? ? NLTK在易于使用和易于解釋上表現最佳。
提示
? ? 在python網站下載python紫谷,按照nltk網站說明摸吠,安裝NLTK和NLTK數據
1.2 從Python的基本知識開始
1.2.1 列表? ??
list = [1,2,3,4]
print('最后一個列表元素:'+ str(list[-1]))
print('前三個列表元素:'+ str(list[0:2]))
print('倒數三個列表元素:'+ str(list[-3:]))
1.2.2 自助
【幫助函數】
1、dir()
? ? 列出給定python對象的所有給定的屬性析显。
2、help()
? ?給定python對象的詳細文檔签赃,并且一些示例谷异,告訴如何使用python對象。
【處理字符串的基本函數】
3锦聊、split()
? ? 基于一些分隔符分割字符串歹嘹。如果不提供任何參數,默認以空格作為分隔符孔庭。 ? ?
4尺上、strip()
? ? 刪除字符串的尾隨空格,例如'\n''\n\R'圆到。
5怎抛、upper/lower()
? ? 改變字符串中字母的大小寫。
6芽淡、replace()
? ? 替換字符串中的子字符串马绝。
?? ?
1.2.3 正則表達式
1、字符
2挣菲、re模塊
????re 模塊使 Python 語言擁有全部的正則表達式功能富稻。
? ? re.match函數;re.search方法白胀;re.sub椭赋;re.compile…
1.2.4 詞典
? ? 詞典是使用鍵(key)進行索引的數據結構,這些鍵可以是任何不可變的類型或杠。
(詞典常見用例之一哪怔,獲得單詞的頻率分布,在1.2.5部分有)
1.2.5 函數
關鍵詞def + 函數名 +圓括號()
1.3 NLTK
資料來源:
1向抢、《Python和NLTK自然語言處理》
2认境、Gartner2018年新興技術成熟度曲線解讀 ? ? ? ?? ?????
? ??https://cloud.tencent.com/developer/news/304533
3、Python 正則表達式
? ??https://www.runoob.com/python/python-reg-expressions.html
? ??正則表達式-菜鳥教程
? ??https://www.runoob.com/regexp/regexp-intro.html