自然語言處理 pytorch版本

從今天開始翻譯<Natural Language Processing with PyTorch> by Goku Mohandas, Brian McMahan, Delip Rao

自然語言處理(NLP)為人工智能中的一個有趣問題酒请,是深度學習的應用程序的最新前沿粥帚。如果您是一名開發(fā)人員或研究人員,準備深入研究這個快速發(fā)展的人工智能領域,這本實用的書籍將向您展示如何使用PyTorch深度學習框架來實現(xiàn)最近發(fā)現(xiàn)的NLP技術侨颈。首先匣椰,您需要的是機器學習背景和使用Python編程的經驗冰啃。

作者Delip Rao和Goku Mohandas為您提供了PyTorch的堅實基礎伍掀,以及深度學習算法,用于構建涉及文本語義表示的應用程序萤厅。每章包括幾個代碼示例和插圖

  • 獲得對NLP橄抹,深度學習和PyTorch介紹
  • 了解傳統(tǒng)的NLP方法,包括NLTK惕味,SpaCy和gensim
  • 探索嵌入:語言中單詞的高質量表示
  • 使用遞歸神經網絡(RNN)學習語言序列中的表示
  • 通過復雜的神經架構改進RNN結果楼誓,例如長期短期記憶(LSTM)和門控遞歸單位
  • 探索讀取一個序列并產生另一個序列的序列到序列模型(用于翻譯)
  1. 前言
  2. 1.簡介
    1. 監(jiān)督學習范式
    2. 觀察和目標編碼
      1. 一熱表示
      2. TF表示
      3. TF-IDF表示
      4. 目標編碼
    3. 計算圖
    4. PyTorch基礎知識
      1. 安裝PyTorch
      2. 創(chuàng)建張量
      3. 張量類型和尺寸
      4. 張量操作
      5. 索引,切片和連接
      6. 張量和計算圖
      7. CUDA Tensors
    5. 演習
    6. 解決方案
    7. 摘要
    8. 參考
  3. 2.傳統(tǒng)NLP的快速瀏覽
    1. 語料庫名挥,代幣和類型
    2. Unigrams疟羹,Bigrams,Trigrams禀倔,...榄融,Ngrams
    3. Lemmas和Stems
    4. 對句子和文件進行分類
    5. 分類單詞:POS標記
    6. 分類跨度:分塊和命名實體識別
    7. 句子結構
    8. 詞語感和語義學
    9. 摘要
    10. 參考
  4. 3.神經網絡的基礎組件
    1. 感知器:最簡單的神經網絡
    2. 激活功能
      1. 乙狀結腸
      2. 正切
      3. RELU
      4. SOFTMAX
    3. 損失函數
      1. 均方誤差損失
      2. 分類交叉熵損失
      3. 二進制交叉熵
    4. 深入監(jiān)督培訓
      1. 構建玩具數據
      2. 將它放在一起:基于梯度的監(jiān)督學習
      3. 輔助培訓概念
      4. 正確衡量模型績效:評估指標
      5. [正確測量模型性能:拆分數據集])
      6. 知道何時停止訓練
      7. 尋找合適的超參數
      8. 正則
    5. 示例:餐廳評論的情緒分類
      1. Yelp評估數據集
      2. 了解PyTorch的數據集表示
      3. 詞匯表,Vectorizer和DataLoader
      4. 感知器分類器
      5. 訓練套路
      6. 評估救湖,推理和檢查
    6. 摘要
  5. 4.自然語言處理的前饋網絡
    1. 多層感知器
      1. 一個簡單的例子:異或
      2. 在PyTorch中實現(xiàn)MLP
    2. 示例:使用多層感知器進行姓氏分類
      1. 姓氏數據集
      2. 詞匯愧杯,Vectorizer和DataLoader
      3. 姓氏分類器模型
      4. 訓練套路
      5. 模型評估與預測
      6. 規(guī)范MLP:權重正則化和結構正規(guī)化(或輟學)
    3. 卷積神經網絡
      1. CNN超參數
      2. 在PyTorch中實現(xiàn)CNN
    4. 示例:使用CNN對姓氏進行分類
      1. SurnameDataset
      2. 詞匯,Vectorizer和DataLoader
      3. 用卷積網絡重新實現(xiàn)SurnameClassifier
      4. 訓練套路
      5. 模型評估與預測
    5. CNN中的其他主題
      1. 匯集操作
      2. 批量標準化(BatchNorm)
      3. 網絡中網絡連接(1x1卷積)
      4. 剩余連接/殘留塊
    6. 摘要
    7. 參考
  6. 5.嵌入單詞和類型
    1. 為什么要學習嵌入鞋既?
      1. 嵌入效率
      2. 學習Word嵌入的方法
      3. 預訓練詞嵌入的實際應用
    2. 示例:學習連續(xù)的單詞嵌入
      1. 弗蘭肯斯坦數據集
      2. 詞匯力九,Vectorizer和DataLoader
      3. CBOW分類器
      4. 訓練常規(guī)
      5. 模型評估與預測
    3. 示例:使用預訓練嵌入進行文檔分類的轉移學習
      1. AG新聞數據集
      2. 詞匯耍铜,Vectorizer和DataLoader
      3. 新聞分類器
      4. 訓練套路
      5. 模型評估與預測
      6. 評估測試數據集
    4. 摘要
    5. 參考
  7. 6.自然語言處理的序列建模
    1. 回歸神經網絡簡介
      1. 實施Elman RNN
    2. 示例:使用字符RNN對姓氏國籍進行分類
      1. 姓氏數據集
      2. 矢量化數據結構
      3. SurnameClassifier模型
      4. 培訓例程和結果
    3. 摘要
  8. 7.自然語言處理的中間序列建模
    1. 香草RNN(或Elman RNN)的問題
    2. 作為香草RNN挑戰(zhàn)的解決方案
    3. 示例:用于生成姓氏的字符RNN
      1. SurnamesDataset
      2. 矢量化數據結構
      3. 從ElmanRNN到GRU
      4. 模型1:無條件姓氏生成模型
      5. 模型2:條件姓氏生成模型
      6. 培訓常規(guī)和結果
    4. 訓練序列模型的技巧和竅門
    5. 參考
  9. 8.自然語言處理的高級序列建模
    1. 序列到序列模型,編碼器 - 解碼器模型和條件生成
    2. 從序列中捕獲更多:雙向遞歸模型
    3. 從序列中捕獲更多:注意力
      1. 深度神經網絡中的注意事項
    4. 評估序列生成模型
    5. 示例:神經機器翻譯
      1. 機器翻譯數據集
      2. NMT的矢量化管道
      3. NMT模型中的編碼和解碼
      4. 培訓常規(guī)和結果
    6. 摘要
    7. 參考
  10. 9.經典跌前,前沿和后續(xù)步驟
  11. 我們學到了什么棕兼?
  12. NLP中的永恒主題
    1. 對話和互動系統(tǒng)
    2. 演講
    3. 信息抽取與文本挖掘
    4. 文檔分析和檢索
  13. NLP的前沿
  14. 生產NLP系統(tǒng)的設計模式
  15. 哪里下一個?
  16. 參考
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末舒萎,一起剝皮案震驚了整個濱河市程储,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌臂寝,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件摊灭,死亡現(xiàn)場離奇詭異咆贬,居然都是意外死亡,警方通過查閱死者的電腦和手機帚呼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進店門掏缎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人煤杀,你說我怎么就攤上這事眷蜈。” “怎么了沈自?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵酌儒,是天一觀的道長。 經常有香客問我枯途,道長忌怎,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任酪夷,我火速辦了婚禮榴啸,結果婚禮上,老公的妹妹穿的比我還像新娘晚岭。我一直安慰自己鸥印,他們只是感情好,可當我...
    茶點故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布坦报。 她就那樣靜靜地躺著库说,像睡著了一般。 火紅的嫁衣襯著肌膚如雪燎竖。 梳的紋絲不亂的頭發(fā)上璃弄,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天,我揣著相機與錄音构回,去河邊找鬼夏块。 笑死疏咐,一個胖子當著我的面吹牛,可吹牛的內容都是我干的脐供。 我是一名探鬼主播浑塞,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼政己!你這毒婦竟也來了酌壕?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤歇由,失蹤者是張志新(化名)和其女友劉穎卵牍,沒想到半個月后,有當地人在樹林里發(fā)現(xiàn)了一具尸體沦泌,經...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡糊昙,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了谢谦。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片释牺。...
    茶點故事閱讀 40,424評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖回挽,靈堂內的尸體忽然破棺而出没咙,到底是詐尸還是另有隱情,我是刑警寧澤千劈,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布祭刚,位于F島的核電站,受9級特大地震影響队塘,放射性物質發(fā)生泄漏袁梗。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一憔古、第九天 我趴在偏房一處隱蔽的房頂上張望遮怜。 院中可真熱鬧,春花似錦鸿市、人聲如沸锯梁。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽陌凳。三九已至,卻和暖如春内舟,著一層夾襖步出監(jiān)牢的瞬間合敦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工验游, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留充岛,地道東北人保檐。 一個月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像崔梗,于是被迫代替她去往敵國和親夜只。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,435評論 2 359

推薦閱讀更多精彩內容