數(shù)學基礎 MCMC 采樣 MCMC 采樣 一陨囊、機器學習 1、無監(jiān)督學習 聚類 Kmeans 聚類 降維 PCA 理論 PCA壹瘟、LDA 算法 二其障、...
最近工作中需要解析圖片中的文本信息银室,進行文本數(shù)據(jù)分析,首先需要提取圖片中的文字,解決方案如下: 1蜈敢、需要安裝包 2辜荠、提取示例 3、可能遇到問題 ...
問題分析 有一篇很長的文章抓狭,用計算機提取它的關鍵詞(Automatic Keyphrase extraction)伯病,完全不加以人工干預,請問怎樣...
在上一篇文章我們學習了基本的數(shù)據(jù)增強的 N 種方法否过,今天我們針對“序列標注”任務具體聊一聊如何數(shù)據(jù)增強午笛?“序列標注”是一個 token-leve...
機器學習領域有個很重要的假設:IID獨立同分布假設,就是假設訓練數(shù)據(jù)和測試數(shù)據(jù)是滿足相同分布的苗桂,這是通過訓練數(shù)據(jù)獲得的模型能夠在測試集獲得好的效...
什么是數(shù)據(jù)增強 數(shù)據(jù)增強可以簡單理解為由少量數(shù)據(jù)生成大量數(shù)據(jù)的過程药磺。一般比較成功的神經(jīng)網(wǎng)絡擁有大量參數(shù),使這些參數(shù)正確工作需要用大量的數(shù)據(jù)進行訓...
在處理 NLP 相關任務的時候(文本分類煤伟、聚類癌佩,智能客服等),首要任務是對文本數(shù)據(jù)進行預處理便锨。結合自己的實踐經(jīng)驗围辙,總結了 N 條預處理的方法。 ...
RNN RNN 是一種利用神經(jīng)網(wǎng)絡對序列模型的通用模型 利用歷史信息結合當前輸入進行預測 適合解決時間序列輸入輸出問題放案,對于 NLP 來說就是序...
CNN Basic Model 卷積層 由不同窗口大小的 Filter 構成 Filter 個數(shù)由自己決定姚建,超參數(shù)。 同一個 Filter 參數(shù)...