dreampai - 簡書

IP屬地：上海

技術積累
數(shù)學基礎 MCMC 采樣 MCMC 采樣一陨囊、機器學習 1、無監(jiān)督學習聚類 Kmeans 聚類降維 PCA 理論 PCA壹瘟、LDA 算法二其障、...

0.2 265 0 1
如何解析圖片文字進行文本分析
最近工作中需要解析圖片中的文本信息银室，進行文本數(shù)據(jù)分析，首先需要提取圖片中的文字，解決方案如下： 1蜈敢、需要安裝包 2辜荠、提取示例 3、可能遇到問題 ...

966 0 0

TF-IDF 算法
問題分析有一篇很長的文章抓狭，用計算機提取它的關鍵詞（Automatic Keyphrase extraction）伯病，完全不加以人工干預，請問怎樣...

1093 0 0
序列標注任務數(shù)據(jù)增強
在上一篇文章我們學習了基本的數(shù)據(jù)增強的 N 種方法否过，今天我們針對“序列標注”任務具體聊一聊如何數(shù)據(jù)增強午笛？“序列標注”是一個 token-leve...

906 0 0
Batch Normalization
機器學習領域有個很重要的假設：IID獨立同分布假設，就是假設訓練數(shù)據(jù)和測試數(shù)據(jù)是滿足相同分布的苗桂，這是通過訓練數(shù)據(jù)獲得的模型能夠在測試集獲得好的效...

205 0 0
自然語言處理之文本數(shù)據(jù)增強
什么是數(shù)據(jù)增強數(shù)據(jù)增強可以簡單理解為由少量數(shù)據(jù)生成大量數(shù)據(jù)的過程药磺。一般比較成功的神經(jīng)網(wǎng)絡擁有大量參數(shù)，使這些參數(shù)正確工作需要用大量的數(shù)據(jù)進行訓...

0.1 1163 0 1
NLP 預處理總結
在處理 NLP 相關任務的時候（文本分類煤伟、聚類癌佩，智能客服等），首要任務是對文本數(shù)據(jù)進行預處理便锨。結合自己的實踐經(jīng)驗围辙，總結了 N 條預處理的方法。 ...

0.1 499 0 1

RNN
RNN RNN 是一種利用神經(jīng)網(wǎng)絡對序列模型的通用模型利用歷史信息結合當前輸入進行預測適合解決時間序列輸入輸出問題放案，對于 NLP 來說就是序...

337 0 0
CNN
CNN Basic Model 卷積層由不同窗口大小的 Filter 構成 Filter 個數(shù)由自己決定姚建，超參數(shù)。同一個 Filter 參數(shù)...

0.1 567 0 1