深度學習 - 文集

深度學習

10篇文章 · 6800字 · 3人關(guān)注

從圖片相似度學習圖片的表示
很多時候帶分類標注的圖片樣本是很難獲得的，但是圖片之間的相似度卻不難獲得。最簡單的方式有幾個：視頻里相鄰的幀是相似的。見論文Unsupervi...

0.1 8753 9 30 2
Tensorflow 的NCE-Loss的實現(xiàn)和word2vec
這兩天因為實現(xiàn)mxnet的nce-loss翰萨，因此研究了一下tensorflow的nce-loss的實現(xiàn)。所以總結(jié)一下糕殉。先看看tensorflo...

0.6 39203 9 18 1

word2vec/lstm on mxnet with NCE loss
Softmax是用來實現(xiàn)多類分類問題常見的損失函數(shù)亩鬼。但如果類別特別多殖告，softmax的效率就是個問題了。比如在word2vec里雳锋，每個詞都是一個...

5887 2 7 2
基于DC/OS建立分布式機器學習系統(tǒng)
之前基于ps-lite實現(xiàn)了word2vec黄绩。下一步就是讓這個算法能夠分布式的跑起來。最簡單的分布式方案大概是如下幾步：把二進制文件copy到你...

1307 1 7
基于ps-lite實現(xiàn)分布式的word2vec
ps-lite是一個參數(shù)服務(wù)器(ps)的實現(xiàn)玷过。在有參數(shù)服務(wù)器之前爽丹，其實也就5年前，大部分分布式機器學習算法都是靠定期同步來實現(xiàn)的辛蚊，比如MPI的a...

3400 1 3
用Mxnet實現(xiàn)矩陣分解
在《關(guān)于LDA, pLSA, SVD, Word2Vec的一些看法》一文中我們提到了SVD的算法粤蝎。之前TensorFlow剛出來時，就聽說可以很...

4672 1 5
端到端的OCR：LSTM＋CTC的實現(xiàn)
前面提到了用CNN來做OCR袋马。這篇文章介紹另一種做OCR的方法初澎，就是通過LSTM＋CTC。這種方法的好處是他可以事先不用知道一共有幾個字符需要識...

0.2 41727 50 23

端到端的OCR：基于CNN的實現(xiàn)
OCR是一個古老的問題虑凛。這里我們考慮一類特殊的OCR問題碑宴，就是驗證碼的識別。傳統(tǒng)做驗證碼的識別桑谍，需要經(jīng)過如下步驟：這里最難的就是分割延柠。如果字符...

10346 5 13
離散特征和連續(xù)特征同時存在，同時解決回歸和分類的問題
有些同學對于mxnet的自定義Iter不是很熟悉锣披，對多輸出也不熟悉贞间，因此我用一個比較復(fù)雜的例子來說明這個問題：本著End-to-End的精神，...

8131 0 4