xlvector - 簡書

IP屬地：內(nèi)蒙古

從圖片相似度學(xué)習(xí)圖片的表示
很多時候帶分類標(biāo)注的圖片樣本是很難獲得的，但是圖片之間的相似度卻不難獲得。最簡單的方式有幾個：視頻里相鄰的幀是相似的。見論文Unsupervi...

0.1 8730 9 30 2
Tensorflow 的NCE-Loss的實(shí)現(xiàn)和word2vec
這兩天因?yàn)閷?shí)現(xiàn)mxnet的nce-loss，因此研究了一下tensorflow的nce-loss的實(shí)現(xiàn)劫灶。所以總結(jié)一下。先看看tensorflo...

0.6 39176 9 18 1

word2vec/lstm on mxnet with NCE loss
Softmax是用來實(shí)現(xiàn)多類分類問題常見的損失函數(shù)。但如果類別特別多和泌，softmax的效率就是個問題了。比如在word2vec里祠肥，每個詞都是一個...

5879 2 7 2
基于DC/OS建立分布式機(jī)器學(xué)習(xí)系統(tǒng)
之前基于ps-lite實(shí)現(xiàn)了word2vec武氓。下一步就是讓這個算法能夠分布式的跑起來。最簡單的分布式方案大概是如下幾步：把二進(jìn)制文件copy到你...

1298 1 7
基于ps-lite實(shí)現(xiàn)分布式的word2vec
ps-lite是一個參數(shù)服務(wù)器(ps)的實(shí)現(xiàn)仇箱。在有參數(shù)服務(wù)器之前县恕，其實(shí)也就5年前，大部分分布式機(jī)器學(xué)習(xí)算法都是靠定期同步來實(shí)現(xiàn)的剂桥，比如MPI的a...

3391 1 3
用Mxnet實(shí)現(xiàn)矩陣分解
在《關(guān)于LDA, pLSA, SVD, Word2Vec的一些看法》一文中我們提到了SVD的算法忠烛。之前TensorFlow剛出來時，就聽說可以很...

4666 1 5
端到端的OCR：LSTM＋CTC的實(shí)現(xiàn)
前面提到了用CNN來做OCR渊额。這篇文章介紹另一種做OCR的方法况木，就是通過LSTM＋CTC。這種方法的好處是他可以事先不用知道一共有幾個字符需要識...

0.2 41714 50 23

端到端的OCR：基于CNN的實(shí)現(xiàn)
OCR是一個古老的問題旬迹。這里我們考慮一類特殊的OCR問題火惊，就是驗(yàn)證碼的識別。傳統(tǒng)做驗(yàn)證碼的識別奔垦，需要經(jīng)過如下步驟：這里最難的就是分割屹耐。如果字符...

10333 5 13
離散特征和連續(xù)特征同時存在，同時解決回歸和分類的問題
有些同學(xué)對于mxnet的自定義Iter不是很熟悉，對多輸出也不熟悉惶岭，因此我用一個比較復(fù)雜的例子來說明這個問題：本著End-to-End的精神寿弱，...

8065 0 4