![Avatar notebook default](https://cdn2.jianshu.io/assets/default_avatar/avatar-notebook-default-640f7dde88592bdf6417d8ce1902636e.png)
很多時候帶分類標注的圖片樣本是很難獲得的,但是圖片之間的相似度卻不難獲得。最簡單的方式有幾個: 視頻里相鄰的幀是相似的。見論文Unsupervi...
這兩天因為實現(xiàn)mxnet的nce-loss翰萨,因此研究了一下tensorflow的nce-loss的實現(xiàn)。所以總結(jié)一下糕殉。 先看看tensorflo...
Softmax是用來實現(xiàn)多類分類問題常見的損失函數(shù)亩鬼。但如果類別特別多殖告,softmax的效率就是個問題了。比如在word2vec里雳锋,每個詞都是一個...
之前基于ps-lite實現(xiàn)了word2vec黄绩。下一步就是讓這個算法能夠分布式的跑起來。最簡單的分布式方案大概是如下幾步:把二進制文件copy到你...
ps-lite是一個參數(shù)服務(wù)器(ps)的實現(xiàn)玷过。在有參數(shù)服務(wù)器之前爽丹,其實也就5年前,大部分分布式機器學習算法都是靠定期同步來實現(xiàn)的辛蚊,比如MPI的a...
在《關(guān)于LDA, pLSA, SVD, Word2Vec的一些看法》一文中我們提到了SVD的算法粤蝎。之前TensorFlow剛出來時,就聽說可以很...
前面提到了用CNN來做OCR袋马。這篇文章介紹另一種做OCR的方法初澎,就是通過LSTM+CTC。這種方法的好處是他可以事先不用知道一共有幾個字符需要識...
OCR是一個古老的問題虑凛。這里我們考慮一類特殊的OCR問題碑宴,就是驗證碼的識別。傳統(tǒng)做驗證碼的識別桑谍,需要經(jīng)過如下步驟: 這里最難的就是分割延柠。如果字符...
有些同學對于mxnet的自定義Iter不是很熟悉锣披,對多輸出也不熟悉贞间,因此我用一個比較復(fù)雜的例子來說明這個問題: 本著End-to-End的精神,...