[第003號(hào)]
摘要
分類問題是機(jī)器學(xué)習(xí)脐嫂、信息檢索、計(jì)算機(jī)視覺故源、多媒體等多個(gè)學(xué)科的最重要的基礎(chǔ)問題之一污抬。隨著數(shù)據(jù)的急劇增加,現(xiàn)實(shí)應(yīng)用中的很多分類問題在計(jì)算效率、存儲(chǔ)需求等方面產(chǎn)生了巨大挑戰(zhàn)印机。該論文針對(duì)這一問題提出了基于哈希編碼的解決方案矢腻。與以往的哈希研究不同的是,該工作中提出的算法不僅對(duì)數(shù)據(jù)進(jìn)行二值哈希編碼射赛,還首創(chuàng)對(duì)分類器也同時(shí)進(jìn)行二值化學(xué)習(xí)多柑。通過這一創(chuàng)新,該算法將分類問題轉(zhuǎn)化為了一個(gè)高效的哈希碼搜索問題楣责,極大地提高了分類算法的效率竣灌。該算法的有效性在多個(gè)真實(shí)的數(shù)據(jù)上得到了驗(yàn)證。
研究過程
1. 介紹
本文主要貢獻(xiàn):
(1)We difine a novel problem by binarizing both classifiers and image features and simulataneously learing them in a unfied formulation.
(2)An efficient solver is proposed for the binary optimization problem.
(3)Our formulation supports a large family of empirical loss functions and is here instantiated by exponential/linear losses.
2. 相關(guān)工作
2.1 Hashing for fast image search and beyond
2.2 Hashing for large-scale optimization
3. 模型
3.1 指數(shù)損失函數(shù)的學(xué)習(xí)
3.2 線性損失函數(shù)的學(xué)習(xí)
3.3 二值編碼預(yù)測(cè)
3.4 討論
4. 實(shí)驗(yàn)
4.1 數(shù)據(jù)集
SUN397
ImageNet
Caltech-256
4.2 被比較的方法和評(píng)估指標(biāo)
4.3 準(zhǔn)確率和計(jì)算效率
4.4 內(nèi)存消耗
reduce the storage cost by converting high-dimensional real-valued features and classfication models to compact binary codes.
4.5 評(píng)估解析模型
5. 結(jié)論
心得體會(huì)
我的體會(huì)