[toc]
一这刷、簡介
著名的科學(xué)雜志《Nature》于1999年刊登了兩位科學(xué)家D.D.Lee和H.S.Seung對數(shù)學(xué)中非負(fù)矩陣研究的突出成果统翩。該文提出了一種新的矩陣分解思想――非負(fù)矩陣分解(Non-negative Matrix Factorization哨颂,NMF)算法删豺,即NMF是在矩陣中所有元素均為非負(fù)數(shù)約束條件之下的矩陣分解方法遭贸。該論文的發(fā)表迅速引起了各個領(lǐng)域中的科學(xué)研究人員的重視。
優(yōu)點:
1. 處理大規(guī)模數(shù)據(jù)更快更便捷耳高;
2. 簡便性、分解形式和分解結(jié)果上的可解釋性所踊,以及占用存儲空間少等諸多優(yōu)點泌枪。
比較:
利用矩陣分解來解決實際問題的分析方法很多,如PCA(主成分分析)秕岛、ICA(獨立成分分析)碌燕、SVD(奇異值分解)、VQ(矢量量化)等继薛。
這些方法的共同特點是修壕,元素可為正或負(fù),即使輸入的初始矩陣元素是全正的遏考,傳統(tǒng)的秩削減算法也不能保證原始數(shù)據(jù)的非負(fù)性慈鸠。
在數(shù)學(xué)上,從計算的觀點看灌具,分解結(jié)果中存在負(fù)值是正確的青团,但負(fù)值元素在實際問題中往往是沒有意義的。例如圖像數(shù)據(jù)中不可能有負(fù)值的像素點咖楣;在文檔統(tǒng)計中督笆,負(fù)值也是無法解釋的。
二诱贿、相關(guān)內(nèi)容
非負(fù)矩陣分解(Non-negative Matrix Factorization娃肿,NMF)算法。是在矩陣中所有元素均為非負(fù)數(shù)約束條件之下的矩陣分解方法瘪松。
即矩陣維為非負(fù)矩陣咸作,那么可以分解為2個非負(fù)矩陣維、維的乘積宵睦。(相關(guān)證明還未查閱记罚,以后補(bǔ)上。)
可以顯著小于和壳嚎,可以明顯降低矩陣的維度桐智。
三、相關(guān)算法
1烟馅、乘法更新法(Multiplicative weight update method)
Lee和Seung的乘法更新規(guī)則由于實現(xiàn)簡單而成為一種流行的方法说庭。該算法是:
初始化:和非負(fù)。
更新:由第n次更新第n+1次的郑趁、刊驴。
注意:更新是基于第(i,j)元素而不是矩陣乘法完成的。
More recently other algorithms have been developed. Some approaches are based on alternating non-negative least squares: in each step of such an algorithm, first H is fixed and W found by a non-negative least squares solver, then W is fixed and H is found analogously. The procedures used to solve for W and H may be the same or different, as some NMF variants regularize one of W and H. Specific approaches include the projected gradient descent methods, the active set method, the optimal gradient method, and the block principal pivoting method among several others.
四、參考
相關(guān)庫:
- http://nimfa.biolab.si/ - nimfa - A Python Library for Nonnegative Matrix
- http://www.csie.ntu.edu.tw/~cjlin/nmf/ Factorization Techniques
相關(guān)參考:
wiki:https://en.wikipedia.org/wiki/Non-negative_matrix_factorization
https://wenku.baidu.com/view/94c8af0bf78a6529647d5331.html
https://blog.csdn.net/zlp_zky/article/details/78391420