申明:此文章內(nèi)容來自于 Doctor AndrewNG的視頻,經(jīng)過編輯而成
定義
監(jiān)督學習中的每一個樣本已經(jīng)被清楚地告知了什么是所謂的正確答案。在非監(jiān)督學中,我們的現(xiàn)有數(shù)據(jù)中并沒有正確答案,我們有的只是特征塞俱,因而非監(jiān)督學習要解決問題是發(fā)現(xiàn)這些數(shù)據(jù)是否可以分為不同的組。
直白一點授舟,在無監(jiān)督學習中 我們只有一個數(shù)據(jù)集 沒人告訴我們該怎么做 我們也不知道 每個數(shù)據(jù)點究竟是什么意思 相反 它只告訴我們 現(xiàn)在有一個數(shù)據(jù)集 你能在其中找到某種結(jié)構(gòu)嗎塞弊? 我不知道這個數(shù)據(jù)是什么東東 我不知道里面都有些什么類型 叫什么名字 我甚至不知道都有哪些類型 但是 請問你可以自動的找到這些數(shù)據(jù)中的類型嗎? 然后自動的 按得到的類型把這些個體分類對于給定的數(shù)據(jù)集 無監(jiān)督學習算法可能判定該數(shù)據(jù)集包含兩個不同的聚類,如下圖:
例子:雞尾酒會問題
一個宴會有一屋子的人 大家都坐在一起 而且在同時說話 有許多聲音混雜在一起 因為每個人都是在同一時間說話的 在這種情況下你很難聽清楚你面前的人說的話强窖。命題是凸椿,如果使用一些麥克風錄下房間中的聲音,如何利用非監(jiān)督學習算法來識別房間中某一個人所說的話。為簡化問題翅溺,假設(shè)兩個人在講話脑漫,準備好了兩個麥克風。因為這兩個麥克風距離這兩個人的距離是不同的咙崎,每個麥克風都記錄下了來自兩個人的聲音的不同組合利用兩個麥克風錄音优幸,如下圖。也許Speaker#1的聲音 在第一個麥克風里的聲音會響一點 也許Speaker#2的聲音 在第二個麥克風里會比較響一些 因為2個麥克風 的位置相對于 2個說話者的位置是不同的 但每個麥克風都會錄到 來自兩個說話者的重疊部分的聲音褪猛。
所以 你可以看到 像這樣的無監(jiān)督學習算法 也許你想問 要實現(xiàn)這樣的算法 很復雜吧网杆? 看起來 為了 構(gòu)建這個應(yīng)用程序 做這個音頻處理 似乎需要寫好多代碼啊 或者需要鏈接到 一堆處理音頻的Java庫 貌似需要一個 非常復雜的程序 分離出音頻等。實際上使用Octave只需要一行代碼就可以了伊滋,如下: [W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');