標(biāo)量力九、向量和空間
單個(gè)數(shù)字特征也稱為標(biāo)量。標(biāo)量的有序列表成為向量邑闺。向量位于向量空間中跌前。在絕大多數(shù)機(jī)器學(xué)習(xí)應(yīng)用中,對(duì)模型的輸入通常表示為數(shù)字向量陡舅。
向量可以被可視化為空間中的一個(gè)點(diǎn)抵乓。(有時(shí)人們從原點(diǎn)到那一點(diǎn)畫一條線和一個(gè)箭頭。在這本書中靶衍,我們將主要使用這一點(diǎn))灾炭。例如,假設(shè)我們有一個(gè)二維向量 ??=[1颅眶,?1] 蜈出。也就是說,向量包含兩個(gè)數(shù)涛酗,在第一方向 ??1 中铡原,向量具有1的值,并且在第二方向 ??2 中商叹,它具有 ?1 的值燕刻。我們可以在二維圖中繪制 ?? 。
在數(shù)據(jù)世界中剖笙,抽象向量及其特征維度具有實(shí)際意義卵洗。
例如,它可以代表一個(gè)人對(duì)歌曲的偏愛弥咪。每首歌都是一個(gè)特征过蹂,其中1的值相當(dāng)于大拇指向上,-1的值相當(dāng)于大拇指向下酪夷。假設(shè)向量 ?? 表示一個(gè)聽眾 Bob 的喜好榴啸。Bob喜歡 Bob Dylan 的 “Blowin’ in the Wind” 和 Lady Gaga 的 "Poker Face"。其他人可能有不同的喜好晚岭∨赣。總的來說, 數(shù)據(jù)集合可以在特征空間中可視化為點(diǎn)云.
相反,一首歌可以由一組人的個(gè)人喜好來表示坦报。假設(shè)只有兩個(gè)聽眾库说,Alice 和 Bob。Alice 喜歡 Leonard Cohen 的 “Poker Face”, “Blowin’ in the Wind” 和 “Hallelujah”片择,但討厭 Katy Perry 的 “Roar” 和 Radiohead 的 “Creep”潜的。Bob 喜歡 “Roar", “Hallelujah”和“Blowin’ in the Wind”,但討厭 “Poker Face” 和 “Creep” 字管。在聽眾的空間里啰挪,每一首歌都是一個(gè)點(diǎn)信不。就像我們可以在特征空間中可視化數(shù)據(jù)一樣,我們可以在數(shù)據(jù)空間中可視化特征亡呵。圖2-2顯示了這個(gè)例子抽活。