論文信息
- WWW 2008
- Yahoo! Research
- tagging(給item推薦tag)問(wèn)題
標(biāo)簽應(yīng)用:
- 在一個(gè)應(yīng)用程序中尼啡,推薦的標(biāo)簽被呈現(xiàn)給用戶,用戶可以選擇相關(guān)標(biāo)簽并將它們添加到照片中蹦魔。
- 推薦標(biāo)簽直接用于豐富檢索系統(tǒng)的索引啄栓。
主要工作
- 分析用戶如何標(biāo)記照片和他們提供的標(biāo)簽類型
- 提出了四種不同的標(biāo)簽推薦策略。
基于此分析姻成,我們通過(guò)推薦可添加到照片的一組標(biāo)簽來(lái)呈現(xiàn)和評(píng)估標(biāo)簽推薦策略以支持照片注釋任務(wù)中的用戶插龄。 實(shí)證評(píng)估的結(jié)果表明,我們可以有效地為各種照片推薦相關(guān)標(biāo)簽科展。
數(shù)據(jù)集 Flickr Photo
52 million photos
188 million tags(3.7 million unique tags.)
TAG BEHAVIOUR IN FLICKR
How do users tag
The x-axis represents the 3.7 million unique tags, ordered by descending tag frequency.
The y-axis refers to the tag frequency.
冪律的中間部分包含最有趣的標(biāo)簽推薦候選者均牢,因?yàn)椋?/p>
- 尾部的標(biāo)簽被判斷為不穩(wěn)定的描述符;
- 頭部包含的標(biāo)簽過(guò)于通用而無(wú)用
The x-axis represents the 52 million photos, ordered by the number of tags per photo (descending).
The y-axis refers to the number of tags assigned to the corresponding photo.
What are users tagging
用戶不僅標(biāo)記照片的視覺(jué)內(nèi)容才睹,而且在很大程度上提供拍攝照片的更廣泛的上下文徘跪,例如位置,時(shí)間和動(dòng)作琅攘。
TAG RECOMMENDATION STRATEGIES
Given a photo with user-defined tags, an ordered list of m candidate tags is derived for each of the user-defined tags, based on tag co-occurrence. The lists of candidate tags are then used as input for tag aggregation and ranking, which ultimately produces the ranked list of n recommended tags.
使用 co-occurrence 來(lái)推導(dǎo)標(biāo)簽之間的關(guān)系垮庐。 給定用戶定義的標(biāo)簽和照片,與用戶定義的標(biāo)簽共存的標(biāo)簽通常是推薦的良好候選者坞琴。
Tag Co-occurrence
我們將兩個(gè)標(biāo)簽之間的 Co-occurrence 定義為其中兩個(gè)標(biāo)簽用于相同的注釋的次數(shù)哨查。通常將共現(xiàn)計(jì)數(shù)與標(biāo)簽的總頻率標(biāo)準(zhǔn)化。 基本上有兩種不同的歸一化方法:對(duì)稱和非對(duì)稱剧辐。
-
對(duì)稱系數(shù)擅長(zhǎng)識(shí)別等同的標(biāo)簽
Symmetric measures -
不對(duì)稱標(biāo)簽共現(xiàn)更可能提供比其對(duì)稱對(duì)手更合適的候選標(biāo)簽多樣性
可以將此解釋為照片用標(biāo)簽tj注釋的概率寒亥,因?yàn)樗怯脴?biāo)簽ti注釋的。
Asymmetric measures
Tag Aggregation and Promotion
當(dāng)已知每個(gè)用戶定義標(biāo)簽的候選標(biāo)簽列表時(shí)荧关,需要標(biāo)簽聚合步驟以將列表合并為單個(gè)排名溉奕。
aggregation methods:
- Vote
does not take the co-occurrence values of the candidate tags into account. - Sum
uses the co-occurrence values to produce the final ranking.
實(shí)驗(yàn)
給定Flickr照片和一組用戶定義的標(biāo)簽,系統(tǒng)必須推薦標(biāo)簽羞酗,這些標(biāo)簽是照片的良好描述符腐宋。 系統(tǒng)提供標(biāo)簽列表(按照作為照片的良好描述符的可能性的降序排序)。 期望這樣的系統(tǒng)向用戶呈現(xiàn)推薦標(biāo)簽,使得用戶可以通過(guò)從列表中選擇相關(guān)標(biāo)簽來(lái)擴(kuò)展注釋胸竞。