【Tag Recommendation】Flickr Tag Recommendation based on Collective Knowledge

論文信息

  • WWW 2008
  • Yahoo! Research
  • tagging(給item推薦tag)問(wèn)題

標(biāo)簽應(yīng)用:

  1. 在一個(gè)應(yīng)用程序中尼啡,推薦的標(biāo)簽被呈現(xiàn)給用戶,用戶可以選擇相關(guān)標(biāo)簽并將它們添加到照片中蹦魔。
  2. 推薦標(biāo)簽直接用于豐富檢索系統(tǒng)的索引啄栓。

主要工作

  • 分析用戶如何標(biāo)記照片和他們提供的標(biāo)簽類型
  • 提出了四種不同的標(biāo)簽推薦策略。
    基于此分析姻成,我們通過(guò)推薦可添加到照片的一組標(biāo)簽來(lái)呈現(xiàn)和評(píng)估標(biāo)簽推薦策略以支持照片注釋任務(wù)中的用戶插龄。 實(shí)證評(píng)估的結(jié)果表明,我們可以有效地為各種照片推薦相關(guān)標(biāo)簽科展。

數(shù)據(jù)集 Flickr Photo

52 million photos
188 million tags(3.7 million unique tags.)

TAG BEHAVIOUR IN FLICKR

How do users tag
Distribution of the Tag Frequency in Flickr

The x-axis represents the 3.7 million unique tags, ordered by descending tag frequency.
The y-axis refers to the tag frequency.

冪律的中間部分包含最有趣的標(biāo)簽推薦候選者均牢,因?yàn)椋?/p>

  • 尾部的標(biāo)簽被判斷為不穩(wěn)定的描述符;
  • 頭部包含的標(biāo)簽過(guò)于通用而無(wú)用
Distribution of the number of tags per photo in Flickr

The x-axis represents the 52 million photos, ordered by the number of tags per photo (descending).
The y-axis refers to the number of tags assigned to the corresponding photo.

The definition of photo-tag classes and the number of photos in each class
What are users tagging
Most frequent WordNet categories for Flickr tags

用戶不僅標(biāo)記照片的視覺(jué)內(nèi)容才睹,而且在很大程度上提供拍攝照片的更廣泛的上下文徘跪,例如位置,時(shí)間和動(dòng)作琅攘。

TAG RECOMMENDATION STRATEGIES

Given a photo with user-defined tags, an ordered list of m candidate tags is derived for each of the user-defined tags, based on tag co-occurrence. The lists of candidate tags are then used as input for tag aggregation and ranking, which ultimately produces the ranked list of n recommended tags.

使用 co-occurrence 來(lái)推導(dǎo)標(biāo)簽之間的關(guān)系垮庐。 給定用戶定義的標(biāo)簽和照片,與用戶定義的標(biāo)簽共存的標(biāo)簽通常是推薦的良好候選者坞琴。


Tag Co-occurrence

我們將兩個(gè)標(biāo)簽之間的 Co-occurrence 定義為其中兩個(gè)標(biāo)簽用于相同的注釋的次數(shù)哨查。通常將共現(xiàn)計(jì)數(shù)與標(biāo)簽的總頻率標(biāo)準(zhǔn)化。 基本上有兩種不同的歸一化方法:對(duì)稱和非對(duì)稱剧辐。

  • 對(duì)稱系數(shù)擅長(zhǎng)識(shí)別等同的標(biāo)簽


    Symmetric measures
  • 不對(duì)稱標(biāo)簽共現(xiàn)更可能提供比其對(duì)稱對(duì)手更合適的候選標(biāo)簽多樣性
    可以將此解釋為照片用標(biāo)簽tj注釋的概率寒亥,因?yàn)樗怯脴?biāo)簽ti注釋的。


    Asymmetric measures
Tag Aggregation and Promotion

當(dāng)已知每個(gè)用戶定義標(biāo)簽的候選標(biāo)簽列表時(shí)荧关,需要標(biāo)簽聚合步驟以將列表合并為單個(gè)排名溉奕。



aggregation methods:

  • Vote
    does not take the co-occurrence values of the candidate tags into account.
  • Sum
    uses the co-occurrence values to produce the final ranking.

實(shí)驗(yàn)

給定Flickr照片和一組用戶定義的標(biāo)簽,系統(tǒng)必須推薦標(biāo)簽羞酗,這些標(biāo)簽是照片的良好描述符腐宋。 系統(tǒng)提供標(biāo)簽列表(按照作為照片的良好描述符的可能性的降序排序)。 期望這樣的系統(tǒng)向用戶呈現(xiàn)推薦標(biāo)簽,使得用戶可以通過(guò)從列表中選擇相關(guān)標(biāo)簽來(lái)擴(kuò)展注釋胸竞。

Evaluation Metric

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末欺嗤,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子卫枝,更是在濱河造成了極大的恐慌煎饼,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件校赤,死亡現(xiàn)場(chǎng)離奇詭異吆玖,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)马篮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門沾乘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人浑测,你說(shuō)我怎么就攤上這事翅阵。” “怎么了迁央?”我有些...
    開(kāi)封第一講書人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵掷匠,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我岖圈,道長(zhǎng)讹语,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任蜂科,我火速辦了婚禮顽决,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘崇摄。我一直安慰自己擎值,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布逐抑。 她就那樣靜靜地躺著鸠儿,像睡著了一般。 火紅的嫁衣襯著肌膚如雪厕氨。 梳的紋絲不亂的頭發(fā)上进每,一...
    開(kāi)封第一講書人閱讀 51,708評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音命斧,去河邊找鬼田晚。 笑死,一個(gè)胖子當(dāng)著我的面吹牛国葬,可吹牛的內(nèi)容都是我干的贤徒。 我是一名探鬼主播芹壕,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼接奈!你這毒婦竟也來(lái)了踢涌?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤序宦,失蹤者是張志新(化名)和其女友劉穎睁壁,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體互捌,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡潘明,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了秕噪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片钳降。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖巢价,靈堂內(nèi)的尸體忽然破棺而出牲阁,到底是詐尸還是另有隱情,我是刑警寧澤壤躲,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站备燃,受9級(jí)特大地震影響碉克,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜并齐,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一漏麦、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧况褪,春花似錦撕贞、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至食侮,卻和暖如春号涯,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背锯七。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工链快, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人眉尸。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓域蜗,卻偏偏與公主長(zhǎng)得像巨双,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子霉祸,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi閱讀 7,334評(píng)論 0 10
  • 晚上十點(diǎn)炉峰,女兒才睡下,微信提示聲響起脉执。 女孩輕輕地一聲問(wèn)候:姐疼阔,你睡了么? 我回:還沒(méi)半夷。 收到的是她一串開(kāi)心的笑臉...
    完美未滿閱讀 837評(píng)論 0 0
  • 感賞兒子昨天晚上做作業(yè)狀態(tài)不錯(cuò)婆廊,口算又快又準(zhǔn)。 感賞兒子昨晚做完作業(yè)開(kāi)心地開(kāi)電視巫橄。 感賞兒子昨晚按時(shí)睡覺(jué)淘邻。 感賞兒...
    輝_0495閱讀 173評(píng)論 0 0
  • 凌晨?jī)牲c(diǎn)多的時(shí)候宾舅,被鍥而不舍的電話鈴聲吵醒。正當(dāng)我內(nèi)心極度不滿準(zhǔn)備狠狠懟那個(gè)擾我清夢(mèng)的人一頓的時(shí)候彩倚,那人說(shuō)的話讓我...
    L君_君無(wú)閱讀 398評(píng)論 0 1
  • 1筹我、動(dòng)畫:0a unit 9 2、音頻:0a1–12 滾動(dòng)播放帆离。 游戲: M:Hello,badly.l a...
    xiaohao226234閱讀 232評(píng)論 0 0