Day 4 一部雅虎的輿情挖掘與情感分析專著[2]

與什么相關郑叠？一個輿論/觀點搜索引擎的結構分析

挑戰(zhàn)非常巨大，所以我們舉個例子來分析一下明棍。
主要有以下挑戰(zhàn)：

1.如果應用要集成到廣泛應用的搜索引擎中乡革，我們首先要知道用戶是不是要找主觀評價材料。我們可以通過用戶使用的搜索關鍵詞摊腋，如“評論”沸版、“觀點”，或者選中框來簡化這個問題兴蒸。但請求分類本身是個很大的挑戰(zhàn)视粮，這個問題還是2005 KDD Cup challenge的主題【不知道是什么鬼】。

2.除了確定請求是不是與評論相關橙凳，另外還有新的挑戰(zhàn)就是確定文字中的哪些部分是包含評論信息的蕾殴。如果是在典型的評論性來源中，這個工作自然很簡單岛啸，比如像亞馬遜或者大眾點評網(wǎng)上的評論钓觉。但另一方面，博客中也含有大量的主觀內容值戳，因此也是一個重要的信息來源（并且更多的是像政治议谷、人物，等等與產品無關的評論）堕虹，但博客在內容卧晓、風格、呈現(xiàn)方式和語法水平上參差不齊（因此是個亟待解決的問題）赴捞”岂桑【不過個人覺得這個方面更大的問題是如何確定哪些是有觀點的內容……】

3.檢索到目標文字之后，我們還要面臨的問題就是怎么檢測這段文字表述的整體情感赦政，和/或它對某個事物或話題在特定方面提出的詳細觀點胜宇。像豆瓣這樣的網(wǎng)站自然有評分系統(tǒng)和標簽來確定，但另一方面恢着，還有大量的自由文字桐愉，這提出了新的挑戰(zhàn)：比如，如果新聞中引用了一句話掰派，我們必須正確指明這些引用的話中的觀點是針對哪個實體从诲。

4.最后，系統(tǒng)要將搜集到的信息用一種合理的總結方式呈現(xiàn)出來靡羡。這個過程可能包含以下行為：
a.不同評價方式的“投票”需統(tǒng)一起來（如有的是打分系洛，有的是語言評價）
b.選擇性強調某些觀點
c.呈現(xiàn)意見分歧點與統(tǒng)一點
d.對意見者進行歸類
e.計算不同人群和意見者的權威性和可信度

應當指出的是俊性，最后的總結最好是可視化的。

我們的研究目標與方法

上述3,4,5的內容是非趁璩叮活躍的研究領域定页，但是由于篇幅限制我們不可能事無巨細覆蓋所有內容。
我們主要研究信息獲取應用绽诚，而不是純語言性質的研究典徊。
由于我們的研究目標，本文中主要關于情感分析應用的方法與觀點分類問題技術憔购。最后我們還走到技術問題之外宫峦，討論隱私什么什么的經(jīng)濟影響……

總之我前兩天看到的分詞等等相關技術和這個應用文獻沒什么關系……胰锌，那個是基礎技術算法褥伴，這個是應用分析……

That's all for today. See you tomorrow.
Kevin Ham@Wuhu
Department of Internet Engineering, Anhui Normal University, Wuhu, China
3.4.2015

最后編輯于：2017.11.27 00:47:35

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末女坑，一起剝皮案震驚了整個濱河市敢伸，隨后出現(xiàn)的幾起案子卡者，更是在濱河造成了極大的恐慌导帝，老刑警劉巖垦写，帶你破解...
沈念sama閱讀 206,126評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件古毛，死亡現(xiàn)場離奇詭異钦购，居然都是意外死亡檐盟，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門押桃，熙熙樓的掌柜王于貴愁眉苦臉地迎上來葵萎，“玉大人，你說我怎么就攤上這事唱凯∠弁” “怎么了？”我有些...
開封第一講書人閱讀 152,445評論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵磕昼，是天一觀的道長卷雕。經(jīng)常有香客問我，道長票从，這世上最難降的妖魔是什么漫雕？我笑而不...
開封第一講書人閱讀 55,185評論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮峰鄙，結果婚禮上浸间，老公的妹妹穿的比我還像新娘。我一直安慰自己吟榴，他們只是感情好发框，可當我...
茶點故事閱讀 64,178評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般梅惯。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上仿野，一...
開封第一講書人閱讀 48,970評論 1贊 284
城市分裂傳說
那天铣减，我揣著相機與錄音，去河邊找鬼脚作。笑死葫哗，一個胖子當著我的面吹牛，可吹牛的內容都是我干的球涛。我是一名探鬼主播劣针，決...
沈念sama閱讀 38,276評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼亿扁！你這毒婦竟也來了捺典？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 36,927評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤从祝，失蹤者是張志新（化名）和其女友劉穎襟己，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體牍陌，經(jīng)...
沈念sama閱讀 43,400評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡擎浴，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 35,883評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了毒涧。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片贮预。...
茶點故事閱讀 37,997評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖契讲，靈堂內的尸體忽然破棺而出仿吞，到底是詐尸還是另有隱情，我是刑警寧澤怀泊，帶...
沈念sama閱讀 33,646評論 4贊 322
?日本核電站爆炸內幕
正文年R本政府宣布茫藏，位于F島的核電站，受9級特大地震影響霹琼，放射性物質發(fā)生泄漏务傲。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 39,213評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一枣申、第九天我趴在偏房一處隱蔽的房頂上張望售葡。院中可真熱鬧，春花似錦忠藤、人聲如沸挟伙。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,204評論 0贊 19
一樁弒父案模孩，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽尖阔。三九已至贮缅，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間介却，已是汗流浹背谴供。一陣腳步聲響...
開封第一講書人閱讀 31,423評論 1贊 260
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留齿坷，地道東北人桂肌。一個月前我還...
沈念sama閱讀 45,423評論 2贊 352
代替公主和親
正文我出身青樓，卻偏偏與公主長得像永淌，于是被迫代替她去往敵國和親崎场。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 42,722評論 2贊 345

Day 4 一部雅虎的輿情挖掘與情感分析專著[2]

與什么相關郑叠？一個輿論/觀點搜索引擎的結構分析

我們的研究目標與方法

推薦閱讀更多精彩內容