Day 8 來自谷歌策严,新聞與博客的大規(guī)模輿情分析

今天上午睡了一上午穗慕,下午和小伙伴們?nèi)ビ懻揗OOC學(xué)術(shù)社團(tuán)的事情了,剛洗完澡都快十一點(diǎn)了妻导,所以今天就只看看摘要和Intro吧逛绵。

Large-Scale Sentiment Analysis for News and Blogs

摘要

報(bào)紙、博客能夠反映新發(fā)生事件的觀點(diǎn)倔韭,因?yàn)樗麄儓?bào)道最近發(fā)生的事情术浪。我們的系統(tǒng)進(jìn)行正面負(fù)面分析。

簡介

有好新聞和壞新聞寿酌,但它們很少是中性的(和巴黎南大學(xué)那個(gè)觀點(diǎn)正好沖突嘛)胰苏。雖然完全理解文字語言的技術(shù)現(xiàn)在還無法用機(jī)器完成,統(tǒng)計(jì)上的簡單情感分析卻依舊很有意義醇疼。
本文以Lydia文字分析系統(tǒng)為基礎(chǔ)硕并。
(Lydia文字分析系統(tǒng)的論文http://link.springer.com/chapter/10.1007%2F11575832_18)

本文討論的側(cè)面如下:
輿情字典的算法結(jié)構(gòu):我們利用WordNet中的近反義詞來把我們的小列表擴(kuò)充。(WordNet是由Princeton 大學(xué)的心理學(xué)家秧荆,語言學(xué)家和計(jì)算機(jī)工程師聯(lián)合設(shè)計(jì)的一種基于認(rèn)知語言學(xué)的英語詞典倔毙。它不是光把單詞以字母順序排列,而且按照單詞的意義組成一個(gè)“單詞的網(wǎng)絡(luò)”乙濒。)
情感指數(shù)公式:主要利用情感詞匯疊加和世界情感等級插值技術(shù)陕赃。
重要性評價(jià):主要是用實(shí)際生活中的例子來驗(yàn)證。

研究背景

研究技術(shù)主要有兩方面,生成情感詞典凯正,以及整文分析。

情感指向

Hatzivassiloglou and McKeown的研究假設(shè)用and連接的形容詞為近義詞豌蟋、而but連接的為反義詞廊散。(中文里可以用“而且/并且”和“但是”之類的代替)這樣可以用一個(gè)很小的列表拓展出很大的詞庫。
Wiebe不僅研究詞語的極性梧疲,還研究了他們的等級(程度)允睹。主要用統(tǒng)計(jì)方法。
Kim and Hovy則使用了WordNet幌氮。他們假設(shè)同近義詞/反義詞都有一樣/相反的極性缭受,而一個(gè)詞語的近義詞的極性比率則表示了他們的極性程度,而在一定極性一下的詞語則為中性和不清楚该互。

情感分析系統(tǒng)

Pang, Lee and Vaithyanathan的電影情感分析系統(tǒng)的正確率大約83%米者。
Nasukawa and Yi的論文則更能識別local sentiment(區(qū)域性情感)。即分對象地分析情感宇智,如對一個(gè)照相機(jī)的評價(jià)可能是指向其電池蔓搞、鏡頭等部件。
我們的系統(tǒng)更快更好地完成了上述任務(wù)随橘。

That's all for today. See you tomorrow.
Kevin Ham@Wuhu
Department of Internet Engineering, Anhui Normal University, Wuhu, China
3.8.2015

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末喂分,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子机蔗,更是在濱河造成了極大的恐慌蒲祈,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件萝嘁,死亡現(xiàn)場離奇詭異梆掸,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)牙言,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進(jìn)店門沥潭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人嬉挡,你說我怎么就攤上這事钝鸽。” “怎么了庞钢?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵拔恰,是天一觀的道長。 經(jīng)常有香客問我基括,道長颜懊,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮河爹,結(jié)果婚禮上匠璧,老公的妹妹穿的比我還像新娘。我一直安慰自己咸这,他們只是感情好夷恍,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著媳维,像睡著了一般酿雪。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上侄刽,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天指黎,我揣著相機(jī)與錄音,去河邊找鬼州丹。 笑死醋安,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的墓毒。 我是一名探鬼主播茬故,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼蚁鳖!你這毒婦竟也來了磺芭?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤醉箕,失蹤者是張志新(化名)和其女友劉穎钾腺,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體讥裤,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡放棒,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了己英。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片间螟。...
    茶點(diǎn)故事閱讀 40,030評論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖损肛,靈堂內(nèi)的尸體忽然破棺而出厢破,到底是詐尸還是另有隱情,我是刑警寧澤治拿,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布摩泪,位于F島的核電站,受9級特大地震影響劫谅,放射性物質(zhì)發(fā)生泄漏见坑。R本人自食惡果不足惜嚷掠,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望荞驴。 院中可真熱鬧不皆,春花似錦、人聲如沸熊楼。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽孙蒙。三九已至项棠,卻和暖如春悲雳,著一層夾襖步出監(jiān)牢的瞬間挎峦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工合瓢, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留坦胶,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓晴楔,卻偏偏與公主長得像顿苇,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子税弃,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 一则果、自然語言處理概覽——什么是自然語言處理(NLP) 1)相關(guān)技術(shù)與應(yīng)用 自動問答(Question Answer...
    IceySu閱讀 1,667評論 0 1
  • 1)What is Sentiment Analysis?## 情感分析(Sentiment analysis)幔翰,...
    Shira0905閱讀 4,381評論 0 3
  • 語言與精神分析 四川大學(xué)哲學(xué)系 霍大同 第一講 1999年3月1日 這是一個(gè)比較困難的題目,我準(zhǔn)備講的課的題目是“...
    團(tuán)的花園閱讀 5,445評論 0 19
  • 轉(zhuǎn)載請聲明出處西壮。到這里才發(fā)現(xiàn)簡書不支持Mathjax遗增,真蛋疼,要看公式的話還是到我的博客上看款青,留言就在這里留吧做修,我...
    TonLP閱讀 2,709評論 0 6
  • 《人類簡史》是關(guān)于我們從哪里來,《未來簡史》是站在上千年的人類文明進(jìn)程之上抡草,對這個(gè)復(fù)雜的人類世界演化提出了“...
    金色麥子閱讀 441評論 0 0