論文閱讀—Beneath the Tip of the Iceberg: Current Challenges and New Directions in Sentiment Analysis ...

? 引用:Poria S, Hazarika D, Majumder N, et al. Beneath the tip of the iceberg: Current challenges and new directions in sentiment analysis research[J]. IEEE Transactions on Affective Computing, 2020.
? 發(fā)表:IEEE Transactions on Affective Computing, 2020. CCF-B
由于本文是情感分析綜述論文,細(xì)分情感分析對應(yīng)測領(lǐng)域钞螟,故將文章的主要內(nèi)容進(jìn)行簡要介紹兔甘。

What

Sentiment Analysis,情感分析鳞滨,也稱為意見挖掘洞焙,是一個(gè)旨在理解非結(jié)構(gòu)化內(nèi)容的潛在情感的研究領(lǐng)域。自早期開始以來(Pang et al., 2002; Turney, 2002)拯啦,情感分析廣泛應(yīng)用于個(gè)人澡匪、企業(yè)和政府,了解人們對產(chǎn)品提岔、政治議程或營銷活動(dòng)的看法仙蛉。輿論也影響與金融預(yù)測。此外碱蒙,教育和醫(yī)療保健部門利用情緒分析對學(xué)生和患者的行為分析荠瘪。人們研究情感分析問題只當(dāng)做一個(gè)文本/內(nèi)容分類任務(wù)——分為兩種或三類情緒:正面、負(fù)面或中性赛惩,現(xiàn)已經(jīng)逐漸趨向飽和哀墓。在基礎(chǔ)數(shù)據(jù)集上(如 IMDB or SST-2)的研究效果如圖 1 。
figure 1

? 同時(shí)喷兼,圖 1 還顯示了每個(gè)基礎(chǔ)數(shù)據(jù)集使用的模型方法。

Example

"John dislikes the camera of iPhone 7", according to the technical definition (Liu, 2012) of sentiment analysis, John plays the role of the opinion holder exposing his negative sentimenttowards the aspect – camera of the entity – iPhone 7.

How

2 NOSTALGIC PAST: DEVELOPMENTS ANDACHIEVEMENTS IN SENTIMENT ANALYSIS

sentiment analysis 的過去和現(xiàn)在季惯,如圖 2 勉抓。
Figure 2
Granularities 粒度層級(jí)

主要分為三類:
1 Document-level: 給出文檔的整體正負(fù)向觀點(diǎn)贾漏。
? 主要方法:unigrams (bag of words) and trained simple classifiers, such as Naive Bayes classifiers and SVMs.
2 Sentence-level: 單個(gè)句子藕筋。
? 在許多情況下上述的粒度并未指示情感的目標(biāo)。他們隱含地假設(shè)文本跨度(文檔或句子)傳達(dá)了對實(shí)體的單一情緒隐圾,針對更精細(xì)的審查級(jí)別伍掀,引出了更細(xì)粒度的分析暇藏。
3 Aspect-level: 即方面級(jí)別的情感分析,其中每個(gè)實(shí)體識(shí)別情緒(Hu & Liu, 2004b)(along with its aspects)把兔。方面級(jí)分析可以更好地理解情感分布垛贤。
? 除了這三個(gè)粒度級(jí)別之外趣倾,還對短語級(jí)情感分析(phrase-level sentiment analysis)進(jìn)行了大量的研究儒恋,這些情感分析側(cè)重于句子中的短語(Wilson et al., 2005b)。

Trends in Sentiment Analysis Applications 趨勢
  • 1 Rule-Based Sentiment Analysis:
    利用情感詞并利用它們的組合來分析極性的短語單元禀酱。
    例如剂跟,詞袋模型的局限導(dǎo)致了對價(jià)轉(zhuǎn)移器(valence shifters)的研究的出現(xiàn)酣藻,該研究結(jié)合了基于上下文使用的術(shù)語的價(jià)和極性的變化(Polanyi & Zanen, 2006; Moilanen & Pulman, 2007)辽剧。然而,只有價(jià)移器不足以檢測情感——它還需要了解句法單元的情感流偷崩,產(chǎn)生了啟發(fā)式和規(guī)則學(xué)習(xí)(Choi & Cardie, 2008)阐斜、混合系統(tǒng)(Rentoumi et al., 2010)放吩、句法依賴等渡紫。 (heuristics and rules (Choi & Cardie, 2008), hybrid systems (Rentoumi et al., 2010), syntactic dependencies (Nakagawa et al., 2010; Hutto & Gilbert, 2014))

  • 2 Sentiment Lexicons:
    是基于規(guī)則的情感分析方法的核心惕澎。
    詞典是包含其組成詞、短語或同義詞集的情感注釋的詞典捣卤。如SentiWordNet (Esuli & Sebastiani, 2006) 董朝、SO-CAL (Taboada et al., 2011) 、SCL-OPP等祟绊。這些詞典不僅存儲(chǔ)單詞極性關(guān)聯(lián)哥捕,還包括反映復(fù)雜情感組合的短語或規(guī)則遥赚,例如否定凫佛、增強(qiáng)詞。
    ? 詞典主要是使用三種廣泛的方法衣赶、手動(dòng)府瞄、自動(dòng)和半監(jiān)督創(chuàng)建的碘箍。但沒有一個(gè)詞典可以處理從語義組合性中觀察到的所有細(xì)微差別(Tolleo-Ronen 等人丰榴,2018四濒;Kiritchenko 和 Mohammad盗蟆,2016d)戈二,或解釋上下文極性喳资。

  • 3 Machine Learning-Based Sentiment Analysis:
    如 Naive Bayes Classifiers (Tan et al., 2009), nearest neighbour (Moghaddam & Ester, 2010), bag-of-words (including weighted variants) (Martineau & Finin, 2009), lexicons (Gavilanes et al., 2016) to syntactic features such as parts of speech (Mejova & Srinivasan, 2011)等方法仆邓。

  • 4 Deep Learning Era: 如 RNTN伴鳖、CNNs榜聂、RNNs等峻汉。
    深度網(wǎng)絡(luò)的注釋數(shù)據(jù)通常是有限的。因此扳埂,需要通過句法信息提供歸納偏差阳懂,或者以詞典的形式提供外部知識(shí)作為附加輸入(Tay 等人岩调,2018b)号枕。比如BERT葱淳、XLNet、RoBERTa艳狐。
    5 Sentiment-Aware Word Embeddings: 深度學(xué)習(xí)架構(gòu)的關(guān)鍵構(gòu)建塊之一是其詞嵌入毫目。

    ? 單詞表示依賴于它用于的任務(wù)(Labutov & Lipson镀虐,2013)粉私。然而近零,大多數(shù)基于情感分析的模型都使用靜態(tài)的通用詞表示(general-purpose word representations)。如圖 3 顯示的關(guān)鍵里程碑節(jié)點(diǎn)漓摩。
    Figure 3

3 OPTIMISTIC FUTURE: UPCOMING TRENDS IN SENTIMENT ANALYSIS

Sentiment analysis 涉及的子領(lǐng)域如下圖管毙,后文將根據(jù)本圖進(jìn)行展開論述夭咬。
figure 2
案例

圖 4 展示了一個(gè)用戶與閑聊式聊天機(jī)器人聊天卓舵。在對話中掏湾,為了產(chǎn)生適當(dāng)?shù)捻憫?yīng)融击,機(jī)器人需要了解用戶的意見尊浪。這涉及多個(gè)子任務(wù)际长,包括

  1. 提取實(shí)體航空公司的服務(wù)兴泥、座位等方面搓彻,
  2. 方面級(jí)別的情感分析以及知道旭贬,
  3. 誰持有意見以及為什么(情感推理)稀轨。
    Figure 4

3.1 Aspect-Based Sentiment Analysis 基于方面的情感分析

? 在基于方面的情感分析的上下文中,方面是用于主題艰赞、實(shí)體或其屬性/特征的通用術(shù)語( topics, entities, or their attributes/features)方妖。它們也被稱為意見目標(biāo)党觅。

  • 例如杯瞻,“This actor is the only failure in an otherwise brilliant cast.”炫掐,意見附加到兩個(gè)特定的實(shí)體卒废,演員(負(fù)面意見)和演員(正面意見)摔认。也有沒有可以分配給完整句子的整體意見参袱。

基于方面的情感分析 (ABSA) 采用這種細(xì)粒度的視圖抹蚀,旨在識(shí)別每個(gè)實(shí)體(或其方面)的情緒(Liu环壤,2015郑现;Liu & Zhang荧降,2012)朵诫。該問題涉及兩個(gè)主要子任務(wù):

  • 1)Aspectextraction 方面提取剪返,它識(shí)別給定句子或段落中提到的方面(在上面的例子中演員和演員)。
  • 2)Aspect-level Sentiment Analysis (ALSA) 方面級(jí)情感分析(ALSA)震放,它確定與相應(yīng)方面/意見目標(biāo)(演員?負(fù)面和演員?正面)相關(guān)的情感方向(Hu & Liu, 2004a)殿遂。
3.1.1 Aspect-Term Auto-Categorization

方面術(shù)語提取是方面級(jí)情感分析的第一步墨礁。我們在圖 5 中說明了這種分類恩静。
Figure 5

? 基于監(jiān)督和無監(jiān)督的主題分類和詞典驅(qū)動(dòng)能成功地克服了可擴(kuò)展性問題驶乾。我們相信基于實(shí)體鏈接的方法级乐,加上 Probase (Wu et al., 2012) 等語義圖风科,應(yīng)該能夠在克服可擴(kuò)展性問題的同時(shí)合理地執(zhí)行贼穆。例如故痊,"With this phone, I always have a hard time getting signal indoors." 包含一個(gè)方面術(shù)語信號(hào)崖蜜,可以傳遞給實(shí)體鏈接器——在圖 5 所示的樹上—— with the surrounding words as context to obtain aspect category phone:signal-quality

3.1.2 Implicit Aspect-Level Sentiment Analysis

不同方面的情緒可以隱式表達(dá)豫领。

  • 例如等恐,在句子中,"Oh no! Crazy Republicans voted against this bill"囱稽,演講者明確表達(dá)了她/他對共和黨的負(fù)面情緒战惊。

3.1.3 Aspect Term-Polarity Co-Extraction

方法有:分層神經(jīng)網(wǎng)絡(luò)(Lakkaraju 等人吞获,2014 年)各拷、多任務(wù) CNN(Wu 等人烤黍,2016 年)和基于 CRF速蕊、聯(lián)合學(xué)習(xí)规哲、遷移學(xué)習(xí)等。

3.1.4 Exploiting Inter-Aspect Relations for Aspect-Level Sentiment Analysis 利用方面級(jí)情感分析的方面間關(guān)系

主要重點(diǎn)是對意見目標(biāo)與其對應(yīng)的自以為為是的之間的依賴關(guān)系進(jìn)行建模关顷。

  • 例如议双,在句子“my favs here is the tacos pastor and tostada de tinga”中平痰,方面“tacos pastor”和“tostada de tinga”使用連詞“and”連接宗雇,兩者都依賴于帶有情感的詞“favvs”赔蒲。

3.2 Multimodal Sentiment Analysis 多模態(tài)情感分析

動(dòng)機(jī):形如YouTube, Facebook, Vimeo等企業(yè)傾向于通過分析這些視頻中的用戶情緒來對其產(chǎn)品做出商業(yè)決策舞虱。

圖 6 顯示了除了文本本身之外存在多模態(tài)信號(hào)的示例矾兜,以便正確預(yù)測它們的情緒和情緒椅寺。多模態(tài)融合是多模態(tài)情感分析的核心配并。
Figure 6

下面簡述有助于未來研究的三個(gè)關(guān)鍵方向:

  • 3.2.1 Complex Fusion Methods vs. Simple Concatenation 復(fù)雜融合方法與簡單連接
  • 3.2.2 Lack of Large Datasets 缺乏大型數(shù)據(jù)集
  • 3.2.3 Fine-Grained Annotation 細(xì)粒度注釋

3.3 Contextual Sentiment Analysis

3.3.1 Influence of Topics

情感詞的使用因一個(gè)主題而異畸冲。當(dāng)與其他單詞或短語共軛時(shí)邑闲,表面上聽起來中性的詞可以帶有情緒苫耸。

  • 例如褪子,大房子里的大這個(gè)詞在有人打算購買大房子供休閑時(shí)可以帶有積極的情緒嫌褪。然而胚股,同一個(gè)詞在上下文中使用時(shí)可能會(huì)引起負(fù)面情緒——大房子很難清理琅拌。
    某些詞的情緒可能含糊不清进宝,并且僅在上下文中看到時(shí)指定党晋。
  • 例如,the word massive in the context of massive earthquake and massive villa.

這項(xiàng)研究問題也與詞義消歧有關(guān)蛹锰。例如:

  • a. The Federal Government carried the province for many years.
  • b. The troops carried the town after a brief fight.
    在第一句中,carry 的意義具有正極性癣猾。然而纷宇,在第二個(gè)句子中像捶,同一個(gè)詞具有負(fù)面含義拓春。
3.3.2 Sentiment Analysis in Monologues and Conversational Context

上下文的概念可能因問題而異硼莽。

  • 例如懂鸵,在計(jì)算單詞表示時(shí)匆光,周圍的單詞攜帶上下文信息殴穴。同樣,為了對文檔中的句子進(jìn)行分類震桶,其他相鄰句子被視為其上下文蹲姐。
  • 例如柴墩,“Oh no. The bill has been passed”江咳。由于孤立句子中不存在明確的情感標(biāo)記——“The bill has been passed”歼指,它會(huì)聽起來像中性句子踩身。因此挟阻,“bill”背后的情緒不是由任何特定單詞表達(dá)的轨奄。然而挪拟,考慮到上下文中的句子——“Oh no”表現(xiàn)出負(fù)面情緒,可以推斷“bill”表達(dá)的意見是負(fù)面的击你。
    方法有:logic rules, finite-state transducers, belief, and information propagation mechanisms, using a gate or switch to learn and further infer when to count on contextual information.

對話中的情緒與情緒動(dòng)態(tài)密切相關(guān)玉组,包括兩個(gè)重要方面(Morris & Keltner,2000):

  • Self dependency丁侄,自我依賴惯雳,也稱為情感慣性,處理說話者在對話中對自己的影響方面(Kuppens 等人鸿摇,2010)。
  • inter-personal dependencies 人際依賴與對應(yīng)物誘導(dǎo)說話者的情感感知影響有關(guān)拙吉。相反潮孽,在對話過程中,說話者也傾向于反映他們的同行來構(gòu)建融洽關(guān)系(Navarretta et al., 2016)筷黔。這種現(xiàn)象如圖7所示往史。
    Figure 7
  • Pa is frustrated over her long term unemployment and seeks encouragement (u1, u3). Pb, however, is pre-occupied and replies sarcastically (u4). This enrages Pa to appropriate an angry response (u6). In this dialogue, self-dependencies are evident in Pb, who does not deviate from his nonchalant behavior. Pa, however, gets sentimentally influenced by Pb.

因此,分析對話的主題以及參數(shù)結(jié)構(gòu)佛舱、對話者個(gè)性椎例、意圖挨决、對話中的觀點(diǎn)、彼此的態(tài)度等各種因素對于可能導(dǎo)致豐富上下文理解的真實(shí)自我和個(gè)人間依賴建模至關(guān)重要(Hazarika 等人订歪,2018d)脖祈。

上下文的有用性在對短話語進(jìn)行分類方面更為普遍,例如 yeah刷晋、okay撒犀、no,可以根據(jù)對話的上下文和話語來表達(dá)不同的情感掏秩。圖 8 中的示例解釋了這種現(xiàn)象或舞,如何推斷 “Yeah”表達(dá)的情緒。
Figure 8
3.3.3 User, Cultural, and Situational Context

上下文情感還取決于用戶蒙幻、文化和情境背景映凳。

  • 例如,some individuals are more sarcastic than others. For such cases, the usage of certain words would vary depending on if they are being sarcastic. Let's consider this example, Pa ∶ The order has been cancelled. Pb ∶ This is great!. If Pb is a sarcastic person, then his response would express negative emotion to the order being canceled through the word great. On the other hand, Pb's response,great, could be taken literally if the canceled order is beneficial to Pb (perhaps Pb cannot afford the product he ordered).

由于對話中經(jīng)常缺少必要的背景信息邮破,因此基于先前話語的說話人分析通常會(huì)產(chǎn)生改進(jìn)的結(jié)果诈豌。
同一個(gè)詞的潛在情感可能因一個(gè)人而異。

  • E.g., the word okay can bear different sentiment intensity and polarity depending on the speaker's character.

3.3.4 Role of Commonsense Knowledge in Sentiment Analysis

常識(shí)知識(shí)的提煉已經(jīng)成為現(xiàn)代 NLP 研究的新趨勢抒和,如圖 9 矫渔。

  • The present scenario informs that David is a good cook and will be making pasta for some people. Based on this information, commonsense can be employed to infer related events such as, dough for the pasta would be available, people would eat food (pasta), the pasta is expected to be good (David is good cook), etc.
    Figure 9

3.4 Sentiment Reasoning

Apart from exploring the what, we should also explore the who and why.

3.4.1 Who?

The Opinion Holder .
Consider the following two lines of opinionated text:

  • a. The movie was too slow and boring.
  • b. Stella found the movie to be slow and boring.
    第一句的意見持有者是說話者,而第二句是 Stella摧莽。
    該任務(wù)可能更加復(fù)雜庙洼,需要映射同一實(shí)體術(shù)語(例如 Jonathan、John)的不同用法或代詞(he镊辕、she油够、它們)(Liu,2012)征懈。

故許多作品研究了意見持有者識(shí)別任務(wù)——意見提取的子任務(wù)石咬。其方法有:
named-entity recognition (Kim & Hovy, 2004),
parsing and ranking candidates (Kim & Hovy, 2006),
semantic role labeling (Wiegand & Ruppenhofer, 2015),
structured prediction using CRFs (Choi et al., 2006),
multi-tasking (Yang & Cardie, 2013), amongst others.

3.4.2 Why?

為了對意見持有者的特定情緒進(jìn)行推理,重要的是要了解情緒的目標(biāo)(Deng & Wiebe卖哎,2014)鬼悠,以及是否存在持有此類情緒的影響。

  • For instance, when stating "I am sorry that John Doe went to prison.", understanding the target of the sentiment in the phrase "John Doe goes to prison", and knowing that "go to prison" has negative implications on the target, implies positive sentiment toward John Doe.

以及重要的是要了解是什么導(dǎo)致了情緒亏娜。掌握情緒的原因在對話系統(tǒng)中也非常重要焕窝。例如,我們可以參考圖 10照藻, 一旦 Joey 確定 Chandler 在前一個(gè)話語中的接受袜啃,Joey 就會(huì)表達(dá)憤怒汗侵。
Figure 10

3.5 Domain Adaptation 領(lǐng)域適應(yīng)

大多數(shù)最先進(jìn)的情感分析模型都在域內(nèi)訓(xùn)練數(shù)據(jù)集幸缕。然而群发,每個(gè)域管理大量的訓(xùn)練數(shù)據(jù)是不切實(shí)際的。情感分析中的域適應(yīng)通過學(xué)習(xí)不可見域的特征來解決這個(gè)問題发乔。
Breakthroughs:adversarial learning熟妓、bag of words、distributed word representations such as Glove, BERT.

3.5.1 Use of External Knowledge

雖然全局或上下文詞嵌入已經(jīng)顯示出它們在建模域不變和特定表示方面的有效性栏尚,但將這些嵌入與多關(guān)系外部知識(shí)圖相結(jié)合以進(jìn)行域適應(yīng)可能是一個(gè)很好的想法起愈。例如 Glove,因?yàn)檫@些嵌入不是在顯式語義關(guān)系上訓(xùn)練的译仗。語義知識(shí)圖可以使用領(lǐng)域通用概念建立多個(gè)領(lǐng)域特定領(lǐng)域概念之間的關(guān)系——提供可用于域適應(yīng)的重要信息抬虽。如圖11。
Figure 11
3.5.2 Scaling Up to Many Domains

該領(lǐng)域的大多數(shù)現(xiàn)有工作都使用源域和目標(biāo)域?qū)Φ脑O(shè)置進(jìn)行訓(xùn)練纵菌。

3.6 Multilingual Sentiment Analysis 多語言情感分析

大多數(shù)情感分析研究都是在英語數(shù)據(jù)集上進(jìn)行的阐污。

3.6.1 Language-Specific Lexicons

印地語、法語咱圆、阿拉伯語等其他語言笛辟,沒有太多精心策劃的詞典可用。

3.6.2 Sentiment Analysis of Code-Mixed Data

社交媒體帖子內(nèi)容上的人是多種語言混合的序苏。

  • For example, "Itna izzat diye aapne mujhe !!! Tears of joy. :'( :'(", in this sentence, the bold text is in Hindi with roman orthography, and the rest is in English.
3.6.3 Machine Translation as a Solution to Multilingual

機(jī)器翻譯可以用作多語言或跨語言情感分析的解決方案手幢。Saadany & Orasan (2016) 的幾篇論文; Balamurali 等人忱详。 (2013) 嘗試了這個(gè)問題围来。Saadany & Orasan (2010) 聲稱,當(dāng)從阿拉伯語翻譯成英語時(shí)匈睁,不會(huì)保留相關(guān)情緒用于同義詞管钳、否定、變音符號(hào)和慣用表達(dá)软舌。

3.7 Sarcasm Analysis

由于文本的比喻性質(zhì)才漆,檢測諷刺非常具有挑戰(zhàn)性,伴隨著細(xì)微差別和隱含意義(Jorgensen 等佛点,1984)醇滥。
考慮的因素有:
prosodic cues (Bryant, 2010; Woodland & Voyer, 2011),
acoustic features including low-level descriptors,
and spectral features (Cheang & Pell, 2008).

Whereas in textual systems, traditional approaches consider rule-based (Khattri et al., 2015) or statistical patterns (Gonz ?alez-Ib ?a ?nez et al., 2011b), stylistic patterns (Tsur et al., 2010), incongruity (Joshi et al., 2015; Tay et al., 2018a), situational disparity (Riloff et al., 2013), and hashtags (Maynard & Greenwood, 2014).

3.7.1 Leveraging Context in Sarcasm Detection

與情感分析(第 3.2 節(jié)和第 3.3 節(jié))類似,諷刺檢測可以受益于對話歷史超营、作者趨勢和多模態(tài)提供的上下文線索鸳玩。

User Profiling and Conversational Context

  • authorial context:利用作者上下文通過查看作者的歷史和元數(shù)據(jù)(Bamman & Smith, 2015; Hazarika et al., 2018a)來深入研究分析作者的諷刺傾向(用戶分析)。

  • conversational context. 會(huì)話上下文使用從周圍話語中獲得的附加信息來確定句子是否具有諷刺意味(Ghosh 等人演闭,2018 年)不跟。

  • For example, "He sure played very well" is sarcastic, it is imperative to look at prior statements in the conversation to reveal facts ("The team lost yesterday").

Multimodal Context
音調(diào)的變化、單詞米碰、直臉等均是線索窝革。
圖 12 顯示了來自該數(shù)據(jù)集的兩種情況购城,其中諷刺是通過模態(tài)之間的不一致來表達(dá)的。在第一種情況下虐译,語言模態(tài)表示恐懼或憤怒瘪板。相比之下,面部模態(tài)缺乏任何與文本模態(tài)一致的可見焦慮跡象漆诽。在第二種情況下侮攀,文本表示贊美,但發(fā)聲和面部表情顯示無差異厢拭。

Figure 12

3.7.2 Annotation Challenges

Intended vs. Perceived Sarcasm
困難:perceived sarcasm兰英、the low annotator agreements across the datasets
方法:utilize perceptual uncertainty、rely on self annotated data collection

3.7.3 Target Identification in Sarcastic Text

任務(wù):識(shí)別嘲笑對象

3.7.4 Style Transfer between Sarcastic and Literal

任務(wù):將具有比喻意義轉(zhuǎn)換為其真實(shí)和字面形式的意義供鸠。

  • 例如箭昵,"I loved sweating under the sun the whole day" to "I hated sweating under the sun the whole day".
3.7.5 Sentiment and Creative Language

其他形式的創(chuàng)造性語言工具,如諷刺回季、幽默等家制,也與情感分析有共同依賴。
Ironyis more generic than sarcasm as it used to mean the opposite of what is being said.
Humor is another tool that is often used in human language.

3.8 Sentiment-Aware Natural Language Generation (NLG)

現(xiàn)在的模型能夠沒有經(jīng)過訓(xùn)練來產(chǎn)生能夠模擬人類交流的情感內(nèi)容泡一。

3.8.1 Conditional Generative Models

我們?nèi)祟惖膸讉€(gè)特征——emotion, sentiment, prior assumptions, intent, or personality ——均可以通過模型生成語言特征颤殴。
思路與方法:

  • learning disentangled representations, where the key idea is to separate the textual content from high-level attributes,VAEs (Hu et al., 2017), GANs (Wang & Wan, 2018) or Seq2Seq models (Radford et al., 2017)
  • pose the problem as an attributeto-text translation task (Dong et al., 2017; Zang & Wan, 2017).
    3.8.1.2 Aspect-level text summarization:
    如圖 14鼻忠。方面級(jí)文本摘要任務(wù)包括兩個(gè)階段:: aspect extraction and aspect summarization涵但。第一階段提取輸入文本中討論的所有方面。后者從源文本中生成提取方面的抽象或提取要點(diǎn)帖蔓。在抽象要點(diǎn)的情況下矮瘟,模型生成以給定方面為條件的內(nèi)容。
    Figure 14
3.8.2 Sentiment-Aware Dialogue Generation

情感控制文本領(lǐng)域也滲透到對話系統(tǒng)中塑娇。這里的目的是為這些系統(tǒng)配備情感智能以提高用戶興趣和參與度(Partala & Surakkar澈侠,2004;Prendinger & Ishizuka埋酬,2005)哨啃。兩個(gè)關(guān)鍵點(diǎn):

  1. Given a user query, determine the best emotional/sentiment response adhering to social rules of conversations.
  2. Generate the response eliciting that emotion/sentiment. Present works in this field either approach these two sub-problems independently (Ghosh et al., 2017) or in a joint manner (Gu et al., 2019).
3.8.3 Sentiment-Aware Style Transfer

Style transfer of sentiment 側(cè)重于通過刪除或插入新的情感詞來翻轉(zhuǎn)句子的情感。

  • E.g., to change the sentiment of "The chicken was delicious", we need to find a replacement of the word delicious that carries negative sentiment.
    思路:依賴基于規(guī)則的 (Li et al., 2018) 和基于對抗學(xué)習(xí)写妥、應(yīng)該與 ABSA(基于方面的情感分析)研究一起進(jìn)行研究拳球,以學(xué)習(xí)主題/方面和情感詞之間的關(guān)聯(lián)。

3.9 Bias in Sentiment Analysis Systems

公平性最近受到了廣泛關(guān)注珍特。
情感分析系統(tǒng)通常用于敏感的領(lǐng)域祝峻,例如醫(yī)療保健,它處理咨詢等敏感話題。
3.9.1 Identifying Causes of Bias in Sentiment Analysis Systems
Bias 可以通過三個(gè)主要來源引入到情感分析模型中:

  1. Bias in word embeddings: 公開的數(shù)據(jù)集來自女性特征非常少莱找,自然無法代表女性觀點(diǎn)酬姆。
  2. Bias in the model architecture: 情感分析系統(tǒng)通常使用元信息,例如性別標(biāo)識(shí)符和人口統(tǒng)計(jì)指標(biāo)宋距,包括年齡、種族症脂、國籍和地理線索谚赎。可能會(huì)導(dǎo)致隱形的偏見诱篷。
    For example, the general perception about good weather,good traffic, cheap phone can vary among the Indian and American populations.
  3. Bias in the training data:
    For instance, samples from female subjects frequently belonging to positive sentiment category. An author's stylistic sense of writing can also be one of the many sources of bias in sentiment systems.
    E.g., one person uses strong sentiment words to express a positive opinion but prefers to use milder sentiment words in exhibiting negative opinions.
    Similarly, sentiment expression might vary across races and genders, e.g., as shown in a recent study by Bhardwaj et al. (2020). 當(dāng)同一個(gè)句子中的性別詞從陽性變?yōu)殛幮詴r(shí)壶唤,情感分析模型可能會(huì)顯示出情感強(qiáng)度的顯著差異。
3.9.3 De-biasing

Approach:
提取一個(gè)數(shù)據(jù)子集沒有表現(xiàn)出任何明確的偏見跡象棕所。用單詞替換擾亂文本闸盔,以生成訓(xùn)練數(shù)據(jù)中的反事實(shí)案例。然后琳省,這些生成的實(shí)例可用于規(guī)范模型的學(xué)習(xí)迎吵,或者通過約束嵌入空間對擾動(dòng)保持不變或最小化正確實(shí)例和擾動(dòng)實(shí)例之間的預(yù)測差異。
然而针贬,現(xiàn)有的研究主要集中在識(shí)別與上下文無關(guān)的詞表示中的性別偏見击费,例如 GloVe(Bolukbasi 等人,2016桦他;Kaneko 和 Bollegala蔫巩,2019堕花;Kumar 等人追他,2020)。
相反甩十,BERT 詞向量到向量的映射高度依賴于上下文蔫劣,這使得很難分析 BERT 固有的偏差坪郭。
In Zhao et al. (2019); Basta et al. (2019); Gonen & Goldberg (2019), 等人對 ELMo 應(yīng)用去偏。
Kurita等人(2019)提出了一種基于模板的方法來量化BERT中的偏差脉幢。
Sahlgren & Olsson (2019) 研究了上下文化和非上下文化瑞典語嵌入的偏差截粗。
除了模型的傳統(tǒng)偏差外,在做出研究選擇時(shí)鸵隧,偏差也可以在更高級(jí)別存在绸罗。一個(gè)簡單的例子是社區(qū)傾向于求助于基于英語的語料庫。

4 CONCLUSION

情感分析通常被視為一個(gè)簡單的分類任務(wù)豆瘫,將內(nèi)容分類為正面珊蟀、負(fù)面和中性情緒。相比之下,情感分析的任務(wù)非常復(fù)雜育灸,受人類動(dòng)機(jī)腻窒、意圖、上下文細(xì)微差別等多個(gè)變量控制磅崭。
以上為情感分析各個(gè)子任務(wù)的大概分析內(nèi)容儿子。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市砸喻,隨后出現(xiàn)的幾起案子柔逼,更是在濱河造成了極大的恐慌,老刑警劉巖割岛,帶你破解...
    沈念sama閱讀 221,548評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件愉适,死亡現(xiàn)場離奇詭異,居然都是意外死亡癣漆,警方通過查閱死者的電腦和手機(jī)维咸,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,497評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來惠爽,“玉大人癌蓖,你說我怎么就攤上這事』樗粒” “怎么了费坊?”我有些...
    開封第一講書人閱讀 167,990評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長旬痹。 經(jīng)常有香客問我附井,道長,這世上最難降的妖魔是什么两残? 我笑而不...
    開封第一講書人閱讀 59,618評論 1 296
  • 正文 為了忘掉前任永毅,我火速辦了婚禮,結(jié)果婚禮上人弓,老公的妹妹穿的比我還像新娘沼死。我一直安慰自己,他們只是感情好崔赌,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,618評論 6 397
  • 文/花漫 我一把揭開白布意蛀。 她就那樣靜靜地躺著,像睡著了一般健芭。 火紅的嫁衣襯著肌膚如雪县钥。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,246評論 1 308
  • 那天慈迈,我揣著相機(jī)與錄音若贮,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛谴麦,可吹牛的內(nèi)容都是我干的蠢沿。 我是一名探鬼主播,決...
    沈念sama閱讀 40,819評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼匾效,長吁一口氣:“原來是場噩夢啊……” “哼舷蟀!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起面哼,我...
    開封第一講書人閱讀 39,725評論 0 276
  • 序言:老撾萬榮一對情侶失蹤野宜,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后精绎,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體速缨,經(jīng)...
    沈念sama閱讀 46,268評論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡锌妻,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,356評論 3 340
  • 正文 我和宋清朗相戀三年代乃,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片仿粹。...
    茶點(diǎn)故事閱讀 40,488評論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡搁吓,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出吭历,到底是詐尸還是另有隱情堕仔,我是刑警寧澤,帶...
    沈念sama閱讀 36,181評論 5 350
  • 正文 年R本政府宣布晌区,位于F島的核電站摩骨,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏朗若。R本人自食惡果不足惜恼五,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,862評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望哭懈。 院中可真熱鬧灾馒,春花似錦、人聲如沸遣总。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,331評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽旭斥。三九已至容达,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間垂券,已是汗流浹背董饰。 一陣腳步聲響...
    開封第一講書人閱讀 33,445評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人卒暂。 一個(gè)月前我還...
    沈念sama閱讀 48,897評論 3 376
  • 正文 我出身青樓啄栓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親也祠。 傳聞我的和親對象是個(gè)殘疾皇子昙楚,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,500評論 2 359

推薦閱讀更多精彩內(nèi)容