應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

AI核心難點(diǎn)之一:情感分析的常見(jiàn)類(lèi)型與挑戰(zhàn)

2019-11-18 09:05 IT168網(wǎng)站

導(dǎo)讀:情感分析或情感人工智能,在商業(yè)應(yīng)用中通常被稱(chēng)為意見(jiàn)挖掘,是自然語(yǔ)言處理(NLP)的一個(gè)非常流行的應(yīng)用。文本處理是該技術(shù)最大的分支,但并不是唯一的分支。情緒AI有三種類(lèi)型及其組合。

情感分析或情感人工智能,在商業(yè)應(yīng)用中通常被稱(chēng)為意見(jiàn)挖掘,是自然語(yǔ)言處理(NLP)的一個(gè)非常流行的應(yīng)用。文本處理是該技術(shù)最大的分支,但并不是唯一的分支。情緒AI有三種類(lèi)型及其組合。它們都面臨著各自的挑戰(zhàn),目前都處于不同的發(fā)展階段。在本文中,筆者將簡(jiǎn)要介紹這三種類(lèi)型以及它們?cè)趯?shí)際應(yīng)用中的挑戰(zhàn)。

文本情感分析

作為NLP的一個(gè)子集,文本分析和書(shū)面意見(jiàn)挖掘是迄今為止最簡(jiǎn)單和最發(fā)達(dá)的情緒分析類(lèi)型。它們的需求量大,發(fā)展歷史長(zhǎng),也是企業(yè)和公共部門(mén)最常采用的技術(shù)。

基本的情緒分析,尤其是用于商業(yè)用途的,可以概括為將句子、段落、帖子或文檔分為消極、中性或積極三類(lèi)。其中,更復(fù)雜的情緒和態(tài)度處理、意義提取、意圖分類(lèi)和基于語(yǔ)言學(xué)的情感分析也越來(lái)越受歡迎。

自動(dòng)情緒分析通常是通過(guò)監(jiān)督式深度機(jī)器學(xué)習(xí)、基于詞典的非監(jiān)督過(guò)程或兩者的結(jié)合來(lái)實(shí)現(xiàn)的。

我們有許多現(xiàn)成的數(shù)據(jù)集,如社交媒體、各種評(píng)論平臺(tái)和公開(kāi)的問(wèn)答服務(wù)。爬取受歡迎的網(wǎng)站(在受允許的情況下)來(lái)提取新數(shù)據(jù)也很受歡迎,Twitter和亞馬遜是特別受歡迎的選擇。

視覺(jué)情感分析

作為多媒體情感分析的一部分,與基于文本的分析相比,視覺(jué)情感AI在開(kāi)發(fā)和商業(yè)整合方面還遠(yuǎn)遠(yuǎn)不夠。

當(dāng)前情感分析應(yīng)用的一個(gè)好例子是數(shù)字圖像存儲(chǔ)庫(kù)中通過(guò)情感標(biāo)識(shí)符(“幸福”、“愛(ài)”、“喜悅”、“憤怒”)進(jìn)行視覺(jué)內(nèi)容搜索,以及自動(dòng)的圖像和視頻標(biāo)簽預(yù)測(cè)。即將出現(xiàn)的應(yīng)用是出于教育、政治、文化、安全及其他目的,對(duì)人們情感的自動(dòng)理解。

目前,視覺(jué)/文本分析,以及圖像注釋和伴隨文本的分析仍然是機(jī)器學(xué)習(xí)進(jìn)程的主要來(lái)源,旨在創(chuàng)建用于視覺(jué)情感分析的人工智能。

視覺(jué)情緒分析的數(shù)據(jù)也可以來(lái)自社交媒體:來(lái)自Flickr、Twitter、Tumblr的圖片;公共托管視頻平臺(tái)(YouTube等)

得益于許多著名的帶注釋的靜態(tài)圖像數(shù)據(jù)集,我們可以很容易地對(duì)面部表情進(jìn)行解釋和分類(lèi)。復(fù)雜或抽象的圖像以及視頻和實(shí)時(shí)視覺(jué)的情感分析是一個(gè)更大的問(wèn)題,特別是遇到缺少具體標(biāo)簽,或強(qiáng)行做出的和不準(zhǔn)確的表情等這些情況時(shí)。

復(fù)雜的視覺(jué)情感分析需要更高層次的抽象、文化知識(shí),以及對(duì)主體性、概念和線索的理解。獲得已標(biāo)記的數(shù)據(jù)集是很難的,為學(xué)習(xí)提取和預(yù)測(cè)所表達(dá)的含義這一目的而創(chuàng)建模型也是很難的。

盡管最近的研究讓我們看到了很多希望,但更重要的是它們首先也表明了這樣一個(gè)事實(shí):在我們發(fā)明視覺(jué)測(cè)謊儀和威脅檢測(cè)安全系統(tǒng),能夠結(jié)合下意識(shí)的面部表情和肢體語(yǔ)言來(lái)分析潛在的危險(xiǎn)情況之前,還有很長(zhǎng)的路要走。

音頻情感分析

語(yǔ)音聊天機(jī)器人正在成為我們生活中越來(lái)越重要的一部分,比如客戶服務(wù)電話中常聽(tīng)見(jiàn)的某種“固定”的響應(yīng)或問(wèn)候。這些語(yǔ)音助手要么已經(jīng)在使用,要么即將使用情感分析技術(shù),雖然還遠(yuǎn)非完美。

從語(yǔ)音語(yǔ)調(diào)和環(huán)境中檢測(cè)壓力、沮喪和其他情緒是機(jī)器已經(jīng)能夠完成的任務(wù)之一。理解和模擬韻律和調(diào)性的能力是目前語(yǔ)音處理和合成的一個(gè)重要部分。

現(xiàn)有的用于音頻情緒分析的情緒檢測(cè)方法通常與語(yǔ)音識(shí)別相結(jié)合。這種分析的參數(shù)是一組可檢測(cè)的聲學(xué)特征:音調(diào)、音強(qiáng)、節(jié)奏、頻譜系數(shù)等等。

慕尼黑開(kāi)源情感與情感識(shí)別工具包(openEAR)是最受認(rèn)可的情感分析工具包之一,能夠提取4000多個(gè)特征(56個(gè)聲學(xué)低級(jí)別描述符中的39個(gè)功能)。

情緒分析和情感AI的主要挑戰(zhàn)是什么?

情感AI開(kāi)發(fā)者仍然需要克服幾個(gè)挑戰(zhàn)。

現(xiàn)在機(jī)器學(xué)習(xí)的一個(gè)普遍概念是:情感人工智能“訓(xùn)練”的成功總是取決于輸入數(shù)據(jù)的質(zhì)量。更大、更好、更干凈的數(shù)據(jù)集對(duì)于避免“垃圾in、垃圾out”的情況是必要的,由這一情況引起的挑戰(zhàn)如:

文本情感分析面臨的挑戰(zhàn):無(wú)法識(shí)別雙重含義、笑話和影射;無(wú)法解釋語(yǔ)言和非母語(yǔ)語(yǔ)音結(jié)構(gòu)的區(qū)域差異。

例如:對(duì)于情感AI來(lái)說(shuō),處理書(shū)面演講中的諷刺可能是一項(xiàng)艱巨的任務(wù),可能會(huì)存在對(duì)意義和意圖的歪曲理解。雖然社交媒體通常是機(jī)器學(xué)習(xí)算法挖掘意見(jiàn)和意圖的來(lái)源,但其中的語(yǔ)言無(wú)可否認(rèn)是特定的,不一定是現(xiàn)實(shí)生活中的真實(shí)演講?!癆I聊天機(jī)器人在推特上呆了一天就變成了種族主義者”這類(lèi)臭名昭著的事件很滑稽,但仍然很常見(jiàn)。

視覺(jué)情感分析的挑戰(zhàn):無(wú)法區(qū)分真實(shí)的和強(qiáng)迫的或夸張的情緒表達(dá);不包括肢體語(yǔ)言;處理概念和抽象圖像的問(wèn)題。

例子:情感和情緒分析的一個(gè)顯著應(yīng)用是安全和防衛(wèi)應(yīng)用,例如,視覺(jué)測(cè)謊儀。到目前為止,與算法感知水平相關(guān)的問(wèn)題在于理解真實(shí)情感的領(lǐng)域,或者缺乏真實(shí)情感的領(lǐng)域。雖然最近有一些成功的研究和發(fā)展,旨在識(shí)別真實(shí)和虛假的面部表情,但這些研究和發(fā)展仍然是相對(duì)小規(guī)模的,非常細(xì)分的,比如只涉及微笑時(shí))。

語(yǔ)音情感分析的挑戰(zhàn):不考慮各種口音、地區(qū)語(yǔ)言模式、個(gè)人發(fā)音習(xí)慣等等。

許多非母語(yǔ)人士在說(shuō)第二語(yǔ)言時(shí)仍保留著口音。在其他方面,口音可以表現(xiàn)為過(guò)渡調(diào)性、語(yǔ)速和停頓變化,而這些變化并不是第一語(yǔ)言所特有的。我們需要對(duì)其進(jìn)行明確的解釋?zhuān)駝t這些轉(zhuǎn)變可能導(dǎo)致對(duì)情緒和意圖的誤解。

在我們開(kāi)發(fā)更好的聊天機(jī)器人、智能助手、家庭和商業(yè)環(huán)境中的機(jī)器人向?qū)?,以及最終實(shí)現(xiàn)自我意識(shí)、移情和真正理解人類(lèi)表達(dá)的人工智能的道路上,這些問(wèn)題都是需要重點(diǎn)克服的。