導讀:人工智能和大數(shù)據(jù)時代的到來為心理學的研究打開了全新的大門。
人工智能和大數(shù)據(jù)時代的到來為心理學的研究打開了全新的大門。人工智能除了在心理實驗方面有著無法取代的潛力,在其他方面也會大大拓展心理學的研究領域。隨著智能終端的不斷發(fā)展,移動數(shù)據(jù)的不斷提速,人工智能不僅可以提供心理干預的平臺,更有可能成為心理干預的主力??茖W的研究方法將心理學從哲學中分離開來,而人工智能和大數(shù)據(jù)則可能將心理學更深刻地帶入生活。
心理學是研究人的行為和心理活動規(guī)律的科學,自人類出現(xiàn),便有了對人類心理和行為的關注。直到 1879 年,構(gòu)造主義學派創(chuàng)始人馮特在德國萊比錫大學建立第一個心理學實驗室,心理學從哲學的襁褓中分離出來,成為一門獨立的科學。
心理學通過科學的方法去分析人的行為和心理,主要包括觀察法、調(diào)查法(問卷法和訪談法)、測驗法、實驗法等。這些方法很容易受到主試和被試自身期待或動機的影響,而產(chǎn)生虛假或迷惑性的結(jié)果,即內(nèi)部效度可能會受到影響;由于是在一定的時間段內(nèi)選取有限的、有代表性的研究對象進行研究,然后將結(jié)論推廣到相同的群體中,這些方法的外部效度和實效性也備受質(zhì)疑。
目前心理學研究主要以自我報告或者主觀觀察為主要技術(shù)手段,對現(xiàn)實或網(wǎng)絡環(huán)境中人們的行為和心理進行研究。隨著技術(shù)的發(fā)展,網(wǎng)絡環(huán)境已不能單純地看作一種工具,它已經(jīng)與人類的生存及其環(huán)境深度融合,具有與既往傳統(tǒng)心理學研究環(huán)境完全不同的復雜性與特殊性,同時也為研究提供了新的思路。
人工智能和大數(shù)據(jù)時代的到來為心理學的研究打開了全新的大門。隨著網(wǎng)絡及各種智能可穿戴設備的普及,虛擬環(huán)境與真實生活不斷融合,現(xiàn)實社會中人的各種心理與行為現(xiàn)象能夠被電子化記錄成大數(shù)據(jù)保存下來,例如網(wǎng)絡訪問行為、社會情緒、社會態(tài)度、心理健康問題等。研究人員通過用戶留下的這些數(shù)據(jù)對其人格特質(zhì)或者行為進行預測,Gosling等利用在線社交網(wǎng)站觀察到的人格結(jié)果對大五人格(big- five)的測量結(jié)果與基于Facebook的網(wǎng)絡行為自我報告進行了相關分析,結(jié)果發(fā)現(xiàn)大五人格的不同維度與網(wǎng)絡行為顯著相關;同時,依賴于現(xiàn)代生活方式,尤其是網(wǎng)絡信息傳播與人際互動,已經(jīng)深刻地影響甚至改變了人們的心理與行為特征,產(chǎn)生出一系列亟待解決的全新課題,例如謠言傳播、網(wǎng)絡煽動群體性事件、網(wǎng)絡成癮等。Zhou 等在研究利用中國社交媒體預測社會事件的發(fā)展趨勢時發(fā)現(xiàn),群體憤怒情緒會對集體行為產(chǎn)生影響,并且意見領袖、參與者的社會態(tài)度以及事件的持續(xù)時間都在預測網(wǎng)絡社交事件發(fā)展趨勢中發(fā)揮著重要作用。
大數(shù)據(jù)不僅在研究內(nèi)容上為心理學家?guī)砹诵碌恼n題,更重要的是,大數(shù)據(jù)與人工智能的結(jié)合,使得我們可以利用生態(tài)化的行為數(shù)據(jù),結(jié)合人工智能技術(shù),實現(xiàn)對人們心理指標的自動識別,即生態(tài)化識別(ecological recognition),從而大大拓展了心理學研究和應用范疇。Conroy等分析人工智能大數(shù)據(jù)與政治參與之間的關系發(fā)現(xiàn),利用互聯(lián)網(wǎng)新媒體可以增加投票率,促進公民參與積極性。此外,有研究者利用用戶在網(wǎng)絡上留下的數(shù)字足跡來對其心理特質(zhì)進行預測,并嘗試針對不同人格的用戶推送統(tǒng)一廣告的不同類型的廣告圖,結(jié)果顯示通過這一方式推送的廣告點擊率上升了40%。
生態(tài)化識別是指一種非接觸式的心理特征測量方法,利用機器學習,建立心理指標預測模型,從而實現(xiàn)對受試者的心理指標的自動識別。相比于傳統(tǒng)的心理學研究方法,生態(tài)化識別具有以下優(yōu)勢:首先,由于數(shù)據(jù)自身的特點,不同時間粒度的縱向追蹤成為可能;其次,可以通過時間回溯,獲取重大事件發(fā)生前后受試者的心理狀態(tài)和行為表現(xiàn)及其變化規(guī)律,從而對事件的影響進行量化研究,例如利用社交媒體探索家庭暴力對心理健康的影響,通過分析家庭暴力前后不同時間段的心理健康狀況了解家庭暴力對心理健康的負面影響;最后,生態(tài)化識別不依賴于被試的主觀報告,也不依賴于主試的操控,從而可以有效避免實驗條件帶來的誤差,提高了研究結(jié)果的內(nèi)部效度和外部效度。
以下將主要從人格預測模型的建立介紹如何將人工智能大數(shù)據(jù)應用于心理學研究,然后通過主動自殺干預以及輿情分析介紹在心理學實踐中的應用,最后討論特別需要關注的倫理問題。
01、建立心理指標預測模型——以人格預測為例
人格是構(gòu)成一個人思想、情感、行為的獨特模式。人格一直以來都備受心理學家的關注,逐漸形成了特質(zhì)理論、類型理論以及整合理論。目前最被接受的大五人格理論,就是特質(zhì)理論的一個典型代表。大五人格理論認為,人格可以分為5個因子:開放性(openness)、盡責性(conscientiousness)、外傾性(extroversion)、宜人性(agreeableness)和神經(jīng)質(zhì)(neuroticism)。
現(xiàn)有的人格結(jié)構(gòu)主要是從現(xiàn)實語境中產(chǎn)生的,在解釋網(wǎng)絡用戶行為過程中常常遇到困難,研究網(wǎng)絡人格結(jié)構(gòu)將有助于我們從心理層面識別網(wǎng)絡用戶身份,深入了解網(wǎng)絡用戶的行為特征并預測用戶的網(wǎng)絡行為。中國科學院心理研究所計算網(wǎng)絡心理 實 驗 室(computational cyber psychology lab,CCPL)對網(wǎng)絡人格結(jié)構(gòu)開展相關研究:根據(jù)詞匯學假設建立微博人格結(jié)構(gòu);利用機器學習,以期建立一個對網(wǎng)絡用戶行為心理具有更好描述和預測效果的模型,即建立人格預測模型。
傳統(tǒng)的心理學主要采用詞匯學的方法,對于自然語言中獲得的人格詞匯進行分析,得到一組數(shù)目有限的特質(zhì),用以代表在這一語言背景下的人們的最重要的特點。以新浪微博文本數(shù)據(jù)為研究材料,開展詞匯學研究。選取 100 個新浪微博活躍用戶的微博,通過人工標記的方式,得到描述穩(wěn)定人物特點的術(shù)語1945個。經(jīng)過對這些屬于進行刪除生僻、長度不宜詞匯和合并同義詞,獲得210個穩(wěn)定人格形容詞,隨后對形容詞好惡度、熟悉度和意義度進行評定,將形容詞化簡到63個形容詞,并增加具有微博特色的形容詞15個,最終得出共78個形容詞的詞表。通過對106名被試的78個形容詞的評定結(jié)果進行因素分析,得出了微博人格7因素:
道德善良、獨立擔當、團結(jié)包容、幽默活潑、網(wǎng)絡個性、謙虛淡定、自信低調(diào)(KMO=0.534)。分別對 7因素與人格5因子進行雙向回歸分析發(fā)現(xiàn),7因素對大五的解釋度(0.3264±0.115)比大五對7因素的解釋度(0.2917±0.159)好。
在利用詞匯學方法建立微博人格預測模型的基礎上,我們利用深度學習建立網(wǎng)絡用戶行為和心理的向量化表征??紤]用戶在微博上一般都能夠充分自主地表達自我,通過對微博數(shù)據(jù)進行深度學習和挖掘,可以直接在微博數(shù)據(jù)上建立更有效的表征向量,通過對微博數(shù)據(jù)的多層抽象學習,建立對用戶行為和心理特征的計算描述,同時該結(jié)構(gòu)由于完全由數(shù)據(jù)計算得來,避免了由于用戶主觀符合度評判帶來的偏差,能夠?qū)崿F(xiàn)對大規(guī)模人群的快速分析。心理指標的自動識別為進一步研究網(wǎng)絡心理提供了基礎性研究,能更有效地進行網(wǎng)絡用戶身份識別、預測用戶行為等。
02、在線主動自殺干預
據(jù)統(tǒng)計,中國每年有 28.7 萬人死于自殺,200萬人自殺未遂,因此造成的直接和間接經(jīng)濟、社會、心理損失不可估量,成為一個嚴重的公共衛(wèi)生問題。傳統(tǒng)的自殺風險評估研究主要采用心理測驗、訪談、問卷等分析方法,但從應用效果上說,以上方法具有較大的被動性;往往有自殺企圖或傾向的人主動求助率低,而且很難防止他們刻意隱藏內(nèi)心的真實想法,難以起到及時預警的作用。
不同于傳統(tǒng)研究方法的被動性,隨著近年來越來越多的社交網(wǎng)絡平臺給人們更多機會在虛擬集群中吐露自己的感受和觀點,通過社交網(wǎng)絡能主動尋找有潛在自殺傾向的個體,并對他們產(chǎn)生影響。
在新浪微博用戶文本分析基礎上,結(jié)合用戶行為數(shù)據(jù)分析,我們?nèi)姹容^了自殺用戶和無自殺傾向用戶在社交行為、語言使用上的差別,歸納有自殺傾向的用戶的可識別模式,建立自殺意念識別模型。該模型的精確率、召回率、F值和準確率分別為 0.88、0.85、0.85 和 0.86,優(yōu)于之前相同領域內(nèi)自殺識別的模型的結(jié)果。目前,本研究組通過對各種網(wǎng)絡媒介內(nèi)容的實時分析,甄別出其中帶有自殺意念的發(fā)言,并通過對發(fā)言用戶的以往行為和內(nèi)容的分析,更進一步確認該用戶的自殺意念后,會向他們提供及時有效的干預,通過微博私信及時推送各地區(qū)的自殺干預熱線,提供心理健康的一般常識及情緒調(diào)節(jié)策略。另外,通過志愿者為那些有自殺意念的微博用戶提供免費的心理危機干預及轉(zhuǎn)介服務。研究結(jié)果表明,通過與志愿者的交流,有自殺意念的微博用戶情況得到好轉(zhuǎn)。
這種自動識別并主動預防社交媒體用戶,特別是年輕人的自殺干預方法,在世界范圍內(nèi)是一種全新的嘗試。結(jié)果表明,該方法可用于識別有自殺風險的人群并提供危機管理。高危人群的識別是自動且及時的,干預不僅是主動的,而且效率高且接受度好,是對現(xiàn)有預防自殺方法的有效補充。促進主動自殺危機管理可以提高公眾對自殺想法尋求幫助的認識,從而改善公共衛(wèi)生。該模式還可以緩解像中國這樣的大型發(fā)展中國家心理服務薄弱、現(xiàn)有自殺預防系統(tǒng)不完善、人口龐大等問題的困境。
03、青島大蝦事件分析
心理預測模型不僅可以適用于人格、心理健康等方面的研究,同樣可以適用于社會心理心態(tài)的預測。我們利用心理預測模型對2015年10月的一個熱點事件——青島大蝦宰客事件(原本 38 元一份的海捕大蝦,結(jié)賬時變成38元一只)進行了分析。
通過新浪微博API (application programming interface,應用程序編程接口)獲取了全國100萬活躍微博用戶在該熱點事件期間發(fā)布的微博,并采用topic model 文本挖掘技術(shù)對相關文本進行了分析。結(jié)果表明,事件爆發(fā)后2天,網(wǎng)友主要是對該事件本身進行討論,從第3天開始,網(wǎng)友開始將事件發(fā)散,關注點已經(jīng)不在青島大蝦這一事件本身,而是以“段子”的形式討論不同地區(qū)旅游景點宰客的普遍現(xiàn)象,通過講述自己的親身經(jīng)歷或聽說的類似事件,表達對景點宰客這一現(xiàn)象的不滿。同時,結(jié)果表明,網(wǎng)友們對官方發(fā)布和回應的內(nèi)容都高度關注,每次都會引發(fā)熱議。同時利用心理預測模型,計算了參與青島大蝦事件的用戶的社會態(tài)度,其中包括生活滿意度、收入滿意度、社會地位滿意度、憤怒情緒、國家政府滿意度、地方政府信心、國家經(jīng)濟滿意度、地方經(jīng)濟滿意度等多個維度。結(jié)果表明,與沒有參與該話題討論的微博用戶相比,該事件當中的積極傳播者大多收入較高,有一定的社會地位,個人生活滿意較高同時憤怒情緒也較少;但他們也認為社會發(fā)展中還存在一定問題,當前政府的管理工作還有待提高。
通過利用心理預測模型分析此類事件,不僅可以及時獲取事件發(fā)生變化趨勢,了解事件背后大眾的心理變化和態(tài)度取向,更可以為國家相關機構(gòu)進行輿情監(jiān)控提供先行指數(shù)(antecedent index),提高相關部門應對危機事件的能力。
04、造福社會與隱私保護的均衡
技術(shù)往往都具有兩面性,大數(shù)據(jù)也不例外。一方面,大數(shù)據(jù)的應用不僅拓展了人類的認知范圍,提高了科學家們的研究能力,更為諸如抑郁干預、自殺預防、社會熱點事件分析等問題提供了新的解決方案;另一方面,隨之而來的隱私保護問題也不容小覷。Facebook 公司最近兩年頻頻卷入非法使用用戶數(shù)據(jù)的丑聞當中,尤其在2018年3月份,還卷入了普朗特選舉的政治風波中。人們在享受互聯(lián)網(wǎng)以及大數(shù)據(jù)代表的便利之余,也會擔心在這個網(wǎng)絡時代,自己是否還有隱私可言。因噎廢食是絕對不可取的,如何在勢不可擋的大數(shù)據(jù)時代利用好這項技術(shù),是學術(shù)界不可忽視的一項重要議題。
目前,學術(shù)界關于大數(shù)據(jù)的使用一般有這樣的共識:應當遵守人類被試研究的一般倫理原則,在使用需要用戶授權(quán)的數(shù)據(jù)前,必須征得用戶的知情同意,并嚴格按照經(jīng)由倫理委員會審核批準的程序進行,尤其不能將研究數(shù)據(jù)用于倫理委員會批準范圍之外的目的(如轉(zhuǎn)賣給第三方)。在使用那些開放的無需用戶授權(quán)的網(wǎng)絡數(shù)據(jù),在用于科研時也應同時滿足以下標準:(1)用戶對數(shù)據(jù)公開是知情的;(2)數(shù)據(jù)收集后應匿名處理;(3)在公開發(fā)表物中不得出現(xiàn)能夠識別用戶個人身份的信息。
在將大數(shù)據(jù)應用于心理學研究的過程中,我們嚴格遵循一般共識:在獲取用戶個體數(shù)據(jù)之前,首先會征得用戶的知情同意,明確告知用戶實驗設計以及以后的數(shù)據(jù)用途;在數(shù)據(jù)處理過程中,也采用了匿名處理的方式,一方面采用多次加密的方式保護用戶原始數(shù)據(jù)的隱私性,另一方面也最大程度地做好數(shù)據(jù)的保存與管理,防止數(shù)據(jù)外泄;在數(shù)據(jù)發(fā)表過程中,杜絕使用任何可識別出用戶身份信息的內(nèi)容。除了以上策略外,我們還專門對典型用戶進行了訪談,直接詢問他們對隱私以及對實驗的看法,之后的實驗設計提供了理論指導和實證證據(jù)。
合理合規(guī)地使用大數(shù)據(jù)和人工智能技術(shù),是造福社會和保護隱私的重要底線。在看到這種結(jié)合對心理學的潛在促進作用的同時,也應該特別關注其帶來的隱私方面的潛在危害,通過立法等手段做到防患于未然。
05、結(jié)論
利用人工智能大數(shù)據(jù)技術(shù),能夠幫助我們以更生態(tài)化的方式對個體與群體的心理行為規(guī)律進行研究。利用行為大數(shù)據(jù)研究人們的認知、情感和行為規(guī)律,結(jié)合人工智能建立基于社會實時感知數(shù)據(jù)的心理預測模型,形成個體心理、行為特征預測和群體心理、行為分析及決策支持的關聯(lián)架構(gòu)。生態(tài)化識別(ecological recognition)的提出,為心理學家提供了新的研究工具和視角。為網(wǎng)絡時代下理解人格、幸福感、自殺干預乃至社會熱點事件的分析都提供了全新的可能。通過深入不同環(huán)境下的個體與群體的行為與心理,能夠幫助實現(xiàn)人們的心理健康或社會態(tài)度等進行大規(guī)模、實時性的描述、預測、解釋和控制,從而有效防范風險。
隨著計算機軟硬件的不斷迭代更新,未來大數(shù)據(jù)在心理學中的應用一定會更加深入,如可穿戴設備和體感設備的應用。人工智能除了在心理實驗方面有著無法取代的潛力,在其他方面也會大大拓展心理學的研究領域。隨著智能終端的不斷發(fā)展,移動數(shù)據(jù)的不斷提速,人工智能不僅可以提供心理干預的平臺,更有可能成為心理干預的主力??茖W的研究方法將心理學從哲學中分離開來,而人工智能和大數(shù)據(jù)則可能將心理學更深刻地帶入生活。在充分享受使用新技術(shù)帶來的便利的同時,也要保證大數(shù)據(jù)的合規(guī)使用,才能避免再次發(fā)生Facebook的丑聞事件,才能保證取之于眾的大數(shù)據(jù)最終成為為大眾服務的利器而不是威脅。(責任編輯 徐麗嬌)
參考文獻(略)
文本作者:劉興云,劉曉倩,向媛媛,朱廷劭
作者簡介:劉興云,中國科學院心理研究所,中國科學院大學心理系,博士研究生,研究方向為網(wǎng)絡心理;朱廷劭(通信作者),中國科學院心理研究所,研究員,研究方向為大數(shù)據(jù)心理及計算機應用
注:本文發(fā)表于《科技導報》2019年第21期,原標題為《人工智能大數(shù)據(jù)之于心理學》,敬請關注。