大數(shù)據(jù)文摘出品
來源:medium、eurekalert
編譯:千雪、張秋玥、夏雅薇
“演講就是力量:演講是說服,是皈依,是強迫?!薄瓲柗颉の譅柖唷勰?。
在美國2020年總統(tǒng)大選結(jié)果揭曉之際,想必拜登和特朗普都已經(jīng)起草好了自己的那份總統(tǒng)就職演講,希望以勝利者的姿態(tài)對全世界發(fā)表感言。
其實自美國誕生以來,總統(tǒng)的演講既是對國家現(xiàn)狀的反映,也是對總統(tǒng)認(rèn)為國家應(yīng)該走向何方所需變革的呼吁。
從1789年喬治·華盛頓的第一次就職演講,到1977年吉米·卡特關(guān)于全國能源問題的演說,再到2019年唐納德·特朗普的國情咨文,迄今為止(2020年)每一位總統(tǒng)都有自己獨特的演講風(fēng)格。文摘菌也想看看,運用自然語言處理和主題建模,能否分析出美國總統(tǒng)歷史中演講詞匯所傳達(dá)的信息、情感和復(fù)雜性。
通過使用數(shù)據(jù)科學(xué)技術(shù)進(jìn)行自然語言處理和無監(jiān)督學(xué)習(xí),本文作者研究了990多篇總統(tǒng)演講表達(dá)的情感、演講內(nèi)容的復(fù)雜程度和關(guān)注重點,以便更好地了解總統(tǒng)們對演講能力的運用。然后根據(jù)時間線和不同政黨的區(qū)分,試圖找出他們的演講趨勢、模式,還有其他見解。本項目將對美國歷史上所有總統(tǒng)的演講進(jìn)行分析。
以下是一些值得一看的結(jié)論:
美國總統(tǒng)們的情緒:特朗普語氣更積極更快樂,內(nèi)容上則更固執(zhí)己見使用的工具:TextBlob的情緒性和主觀性。
語言情緒的測量方式有兩種:情緒性(從消極/悲傷的語氣轉(zhuǎn)變?yōu)楦e極/快樂的語氣)和主觀性(從表達(dá)客觀事實轉(zhuǎn)變?yōu)檩敵龈鄠€人觀點)。
下面是情緒分析的結(jié)果,每個點代表一個不同的總統(tǒng),每種顏色代表一個政黨。
正如你在圖表中所看到的,沒有明顯的顏色簇,這意味著總統(tǒng)們的情緒不會因為黨派不同而出現(xiàn)區(qū)分,在其中影響更多的似乎是個人的情緒轉(zhuǎn)變。
分開來,我們來看看共和黨總統(tǒng)們的情緒。
圖中你可以看到總統(tǒng)的名字。
從這些圖表中我們可以看到,與其他美國總統(tǒng)相比,富蘭克林·皮爾斯的語氣更消極更悲傷,內(nèi)容上則更真實,這一方面與他個人性格有關(guān),另一方面也與當(dāng)時的時代大背景相關(guān);而唐納德·特朗普的語氣更積極更快樂,內(nèi)容上則更固執(zhí)己見。
請記住,情緒性和主觀性并不能告訴我們總統(tǒng)在說什么;一個總統(tǒng)可以說一些積極的話,但這些話對人們產(chǎn)生的影響可能是負(fù)面的。這種情緒分析只能告訴我們,某位總統(tǒng)是如何傳達(dá)他想表達(dá)的內(nèi)容的,以及他們是使用客觀事實還是使用個人觀點來支持他們的聲明。
哪些美國總統(tǒng)的演講最老練?演講用詞趨向簡單化,情感表達(dá)更強烈使用的工具:textstat的等級分析。
“語言的復(fù)雜程度”是基于一個人要讀懂一篇文章所需要的學(xué)歷層次衡量標(biāo)準(zhǔn)——這里的標(biāo)準(zhǔn)是聽到一篇演講時,可以完全理解它的平均學(xué)歷層次。
下圖顯示了多年以來,每一篇演講都被評為了什么層次。我們?nèi)匀挥貌煌念伾珌泶碚h。
從圖中我們可以看出,在美國早期,總統(tǒng)的演講技巧更為高明。
平均而言,需要大學(xué)水平或更高學(xué)歷的人才能理解。到了20世紀(jì)20年代左右,演講的復(fù)雜程度開始下降,這種趨勢一直延續(xù)到今天。這樣做的一個潛在原因可能是受總統(tǒng)自己詞匯量的影響,也可能是一個經(jīng)過深思熟慮的決定;20世紀(jì)20年代,收音機在普通家庭中逐漸普及,越來越多的人可以聽到總統(tǒng)演講。
那么,總統(tǒng)們是否主動改變了他們的詞匯,使他們能夠與更廣泛的聽眾有所共鳴?這一分析并不能明確地告訴我們答案,但這絕對是一個值得探索的有趣領(lǐng)域。
還要注意的是,各個級別的政黨層次不齊,這表明各政黨在演講技巧方面沒有明顯差別。
已有其他研究驗證了這一觀點:當(dāng)今美國政壇演講用詞趨向簡單化,情感表達(dá)更強烈。
堪薩斯州立大學(xué)校內(nèi)一個計算機科學(xué)研究團隊分析了1873年至2010年共和黨與民主黨議員的近200萬次國會演講的內(nèi)容。他們的分析表明,當(dāng)今政治演講的風(fēng)格實際上與幾十年前的國會政治演講風(fēng)格已經(jīng)截然不同。
在最近發(fā)表在Heliyon期刊上的研究論文“138年來國會演講的數(shù)據(jù)分析”中,堪州計算機科學(xué)專業(yè)的學(xué)生Ethan Tucker和Colton Capps以及計算機科學(xué)副教授Lior Shamir使用自動文本分析算法來分析各個年份的國會演講。
研究表明,自1980年代初以來,與女性身份有關(guān)的單詞(例如she,her,hers,woman,women等等)的出現(xiàn)頻率一直在增加,而與男性相關(guān)的單詞出現(xiàn)頻率則在下降。與1950年代相比,與21世紀(jì)女性身份相關(guān)的單詞出現(xiàn)頻率高出五倍,但仍低于與男性身份相關(guān)的單詞出現(xiàn)頻率。自1990年代以來,與共和黨議員的演講相比,民主黨議員的演講中有關(guān)女性身份的用語出現(xiàn)得更為頻繁。
研究還表明,這些年來的閱讀難度水平也發(fā)生了顯著變化。該分析測量了Coleman-Liau可讀性指數(shù),該指數(shù)可估計特定文本的閱讀難度水平并將其與教育水平相關(guān)聯(lián)。分析表明,共和黨和民主黨議員的國會演講的閱讀難度從18世紀(jì)的八年級水平一直提高到1970年代的十年級。但是自1976年以來,政治演講的閱讀水平一直在下降,到21世紀(jì),它已經(jīng)低于九年級水平。直到1970年代初,國會議員在演講中所使用的詞匯也存在同樣的趨勢。那之后的閱讀難度至今依然在下降。
研究人員對演講的分析還顯示,與18世紀(jì)和19世紀(jì)初國會演講相比,最近的國會演講表達(dá)了更強烈的情緒,無論是積極還是消極情緒。政治演講中的情緒逐漸變得更加積極,并在1960年代達(dá)到頂峰,但在1970年代間突然變得非常消極。而自1970年代以來,在國會演講中表達(dá)的情緒又重新變得越來越積極。
根據(jù)這項研究,演講的閱讀水平和詞匯量的下降可能與1970年代開始在國會在大眾傳媒中的曝光率增加(包括現(xiàn)場廣播和電視報道)有關(guān)。國會議員開始逐漸調(diào)整他們的演講風(fēng)格,通過媒體向公眾講話,而不是與其他立法者講話。
美國總統(tǒng)演講的主題:從法律、公權(quán)力到就業(yè)家庭使用的工具:使用gensim的LDA模型進(jìn)行無監(jiān)督主題建模。
現(xiàn)在讓我們來試著更好地理解總統(tǒng)演講的內(nèi)容。
使用潛在Dirichlet分配(LDA)主題建模,確定了7個總統(tǒng)演講的主題:
1.美國就業(yè)和家庭的幫助&需求
2.法律、憲法和權(quán)利
3.法律、條約和行動
4.公共權(quán)力&職責(zé)
5.美國自由之戰(zhàn)
6.工作&商業(yè)
7.用戰(zhàn)爭&武力實現(xiàn)世界和平
在這些主題之間需要注意的是詞語的定位和平衡,比如“美國自由之戰(zhàn)”和“用戰(zhàn)爭&武力實現(xiàn)世界和平”,其中一個目標(biāo)與其他目標(biāo)相互緩沖,比如“發(fā)動戰(zhàn)爭可以獲得美國自由”,或者“尋求世界和平,但也會有戰(zhàn)爭發(fā)生”。
以下是這七個話題多年來在總統(tǒng)演講中的流行趨勢:
我們再次看到,在演講的主題上,政黨之間并沒有太多的區(qū)別,相反,隨著時間線的推移,反而出現(xiàn)了越來越大的差異。在美國發(fā)展的早期,我們看到“法律、條約和行動”與“公共權(quán)力&職責(zé)”更加普遍。最近幾年,我們看到“美國就業(yè)和家庭的幫助&需求”,“用戰(zhàn)爭&武力實現(xiàn)世界和平”,“美國自由之戰(zhàn)”更受總統(tǒng)歡迎。
讓我們用另一種角度來審視這些話題,即根據(jù)美國不同的歷史時期,看一個話題在美國歷史上的哪個時期出現(xiàn)過。顏色代表每個政治演講題目:
從這張圖中我們可以看出,某些歷史時期似乎是總統(tǒng)演講主題結(jié)束或到來的時期。例如,在新政時期,我們第一次看到“美國就業(yè)和家庭”上升為總統(tǒng)演講的主要話題,此后幾乎每個時代我們都會看到它的出現(xiàn)。
綜述綜上所述,這個項目的分析告訴我們:
情緒似乎因總統(tǒng)而異,而非政黨。 在演講中使用復(fù)雜詞匯這一潮流已經(jīng)過時多年。 演講主題多年來變化較大,但各個政黨之間的主題差別不大。 演講主題與國家狀況和公眾關(guān)注的方面有關(guān)。歷史事件可能會成為一種催化劑,促使幾代人的演講主題發(fā)生轉(zhuǎn)變。
最后,我想再次強調(diào),這一分析顯示了一些總統(tǒng)演講的趨勢和模式,但同樣重要的是,它向我們表明,從表面上看,總統(tǒng)之間、政黨之間的講話基調(diào)和定位都可能存在相似之處。有鑒于此,我們更需要關(guān)注總統(tǒng)演講的深層實質(zhì)內(nèi)容,為總統(tǒng)進(jìn)行知情投票和知情支持。
相關(guān)報道:
https://www.eurekalert.org/pub_releases/2020-08/ksu-ast081820.php
https://towardsdatascience.com/us-presidential-voices-over-the-ages-35678518f82b
責(zé)任編輯: