99re在线视频观看|日韩 欧美 国产 亚洲 制服|男人的天堂视频网站清风阁|亚洲经典激情春色另类|五月天精品视频

計算傳播學的起源、概念和應用

2017-01-18 14:59:35
admin
轉貼
摘要:計算傳播是指數據驅動的、借助于可計算方法所進行的傳播過程,而分析計算傳播現象的研究領域就是計算傳播學。本文首先分析了計算傳播的起源、概念和應用,然 后從計算社會科學的角度對計算傳播學的理論脈絡進行了介紹?;谝陨蟽热?,本文介紹了一個計算傳播學研究的例子——“新聞地圖”研究項目。新聞地圖采用 Gdelt新聞數據,以可視化的方式呈現了新聞事件的時空分布,并對新聞人物排名提供了一種可計算的思路,研究發現新聞影響力具有一個放大的機制,這種機 制是通過新聞引用來實現的。最后討論了計算傳播學研究中存在的從數據到模式,再從模式到機制的研究思路。
1引言:計算傳播

計算傳播是指數據驅動的、借助于可計算方法所進行的傳播過程,而分析計算傳播現象的研究領域就是計算傳播學(王成軍, 2015)。計算傳播的應用有很多,例如數據新聞、計算廣告、媒體推薦系統等,在過去的幾年里,產生了深遠的影響。數據新聞風靡全球,重要的國際媒體和國內媒體紛紛采用數據新聞,以開放數據、數據挖掘、可視化的方式提供信息;計算廣告備受矚目,不管是門戶網站、搜索引擎,還是社交媒體,紛紛將計算廣告當做數據變現的重要渠道,以可計算的方法對廣告進行拍賣,實現媒體、內容和用戶三方的匹配;媒體推薦系統成為個性化信息獲取的重要途徑,既包括傳統的社交新聞網站,也包括今日頭條這種后起之秀,它們紛紛采用協同過濾的方法為用戶提供信息,建立了新的信息把關模式。

計算傳播作為一種具有重要現實影響的傳播行為,它的起源相對較早。例如,網飛公司在九十年代初以郵寄電影光盤作為商業模式,從傳播的角度而言,這種商業模式使得用戶可以更加自由地選擇和觀看視頻內容,因而具有變革傳統媒介消費行為的潛力。對于這個時期的網飛公司而言,很重要的一個問題就是郵寄時間的長短與用戶的持續使用行為之間的關系。如果用戶對于郵寄時間并不敏感,那么就可以將倉庫建在地價低廉的郊區;如果用戶對于郵寄時間非常敏感,那么網飛就需要在可承擔的范圍內將倉庫建在距離市區近的地方。而調整倉庫的地理位置的決定必須通過計算真實的用戶數據才能決定。網飛僅僅是計算傳播的一個例子。從更廣義的視角來看,搜索引擎的基本社會功能也是計算傳播。例如,谷歌的最根本的技術在于其pagerank算法,而這個算法的基本優化目標在于評估每一個網頁內容的傳播價值,而完成這一目標根本方法就在于計算。反過來經過計算的所得到的搜索結果質量更高,傳播效果更好。

驅動計算傳播的數據主要來自于人類使用數字媒體時記錄下來的數字痕跡。數字媒體使得用戶行為可以被詳細記載,因而大量地累積了各種用戶屬性數據和行為數據。例如,當我們通過有線電視觀看電視節目的時候、通過手機打電話的時候、通過互聯網在網上沖浪的時候、查看微信朋友圈的時候,我們的行為都被電子媒體詳細記錄下來。數字化的信息不斷地改變著傳統的傳播格局。有線電視服務提供商通過機頂盒獲取的用戶觀看電視的行為對電視節目進行評價,計算不同電視頻道在不同時間段的收視率。用戶通過網飛網站訂觀看電影和電視節目的過程中,網飛記錄了所有用戶的詳細數據,除了基本的用戶信息、電視劇和電影信息,還包括用戶的各種行為數據,例如對視頻的訂閱、觀看、評價、搜索、收藏等。

可計算的方法使得沉睡的數據寶藏開始覺醒。隨著計算技術的發展,人類計算能力不斷提高,可以分析和挖掘的數據規模不斷擴大。統計、機器學習、自然語言處理等數據挖掘技術更廣泛地應用到計算傳播的過程當中。仍然以網飛為例,基于所積累的豐富數據,網飛建立了高效的推薦系統。為了更有效地提高其推薦系統的推薦效果,網飛舉辦了兩次轟動全球的百萬大獎比賽。來自全世界160多個國家的參賽者采用機器學習的方法對網飛的用戶數據進行分析,經過三年時間成功地解決了一個巨大挑戰:為已有評級的網飛用戶預測其對新影片的喜好。計算技術的提高有時候需要深入到模型的高度。例如,谷歌放棄了將一個個網頁看作是孤島的思維方式,轉而將這些網頁看做網絡當中的節點,節點之間由超鏈接連接起來。pagerank算法其實質是一個嶄新的網絡模型。搜索引擎將全世界的網頁構成的龐大網絡作為數據。毫無疑問這種數據規模是非常大的,對這些數據進行計算所需要的計算量也是非常大的。但是與數據量和計算量相比,谷歌的例子告訴我們建立一個高效的模型更加重要。

計算傳播作為一個嶄新的研究領域,需要研究者投入更多的注意力。分析計算傳播應用、從傳播學的角度研究計算傳播的實際問題具有不可忽略的意義,反過來講,分析和總結計算傳播學的研究方式,對于傳播學自身的發展而言也具有重要意義。本文以上內容對于計算傳播的概念、特點和應用進行了簡單介紹,在以下內容當中,我們將首先從研究脈絡的角度梳理計算傳播的起源,然后從一個計算傳播的實際項目“新聞地圖”出發,進一步介紹計算傳播以及計算傳播學的研究方法和意義。


2作為計算社會科學的計算傳播學

雖然計算傳播應用早已存在,但是作為一個概念,計算傳播和計算傳播學的提出主要源于計算社會科學的發展。直到計算社會科學成為研究熱點之后,計算傳播作為一個概念才正式被提出。2009年,社會科學研究者David Lazer、Alex Pentland、Sinan Aral、Nicholas Christakis、Noshir Contractor、James Fowler、Myron Gutmann、Devon Brewer等人與作為計算機科學家的Lada Adamic以及作為網絡科學研究者的Albert Barabasi在《科學》雜志上發表了一篇題為“計算社會科學”的論文,開啟了計算社會科學的研究熱。Lazer等人指出隨著用于研究的數據不斷增多以及人類的計算能力不斷增強,采用計算作為研究手段的社會科學已經形成,尤其需要強調的是這個研究領域的一個主要特點是采用網絡科學的研究方法分析社會科學的研究問題。

無獨有偶,在Lazer等人2009年發表這篇文章之前,網絡科學的另外一個主要研究者Duncan Watts于2007年就在《自然》雜志上發表題為“二十一世紀的科學”一文(Watts, 2007)。Watts認為社會科學是二十一世紀最重要的科學。我們現代社會所面臨的絕大多數問題是社會科學問題。社會科學研究者之所以沒有發展出類似物理學和生命科學一樣完善的理論框架是因為社會科學研究是最難的。社會現象卷入了海量的異質性的個體的相互互動,以致于變得非常復雜。幸運的是網絡科學的研究開啟了一個新的研究方向,但是網絡科學需要大量的實證數據,而基于互聯網的傳播恰好提供了新的兩種新的研究方式:一是各種各樣的“數字足跡”(網絡聊天、發博客、發微博、加標簽、發郵件等),另外一個是互聯網實驗。基于以上理由,Watts提出“如果處理得當,基于互聯網傳播產生的數據和互動性將會變革我們對于人類集體行為的認識”(Watts, 2007)。

根據對于計算社會科學一詞的引文網絡分析,研究者發現計算社會科學方興未艾、處于指數增長的階段。自從Lazer等人2009年發表其重要論文之后,計算社會科學類的論文數量和應用數量不斷增長,且大多數論文發表在《科學》、《自然》等綜合性期刊以及各個學科最好的期刊上。從引文網絡的結構而言,計算社會科學研究已經形成了一個緊密的研究領域。一直以來,計算方法同社會科學的結合是通過計算機模擬(多主體建模)進行的,網絡科學出現之后,因其與真實的人類行為數據的緊密結合而成為更為重要的研究范式。社會系統如同生物系統、金融系統等一樣是一個復雜系統,社會現象充滿了復雜性,因而需要采用復雜性科學的研究視角進行分析。正因為人們總是生活在各種網絡當中,而且網絡恰好為各種復雜的社會現象的結構提供了一個數學表達,因而采用網絡科學的視角對于分析社會現象具有重要意義,也是基于這個原因,計算社會科學現階段最主要的研究主要是基于網絡科學展開的。

社會科學家開始大量地使用社會網絡數據進行科學研究,例如Bollen等人采用推特的數據進行情感分析,發現“冷靜”這一種情緒可以較好地預測股票的漲落。Ginsberg等人采用谷歌的搜索數據分析了人們檢索與流感相關的詞語的時間序列,通過機器學習的方式預測人類大規模流感的爆發,可以使人們提前兩周預知流感的爆發。

Eagle等人采用英國的手機數據構建的傳播網絡,研究發現城市節點在傳播網絡的多樣性與城市社會經濟發展指數之間具有非常好的正相關的函數關系,由此可能證明傳播行為對于經濟發展的重要性。Bond等人使用Facebook作為網絡實驗平臺研究美國大選,liu’bai’wan六百多萬人參與了實驗,結果證明社交網路傳遞的信息的影響力遠大于信息的直接傳播,強關系對于人類社會網絡里的行為傳播具有重要意義。 當人類傳播行為的數據構成了計算社會科學的重要基礎的時候,深入認識計算傳播學的時機終于到來。祝建華等人總結了計算社會科學在傳播學的各種應用,沈浩等分析了復雜網絡和社會計算對于傳播學研究的意義,王成軍(2015)系統回顧了計算社會科學發展,并給出了計算傳播學的定義:“計算傳播學是計算社會科學的重要分支。它主要關注人類傳播行為的可計算性基礎,以傳播網絡分析、傳播文本挖掘、數據科學等為主要分析工具(以非介入的方式)大規模地收集并分析人類傳播行為數據,挖掘人類傳播行為背后的模式和法則,分析模式背后的生成機制與基本原理,可以被廣泛地應用于數據新聞和計算廣告等場景”。在此基礎上2015年,第一本計算傳播學相關的圖書《社交網絡上的計算傳播學》出版。


3新聞地圖

新聞是傳播學研究的一個重點,也是記錄人類行為的重要方式。在本部分,本文試圖給出一個計算傳播學研究的實例—“新聞地圖”。新聞地圖研究所使用的數據主要來源于Gdelt新聞數據庫。Gdelt是由谷歌資助的一個新聞數據項目,它監測全球100多種語言的廣播新聞、報紙新聞和網絡新聞,從中提取其中的地點、組織、人物、時間,并將所有這些數據開放。目前開放的數據主要分為事件數據庫和全球知識圖譜數據庫兩類,使得新聞變成研究各種人類社會的重要資源。新聞地圖是一個以可視化的方式反映中國新聞在時間與空間分布的差異性的網頁應用,利用Gdelt已有歷史數據作為數據源,通過多樣化的統計圖表對中國新聞進行展示。


我們知道新聞的生產本身就具有很強的空間異質性。有些地方雖然空間面積很小,但是新聞就很多,例如國家的首都;有些地方雖然面積很大,但是新聞卻相對較少。采用可視化的方式展現這種空間差異性可以給人們帶來更多啟發。為此,我們采用扭曲地圖的形式展現,如下圖1展示了2015年中國各省市的新聞事件數量。在在這個扭曲地圖里面積大小表示新聞事件的數量,我們可以很明顯地觀察到北京、上海、香港三個大都市生產了大量的新聞事件,而山東、河北等省份的新聞事件則相對較少,更多年份的扭曲地圖見。


除了采用空間的描述之外,我們還可以從時間的角度看世界新聞對于中國的報道。圖2展現了中國和香港的新聞事件數量隨時間變化。為了便于可視化,本文將中國的新聞時間總數量除以十。世界新聞對中國的報道從1979年中美建交時最高,之后逐漸下降并保持了相對的平穩,其間在1997年之后略有增加。與之相比,關于香港的新聞事件則處于首先逐漸增加,到1997年香港回歸時迅速增加達到頂峰,之后又逐漸下降的過程,其間2013年和2014年因為“占領中環”而產生了兩次“爆發”。



圖2. 中國和香港的新聞事件數量隨時間變化(每月)


Gdelt全球知識圖譜數據是基于對新聞內容的挖掘提供了所提供的關系數據。例如識別出新聞事件的所有人名、地名等。這樣我們就可以得到兩個人名在一個新聞里同時出現的數據?;谶@種數據可以構建節點是人名,鏈接是兩個人名在新聞里一起出現的次數的網絡。圖3展現了2015年全球新聞人物網絡的一部分數據(王成軍, 2016)。在圖3當中,本文使用節點的pagerank數值來表示節點的大小,我們很明顯地發現美國總統奧巴馬是2015年全球新聞人物的第一名(0.039),其他前十名人物分別是美國國務卿John Kerry(0.0072)、俄羅斯總統Vladimir Putin (0.0056)、法國總統Francois Hollande(0.0052)、天主教第266任教皇Pope Francis(0.0051)、德國總理Angela Merkel(0.0037)、以色列總理Benjamin Netanyahu(0.0036)、美眾議院議長John Boehner(0.0035)、美國槍擊案受害者或NBA教練Michael Brown(0.0034)、美國南卡羅來納州印度裔州長Nikki Haley(0.0033)。


圖3. 2015年全球新聞人物網絡

研究者總是試圖定量地分析新聞影響力。為此,本文分析了中國各省份從1979年到2015年的新聞影響力,具體包括各個省份的新聞數量、新聞被引用數量以及新聞時間的戈德斯坦得分(Goldstein scale)。戈德斯坦得分為每個事件分配一個在-10到+10之間的數值,用以衡量理論上該事件對國家產生的潛在影響。分析結果如圖4所示(雙對數坐標系)。顯然,新聞數量和戈德斯坦得分之間存在完美的線性關系,這表明當我們從一個地區的角度分析新聞影響力的時候,戈德斯坦得分并未給我們更多洞見。這或許是因為戈德斯坦得分是基于事件類型而非事件的細節,因此一個10人參與的暴亂與一個1000人參與的暴亂都將獲得同樣的分數。更為重要的是,不管是新聞數量還是戈德斯坦得分與新聞被引用次數之間都存在超線性的冪律關系,冪指數是1.11,這表明了新聞影響力具有一個放大的機制,這種機制是通過新聞引用來實現的。



圖4. 三種新聞影響力之間的關系(雙對數坐標系)


4結論和討論

綜上,本文對計算傳播學的概念、理論脈絡、實際應用進行

發表評論
評論通過審核后顯示。
移動訪問