99re在线视频观看|日韩 欧美 国产 亚洲 制服|男人的天堂视频网站清风阁|亚洲经典激情春色另类|五月天精品视频

大數(shù)據(jù)觀世| 第3期 孟天廣 : 大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)搜索行為與公共關(guān)注度

2020-05-08 09:42:00
孟天廣
原創(chuàng)

孟天廣教授

摘要

大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)數(shù)字痕跡成為彰顯公眾議題關(guān)注及政策偏好的新途徑。本文以網(wǎng)絡(luò)搜索行為為例,基于百度搜索數(shù)據(jù)采集了2011-2017年26個(gè)政策議題的 2 億余條關(guān)鍵詞指數(shù),探索研究公眾的搜索行為與公共(政策) 關(guān)注度。這七年間,公眾對文化娛樂議題的關(guān)注度最高,財(cái)政金融、就業(yè)、交通等財(cái)經(jīng)和基礎(chǔ)設(shè)施類議題次之,再次為教育、環(huán)保、衛(wèi)生等民生類議題。同類議題關(guān)注度在省級層面具有歷年趨同性,而不同議題的關(guān)注度存在地域差異性。面板數(shù)據(jù)分析發(fā)現(xiàn),人口規(guī)模、消費(fèi)物價(jià)指數(shù)、網(wǎng)民占比、失業(yè)率和經(jīng)濟(jì)發(fā)展水平等經(jīng)濟(jì)社會因素可以有效地解釋議題顯著度的差異,即公眾對特定政策的關(guān)注度受到地區(qū)經(jīng)濟(jì)社會條件的顯著影響。


大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)搜索行為與公共關(guān)注度——基于2011-2017年百度指數(shù)的動態(tài)分析

孟天廣 | 清華大學(xué)政治學(xué)系副教授,數(shù)據(jù)治理研究中心主任

趙娟 | 清華大學(xué)政治學(xué)系博士后

原載 |《學(xué)海》2019年第3期

未經(jīng)說明,文中圖片均來自網(wǎng)絡(luò)


引言


一個(gè)多世紀(jì)以來,政治學(xué)家們一直致力于探究國家與社會互動以理解政治制度的作用,而在這種互動中最基礎(chǔ)因素便是公共關(guān)注度(public attentiveness)(Ripberger,2011)。公共關(guān)注度呈現(xiàn)政治過程中的公眾的政策偏好和注意力分配,在政策過程中發(fā)揮重要作用。傳統(tǒng)研究通過抽樣調(diào)查來了解政策議題的關(guān)注度,并通過追蹤數(shù)據(jù)來獲取公眾在特定時(shí)間內(nèi)政策偏好的變化及其對政府回應(yīng)性的影響。隨著學(xué)界對調(diào)查方法信效度之局限的進(jìn)一步認(rèn)知(Mellon,2013),一批學(xué)者開始尋求將各類媒體作為測量公共關(guān)注度的有效途徑,考察特定權(quán)威媒體或流行媒體在某時(shí)間段內(nèi)對特定議題的關(guān)注和討論。
然而,媒體關(guān)注是否能真正代表公共關(guān)注度這一疑問隨后被提出,并在議程設(shè)置理論(agenda- settingtheory)中獲得廣泛探討。麥庫姆斯認(rèn)為記者群體可能通過其對感知到的公共利益有所回應(yīng)而推進(jìn)了公共議程,進(jìn)而影響到媒體議程(Mc-Combs,2004)。蘇梅克和里斯(Shoemaker&Reese,2014)進(jìn)一步以五維概念模型(記者個(gè)人、媒體例程、組織因素、社會制度和文化/意識形態(tài))來解釋媒體議程形成的影響因素。在上述探討媒體關(guān)注、議程設(shè)置轉(zhuǎn)換(reverseagenda-set-ting)的諸多研究中,學(xué)者們遺漏了媒體關(guān)注對政策偏好之主體———“公眾”考量的不足。因而,公共關(guān)注度的界定及操作化再次成為學(xué)者在研究國家社會關(guān)系、政府回應(yīng)性中的關(guān)鍵問題,而智慧治理客觀上要求政府利用大數(shù)據(jù)實(shí)時(shí)、動態(tài)和全面地測量多元化民意及其變化(孟天廣、趙娟,2018;Russelletal.,2014)。

互聯(lián)網(wǎng)與大數(shù)據(jù)等新興信息科技在重塑公眾生活和政府治理模式的同時(shí),使網(wǎng)絡(luò)數(shù)字足跡的采集和分析成為可能,由此,網(wǎng)絡(luò)空間的海量行為數(shù)據(jù)為有效測量公共關(guān)注度提供了可行路徑。本文提出了利用搜索行為數(shù)據(jù)對公共關(guān)注度進(jìn)行測量,試圖考察特定時(shí)空環(huán)境下政策關(guān)注度的地域分布和時(shí)間變化趨勢,并運(yùn)用2011-2017年省級面板數(shù)據(jù)探究公共關(guān)注度的宏觀影響因素,以因應(yīng)大數(shù)據(jù)時(shí)代對公共關(guān)注度加以測量與分析的需求,進(jìn)而提出新的研究方法與分析視角。


一、公共關(guān)注度:概念界定及操作化

(一)公共關(guān)注度


網(wǎng)絡(luò)行為數(shù)據(jù)不僅反映著公眾對某些議題是否關(guān)注及關(guān)注程度如何,而且反映著公眾對某些特定議題的意見。有學(xué)者對公眾關(guān)注與公眾意見進(jìn)行了區(qū)分,認(rèn)為公眾關(guān)注事關(guān)人們想什么,而公眾意見是關(guān)于人們怎么想,前者需要人們愿意為之付出諸如時(shí)間或注意力等稀缺資源(Newig,2004)。Ripberger利用網(wǎng)絡(luò)數(shù)據(jù)追蹤流感等疾病信息的擴(kuò)散分析,將網(wǎng)絡(luò)數(shù)據(jù)分為基于供給的( supply-based)和基于需求的(demand-based)兩類:基于供給的數(shù)據(jù)如臉書、網(wǎng)頁等社交媒體上發(fā)布的數(shù)據(jù),基于需求的數(shù)據(jù)則是人們主動在網(wǎng)絡(luò)上搜索的數(shù)據(jù)(Ripberger,2011)?;谛枨蟮闹鲃铀阉餍袨榉从沉巳藗儗δ承┲黝}的關(guān)注度,通過信息搜索和了解以滿足其需求。


運(yùn)用基于需求搜索數(shù)據(jù)對公共關(guān)注度進(jìn)行測量已逐步展開,主要體現(xiàn)在運(yùn)用網(wǎng)絡(luò)搜索來對熱議事件進(jìn)行整體認(rèn)知,以預(yù)測未來行為。如目前已有使用谷歌趨勢(GoogleTrends)、I4S以及Yahoo等搜索引擎所獲得的大數(shù)據(jù),在醫(yī)學(xué)、經(jīng)濟(jì)學(xué)、傳播學(xué)等領(lǐng)域進(jìn)行公共關(guān)注度的測量或?qū)ο嚓P(guān)事件進(jìn)行預(yù)測。譬如,在醫(yī)療領(lǐng)域,Ginsberg等人(2009)提出利用谷歌搜索數(shù)據(jù)開展流行病預(yù)測,Ripberge等人(2011)運(yùn)用與流行病學(xué)相關(guān)的谷歌詞匯搜索數(shù)據(jù)追蹤傳染病的擴(kuò)散。


在經(jīng)濟(jì)領(lǐng)域,有學(xué)者基于I4S搜索工具對諸如零售銷售、汽車銷售等經(jīng)濟(jì)活動或運(yùn)用與金融相關(guān)的98個(gè)谷歌搜索詞來對股市波動進(jìn)行預(yù)測( Preisetal,2013)。國內(nèi)學(xué)者也利用百度指數(shù)考察長三角、東北地區(qū)城市經(jīng)濟(jì)集群和城市網(wǎng)絡(luò)特征的創(chuàng)新性(熊麗芳等,2013;趙映慧等,2015)。

在傳播學(xué)領(lǐng)域,陳云松等(2015)使用谷歌圖書大數(shù)據(jù),測量中國城市國際知名度300年來的變遷及其特征,認(rèn)為近代大陸城市的國際傳播主要是通過媒體報(bào)道而進(jìn)入西方社會。曾凡斌( 2018)利用百度指數(shù)分析媒體議程顯要性與受眾議程顯要性之間的關(guān)系,他以2013-2016年間75 個(gè)網(wǎng)絡(luò)熱點(diǎn)輿情事件為例,發(fā)現(xiàn)二者顯要性的相關(guān)性受網(wǎng)絡(luò)熱點(diǎn)輿情事件屬性的限制:當(dāng)網(wǎng)絡(luò)熱點(diǎn)輿情事件屬于社會新聞事件或國外政治事件時(shí),媒體與受眾兩個(gè)輿論場顯著正相關(guān);而在社會類網(wǎng)絡(luò)熱點(diǎn)輿情事件中,媒體議程的顯要性與受眾議程的顯要性低度相關(guān)。這證明媒體議程所呈現(xiàn)的公眾關(guān)注與公眾實(shí)際關(guān)注之間具有一定差距。
因此,公眾對政策議題的關(guān)注及其測量,為大數(shù)據(jù)時(shí)代新興研究方法提供了機(jī)會與土壤。整體而言,目前國內(nèi)運(yùn)用大數(shù)據(jù)對公共關(guān)注度測量及解釋的探索研究尚較匱乏。本文正是在此基礎(chǔ)上,借助對網(wǎng)絡(luò)信息汲取行為影響甚廣的百度指數(shù)的時(shí)間序列大數(shù)據(jù)彌補(bǔ)這一研究空白。



(二)公共關(guān)注度的測量


公共關(guān)注度是基于個(gè)體對某公共議題的興趣,出于好奇而產(chǎn)生的搜索行為?;ヂ?lián)網(wǎng)搜索行為是在線大數(shù)據(jù)中較有代表的信息(劉濤雄等,2015),基于搜索行為而得的百度指數(shù),是公眾在某段時(shí)間內(nèi)對該議題主觀探索和注意力分配的體現(xiàn)。Pelc(2013)不僅利用搜索數(shù)據(jù)衡量了公眾的政策情緒,還從信息政治的角度探討了信息探求行為可以成為政治動員的重要機(jī)制來推動國際規(guī)則的變化。簡言之,如果我們認(rèn)為人們?nèi)绾我约昂螘r(shí)搜索公共議題信息準(zhǔn)確地反映了個(gè)體關(guān)注模式,那么匯聚這些行為以評估公共關(guān)注度就是合理和恰當(dāng)?shù)?Ripberger,2011)。
由此,通過搜索方式獲取信息,則是公眾對某一議題直接關(guān)注的主動行為,可以成為社會科學(xué)研究中映射人們經(jīng)濟(jì)和社會行為的重要方式(Scheitle,2011)。以百度搜索網(wǎng)民為對象的分析顯示,截至2017年12月,百度搜索的日均請求已達(dá)70億次(中國科協(xié),2017)。對網(wǎng)民搜索行為的挖掘和分析,可準(zhǔn)確了解規(guī)模龐大的網(wǎng)民的實(shí)時(shí)需求,為政府精準(zhǔn)決策提供依據(jù)。截至2017年12月,我國搜索引擎的用戶規(guī)模達(dá)6.40億,網(wǎng)民使用率83.8%(CNNIC,2018)。百度無疑在中國搜索引擎市場中占據(jù)絕對領(lǐng)先地位。截至2016年12月,百度的品牌滲透率已達(dá)82.9%,遠(yuǎn)遠(yuǎn)高于排名其后的搜狗和360搜索(CNNIC,2016)。百度在用戶搜索行為中的滲透使其成為分析公眾搜索行為的重要數(shù)據(jù)源。與此同時(shí),百度推出的百度指數(shù)服務(wù)則是對龐大用戶群體搜索行為的大數(shù)據(jù)匯集。

百度指數(shù)是百度以網(wǎng)民海量搜索數(shù)據(jù)形成的數(shù)據(jù)分享平臺。自2006年開始提供PC端搜索指數(shù),2011年1月開始提供移動端搜索指數(shù)。使用百度指數(shù)測量公共關(guān)注度的合理性主要基于以下考慮:一方面,互聯(lián)網(wǎng)現(xiàn)已成為國人感知社會、獲取信息以及社交互動的重要場所,其中百度指數(shù)最能反映網(wǎng)民對未知信息和焦點(diǎn)事件的探索行為。另一方面,百度指數(shù)是關(guān)鍵詞搜索規(guī)模和搜索頻次的加權(quán),對關(guān)鍵詞及來源相關(guān)詞和去向相關(guān)詞的分析,可從中尋得網(wǎng)民對焦點(diǎn)關(guān)注及相關(guān)議題的關(guān)聯(lián)度,從而分析公共關(guān)注議題之間的關(guān)系。積累長時(shí)段百度指數(shù),實(shí)際上建立了不同時(shí)期網(wǎng)民對社會議題的關(guān)注程度、變化趨勢、區(qū)域分布以及焦點(diǎn)議題相關(guān)性的知識庫。
本文運(yùn)用26個(gè)政策領(lǐng)域的主題詞進(jìn)行分類,將百度指數(shù)關(guān)鍵詞與之對應(yīng)分析,透視各政策議題在時(shí)間和地域維度的公眾關(guān)注度,并總結(jié)其時(shí)空特征,分析議題關(guān)注差異影響因素。百度指數(shù)反映了所有網(wǎng)民在網(wǎng)絡(luò)環(huán)境中的主動搜索行為,是其對所關(guān)注問題的最直接需求的體現(xiàn),但在深層次需求表達(dá)中,則受到更多宏觀影響因素。基于此,本文進(jìn)一步將區(qū)域經(jīng)濟(jì)發(fā)展水平、網(wǎng)民占比等宏觀因素納入考量,來探討公共關(guān)注度呈現(xiàn)地域差異的原因所在。


二、數(shù)據(jù)來源和研究方法


鑒于百度自2011年始提供移動端搜索指數(shù),本文使用2011-2017年的百度指數(shù)作為測量公共關(guān)注度的數(shù)據(jù)源,包含移動端和PC端,以全面利用網(wǎng)絡(luò)搜索行為反映公共關(guān)注度。對每天關(guān)鍵詞搜索進(jìn)行聚類分析,可獲得網(wǎng)民在特定議題上的關(guān)注熱度、變化趨勢和空間分布,進(jìn)而分析其緣由。本研究涉及26個(gè)政策領(lǐng)域的401個(gè)關(guān)鍵詞,運(yùn)用爬蟲技術(shù)將關(guān)鍵詞搜索指數(shù)進(jìn)行抓取。目前共采集到31個(gè)省級單位、336個(gè)地級市層面26個(gè)政策領(lǐng)域的日度搜索指數(shù)2億余條。以日為單位可以獲取政策關(guān)注度的歷時(shí)動態(tài),可對比由于公眾的各類感知而導(dǎo)致的時(shí)空差異,在此基礎(chǔ)上對其進(jìn)行顆粒度較高的時(shí)空差異分析。
政策領(lǐng)域來源于2017年國務(wù)院各部委分類,分別為財(cái)政、城建、反腐敗、公共交通、國防、國土、環(huán)境保護(hù)、教育、金融、經(jīng)濟(jì)發(fā)展、就業(yè)與勞動、科技、民族事務(wù)、企業(yè)事務(wù)、三農(nóng)問題、商務(wù)議題、社會保障、社會救濟(jì)、社會治安、水利、司法、外交、衛(wèi)生、文化娛樂、質(zhì)量安全、住房與拆遷。各議題通過不同的關(guān)鍵詞予以聚類,關(guān)鍵詞的篩選具有兩大依據(jù),一是根據(jù)各部委官網(wǎng)對其職能范圍的界定形成測量特定政策領(lǐng)域的關(guān)鍵詞庫,二是根據(jù)專家研討和爬蟲測試來確定最終關(guān)鍵詞列表。表1呈現(xiàn)了2017年全國議題熱度排名前十的政策議題的關(guān)鍵詞列表。

由于關(guān)鍵詞體量較大,本文基于議題將特定政策領(lǐng)域的關(guān)鍵詞進(jìn)行匯總,獲取每一政策議題綜合指數(shù),作為當(dāng)年公共關(guān)注度測度,以獲得時(shí)間軸上具有一致性和可比性的測量。本文所使用的政策領(lǐng)域平均日指數(shù)是議題下所有關(guān)鍵詞平均日指數(shù)的平均值,月指數(shù)是議題日指數(shù)的月平均值;以比較不同時(shí)空特定議題的公共關(guān)注度。

此外,為考察公共關(guān)注度的宏觀影響因素,以評價(jià)利用搜索行為測量公共關(guān)注度的效度,本文收集了2011-2017年省級經(jīng)濟(jì)社會發(fā)展的變量,數(shù)據(jù)來源于國家統(tǒng)計(jì)局官方網(wǎng)站。具體而言,地區(qū)經(jīng)濟(jì)發(fā)展通過人均GDP、居民消費(fèi)價(jià)格指數(shù)、地方財(cái)政支出占GDP比重進(jìn)行測量;網(wǎng)民規(guī)模運(yùn)用國家統(tǒng)計(jì)局公布的我國各省6歲以上互聯(lián)網(wǎng)上網(wǎng)人數(shù)占總?cè)丝诒壤M(jìn)行衡量;人口規(guī)模和登記失業(yè)率也來自相應(yīng)年份的《中國統(tǒng)計(jì)年鑒》。



本部分從七年間各省公眾最關(guān)注的議題入手,從時(shí)間和空間兩個(gè)維度考察了公共關(guān)注度,以此來考察政策議題的空間集聚和空間異質(zhì)性。考察政策關(guān)注度的時(shí)空差異有助于理解其測量效度。
首先,綜合考察全國2011-2017年公共關(guān)注度。我國公眾最關(guān)注的議題領(lǐng)域在七年間基本穩(wěn)定,主要涉及文化娛樂、財(cái)政金融、司法、社會民生類和經(jīng)濟(jì)企業(yè)類。隨著經(jīng)濟(jì)發(fā)展和生活水平的提高,公眾對旅游、影視等文化娛樂需求逐步上升,對該類信息的搜索量長期居于首位。文化娛樂關(guān)注度是排名第二的財(cái)政議題的2.1-3.6倍,遠(yuǎn)高于其他議題。其次,公眾對涉及財(cái)政收支、稅收類信息的財(cái)稅議題關(guān)注度較高,且對涉及貨幣、期貨、股票、貸款等金融議題亦較關(guān)注。再次,司法類議題在七年間均位列十大議題,凸顯人們較多地關(guān)注裁決、法制等信息;最后,公眾對民生政策的關(guān)注主要涉及就業(yè)與勞動、教育、公共交通、住房與拆遷等議題,累計(jì)關(guān)注度很高。

從議題類型而言,七年間公共關(guān)注度議題穩(wěn)中有變。2011年最關(guān)注的十大政策是文化娛樂、財(cái)政、金融、就業(yè)與勞動、教育、公共交通、社會保障、企業(yè)事務(wù)、經(jīng)濟(jì)發(fā)展和司法議題(如圖1)。七年間,公眾持續(xù)關(guān)注財(cái)政、金融類議題,2014年司法議題上升至第三位,反映了公眾對司法改革的重視以及法律意識的增強(qiáng)。在民生領(lǐng)域,七年間公眾持續(xù)關(guān)注就業(yè)與勞動、教育、公共交通與社會保障等議題。2011年-2014年更關(guān)注就業(yè)、教育、交通與社保;2015年,環(huán)境保護(hù)上升為最受關(guān)注的十大議題,公眾對污染、霧霾、粉塵等關(guān)鍵詞的搜索量陡增。2016和2017年,公眾分別對衛(wèi)生和住房議題關(guān)注度凸顯。



從省份差異來看,各議題在不同時(shí)間段呈現(xiàn)出空間差異。2011-2017年各政策關(guān)注度最集中的省份是北京和廣東。北京居民對公共交通的關(guān)注度居全國之首;廣東居民更關(guān)注文化娛樂、社會治安、社會保障等議題。金融、就業(yè)與勞動、企業(yè)事務(wù)、社會救濟(jì)、司法等議題于2011-2012年在北京關(guān)注度最高,2013年以后廣東超越北京。從區(qū)域分布來看,東中西部議題關(guān)注度同異并存。東部地區(qū)公眾更關(guān)注與企業(yè)發(fā)展有關(guān)的工商、稅務(wù)、合同、專利等事務(wù);中部地區(qū)公眾更關(guān)注看病、醫(yī)療等衛(wèi)生事務(wù);西部地區(qū)公眾相對更為關(guān)注民族團(tuán)結(jié)、民族文化等民族事務(wù)。就關(guān)注強(qiáng)度而言,呈現(xiàn)顯著區(qū)域不均衡趨勢,即東部關(guān)注程度最強(qiáng)、西部最弱,中部居中。




三、公眾關(guān)注度的宏觀影響因素:基于省級面板數(shù)據(jù)分析


百度搜索行為數(shù)據(jù)體現(xiàn)了其在一定時(shí)空范圍內(nèi)的注意力分配和政策偏好。然而,僅僅針對搜索行為映射的公共關(guān)注度開展相關(guān)性分析不足以理解公共關(guān)注度的成因,因此迫切需要基于大數(shù)據(jù)開展因果性分析(孟天廣,2018)。簡言之,人們在網(wǎng)絡(luò)空間的關(guān)注度和政策偏好可能受到宏觀環(huán)境的影響,而使其呈現(xiàn)顯著的時(shí)空差異。本部分對不同地域公眾在十個(gè)主要政策領(lǐng)域的關(guān)注度展開實(shí)證分析,采用2011-2017年我國省級面板數(shù)據(jù)考察公眾在經(jīng)濟(jì)發(fā)展、民生福利、司法和文化政策之關(guān)注度的經(jīng)濟(jì)社會成因。


(一)變量界定


本文通過面板數(shù)據(jù)模型進(jìn)行分析。因變量是十個(gè)政策領(lǐng)域的公共關(guān)注度,主要包括七年來公眾最為關(guān)注的三大類議題,即經(jīng)濟(jì)發(fā)展類議題(財(cái)稅、金融、交通和就業(yè))、社會民生類議題(衛(wèi)生、教育、環(huán)保和住房)和其他議題(文化和司法)。自變量包括各省經(jīng)濟(jì)發(fā)展水平、消費(fèi)物價(jià)指數(shù)、財(cái)政支出水平和登記失業(yè)率等經(jīng)濟(jì)因素,以及人口規(guī)模、網(wǎng)民規(guī)模等社會因素。根據(jù)上文,上述事項(xiàng)議題基本上覆蓋了全國范圍內(nèi)公共關(guān)注度的主要維度,而公共決策的既有文獻(xiàn)發(fā)現(xiàn),宏觀經(jīng)濟(jì)條件和社會發(fā)展決定著特定時(shí)代人們的政策偏好及其變化(Hall,1993)。經(jīng)濟(jì)波動或經(jīng)濟(jì)困難通常引起公眾政策偏好的快速演變,如果政府未能及時(shí)捕捉并回應(yīng)這種偏好變化,就可能釀成信任赤字(FernándezalbertosandKuo,2016)。為了呈現(xiàn)搜索行為反映公共關(guān)注度的外部效度,本文重點(diǎn)考察了經(jīng)濟(jì)和社會發(fā)展因素對不同領(lǐng)域政策關(guān)注度的影響。表3呈現(xiàn)了自變量的描述性統(tǒng)計(jì)分析。

(二)面板模型的發(fā)現(xiàn)


面板數(shù)據(jù)(paneldata)是研究對象在時(shí)間和空間兩個(gè)維度上變化的記錄,是在時(shí)間序列上取多個(gè)截面,在這些截面上選取一致樣本所構(gòu)成的數(shù)據(jù)。因此,從橫截面看,面板數(shù)據(jù)是若干個(gè)體在某一時(shí)刻構(gòu)成的截面觀測值,從縱剖面看是一個(gè)時(shí)間序列。面板數(shù)據(jù)結(jié)合了橫截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)的優(yōu)勢,在方法論意義上有諸多優(yōu)勢:首先擴(kuò)展了樣本量,為統(tǒng)計(jì)檢驗(yàn)提供了更高的自由度;其次提供了更多個(gè)體(或單位)層面跨時(shí)變化或跨時(shí)不變變量的豐富信息;再次可以有效地解決遺漏變量(尤其是跨時(shí)不變遺漏變量)問題( Wooldridge,2002)。因此,面板數(shù)據(jù)模型成為探究宏觀經(jīng)濟(jì)社會現(xiàn)象的常見計(jì)量模型,主要估計(jì)方法包括混合回歸分析、隨機(jī)效應(yīng)模型和固定效應(yīng)模型。



具體到本文,我們同時(shí)開展了隨機(jī)效應(yīng)估計(jì)和固定效應(yīng)估計(jì),豪斯曼檢驗(yàn)建議選擇固定效應(yīng)模型。本文考察的截面單位是省份,而各省特定的發(fā)展階段對于因變量的區(qū)域差異具有重要影響,因此采用固定效應(yīng)模型來擬合數(shù)據(jù)更為合理??紤]到各省人口基數(shù)(尤其是網(wǎng)民規(guī)模)的巨大差異,因此直接比較省份間百度搜索指數(shù)的差異并不具有可比性 。因此,本文的因變量依據(jù)各省當(dāng)年人口規(guī)模進(jìn)行加權(quán),以每萬人搜索指數(shù)作為因變量。表4呈現(xiàn)了10項(xiàng)政策關(guān)注度的固定效應(yīng)模型估計(jì)結(jié)果。



盡管表4呈現(xiàn)了非常豐富的研究發(fā)現(xiàn),但我們?nèi)匀豢梢钥偨Y(jié)出若干個(gè)基本規(guī)律,這為我們深入理解不同政策領(lǐng)域公共關(guān)注度的形成及其變化有重要價(jià)值。首先,就經(jīng)濟(jì)發(fā)展類議題的關(guān)注度而言,本文所假設(shè)的理論模型具有較好解釋力,財(cái)稅、金融、就業(yè)和交通等政策關(guān)注度的面板模型的解釋力均超過50%。經(jīng)濟(jì)發(fā)展類議題關(guān)注度受到經(jīng)濟(jì)發(fā)展水平、政府財(cái)政開支規(guī)模、經(jīng)濟(jì)波動等因素的重要影響,而人口規(guī)模和網(wǎng)民占比也有一定影響。具體而言,財(cái)稅政策關(guān)注度主要受到網(wǎng)民占比、人口規(guī)模和居民消費(fèi)物價(jià)指數(shù)的正向影響;金融關(guān)注度主要受到經(jīng)濟(jì)發(fā)展水平和財(cái)政支出占比的積極影響,而體現(xiàn)經(jīng)濟(jì)波動的消費(fèi)物價(jià)指數(shù)和登記失業(yè)率也帶來人們對金融政策的更多關(guān)注;就業(yè)政策關(guān)注度的影響因素比較多元,人口規(guī)模、經(jīng)濟(jì)發(fā)展水平等結(jié)構(gòu)性因素導(dǎo)致更多的就業(yè)關(guān)注度,而消費(fèi)物價(jià)指數(shù)和登記失業(yè)率的增長也如預(yù)期一樣引起更多關(guān)注;交通關(guān)注度主要受到人口規(guī)模、網(wǎng)民比例等社會性因素的正向影響,而財(cái)政支出占比導(dǎo)致更少的交通關(guān)注度。 


 其次,就民生福利類議題而言,本文構(gòu)建的模型解釋力最好,環(huán)保、教育、衛(wèi)生和住房等政策關(guān)注度的面板模型的解釋力約在70%。民生福利類議題關(guān)注度同時(shí)受到經(jīng)濟(jì)因素和社會因素的影響,總體上人口規(guī)模、網(wǎng)民占比顯著地提升了人們對民生福利政策的關(guān)注度,經(jīng)濟(jì)越發(fā)達(dá)的省份人們越關(guān)注民生福利政策,而涉及民生水平的消費(fèi)物價(jià)指數(shù)、登記失業(yè)率等均與民生政策關(guān)注度顯著正相關(guān)。具體而言,環(huán)保和衛(wèi)生政策關(guān)注度主要受到人口規(guī)模、網(wǎng)民占比、經(jīng)濟(jì)發(fā)展水平的正向影響,而較高水平的物價(jià)變動和失業(yè)率導(dǎo)致人們更關(guān)注環(huán)保和衛(wèi)生政策;教育政策關(guān)注度除了受到人口規(guī)模、網(wǎng)民占比和經(jīng)濟(jì)發(fā)展水平的正向影響外,登記失業(yè)率也引起人們更關(guān)注與人力資本培育相關(guān)的教育政策;住房政策關(guān)注度受到人口規(guī)模、人均GDP、物價(jià)指數(shù)和登記失業(yè)率的顯著影響,但網(wǎng)民占比不影響人們對住房政策的關(guān)注度,這顯示住房政策受到更廣泛群體的關(guān)注。

最后,本文模型對司法議題的關(guān)注度具有較強(qiáng)解釋力,但對文化議題關(guān)注度解釋力較弱。與民生政策類似,司法議題關(guān)注度主要受到人口規(guī)模、網(wǎng)民占比、人均GDP、物價(jià)指數(shù)和失業(yè)率的顯著影響,而人均GDP與消費(fèi)物價(jià)指數(shù)對司法議題關(guān)注度的互相抵消效應(yīng)更強(qiáng);文化議題關(guān)注度并不受經(jīng)濟(jì)發(fā)展和社會因素的影響,僅有消費(fèi)物價(jià)指數(shù)對其有負(fù)向影響,即物價(jià)上漲導(dǎo)致人們更不關(guān)注文化議題。除了交通、教育等少數(shù)政策關(guān)注度,經(jīng)濟(jì)發(fā)展水平與消費(fèi)物價(jià)指數(shù)始終互相削弱著彼此對各類政策關(guān)注度的影響,這表明在經(jīng)濟(jì)越發(fā)達(dá)的地區(qū),物價(jià)上漲會帶來人們注意力分配的轉(zhuǎn)移,即對私人(經(jīng)濟(jì))事務(wù)的關(guān)注度超過公共關(guān)注度,進(jìn)而削弱其政策偏好的形成。


四、結(jié)論與討論


以大數(shù)據(jù)及相關(guān)技術(shù)為引領(lǐng)的治理能力建設(shè),正在對人類社會發(fā)展、公共治理和生產(chǎn)生活方式帶來巨大影響(孟天廣、張小勁,2018)。盡管搜索引擎具有大數(shù)據(jù)分析的局限性,如原始搜索頻次不可獲得、搜索樣本在人群中是非隨機(jī)樣本;甚至可能如谷歌趨勢由于算法不穩(wěn)定而產(chǎn)生信度問題(Lazeretal,2014)等。仍不可否認(rèn)地,網(wǎng)絡(luò)搜索行為反映了公眾對感興趣政策議題的強(qiáng)烈關(guān)注和行動傾向,“人們搜索某一術(shù)語并不必然完美地代表全體人群,但其興趣動態(tài)可近距離反映全體公眾的行為痕跡”(Mellon,2014)。伴隨著互聯(lián)網(wǎng)及其應(yīng)用的不斷擴(kuò)展,網(wǎng)民成為世界各國公眾的主要構(gòu)成,也日益成為影響政策變遷的重要群體,而網(wǎng)絡(luò)參與逐步成為公眾參與治理的關(guān)鍵途徑(Jiang,MengandZhang,2018)。大數(shù)據(jù)技術(shù)的蓬勃發(fā)展,以及公眾對網(wǎng)絡(luò)搜索引擎的日益依賴,網(wǎng)絡(luò)搜索行為將成為感知公共關(guān)注度及其變化的一種有效路徑,未來亦可成為政府利用民情民意數(shù)據(jù)把握和預(yù)測政策偏好、政策情緒的主要數(shù)據(jù)源和有效機(jī)制。

本文利用百度搜索行為大數(shù)據(jù),對全國31個(gè)省市2011-2017年間26個(gè)政策議題的公共關(guān)注度展開分析,以探究我國公眾政策關(guān)注度的變遷及其經(jīng)濟(jì)社會成因。本文從省級層面,對不同省市公眾在跨時(shí)空場景下對不同議題的關(guān)注變化趨勢進(jìn)行了以年、月、日為單位的分析,并運(yùn)用空間分析呈現(xiàn)了政策關(guān)注度的地域特征及其變化??傮w上,網(wǎng)絡(luò)搜索數(shù)據(jù)可以有效地測量特定地區(qū)和時(shí)間場景下公眾的政策偏好和情緒。相比民調(diào)等傳統(tǒng)方式,搜索行為測量公共關(guān)注度具有下列優(yōu)勢:首先,搜索行為數(shù)據(jù)覆蓋面廣泛、體量巨大、維度豐富,涉及絕大多數(shù)網(wǎng)民群體,具有較好的數(shù)據(jù)代表性;其次,網(wǎng)絡(luò)搜索行為具有非常豐富的時(shí)間特性,當(dāng)我們以年、月、日等不同時(shí)間顆粒度來觀察公共關(guān)注度時(shí),既可以獲得公共管理迫切需要的高時(shí)效性數(shù)據(jù),也可以獲得政策決策和評估所需要的長效性數(shù)據(jù);再次,與傳統(tǒng)調(diào)查和訪談等自報(bào)數(shù)據(jù)相比,網(wǎng)絡(luò)搜索行為屬于消極數(shù)據(jù),本質(zhì)上是人們真實(shí)社會行為的投射,因而可以避免社會意愿偏差、自選擇缺失和偏好隱藏等方法論困惑。

在此基礎(chǔ)上,本文利用面板模型解釋了2011-2017年各省公共關(guān)注度的成因,推動了我們對不同政策關(guān)注度的形成及其變化的理解。經(jīng)濟(jì)發(fā)展類政策關(guān)注度主要受到經(jīng)濟(jì)發(fā)展水平、政府財(cái)政開支等宏觀經(jīng)濟(jì)條件和物價(jià)變化、失業(yè)率等經(jīng)濟(jì)波動的影響;民生福利類政策關(guān)注度同時(shí)受到人口規(guī)模、網(wǎng)民比例等社會因素和經(jīng)濟(jì)發(fā)展水平、物價(jià)變動、失業(yè)率等經(jīng)濟(jì)因素的影響;文化議題關(guān)注度并不受經(jīng)濟(jì)發(fā)展和社會因素的影響,僅有物價(jià)變化對其有負(fù)向影響,物價(jià)上漲導(dǎo)致人們更不關(guān)注文化議題。此外,經(jīng)濟(jì)發(fā)展與消費(fèi)變動對政策關(guān)注度的影響存在條件性關(guān)系,即二者對經(jīng)濟(jì)發(fā)展、民生福利政策關(guān)注度的影響均存在互相抵消關(guān)系,在經(jīng)濟(jì)發(fā)達(dá)地區(qū),物價(jià)上漲會帶來人們注意力分配的轉(zhuǎn)移,即對私人(經(jīng)濟(jì))事務(wù)的關(guān)注度超過公共關(guān)注度,進(jìn)而削弱其政策偏好的形成。

最后,本文從方法論意義上探討了從搜索引擎大數(shù)據(jù)測量公共關(guān)注度的可行方法,拓展了目前關(guān)于大數(shù)據(jù)應(yīng)用于社會科學(xué)研究的方法集。其次,對百度指數(shù)以日、月、年為單位的精細(xì)分析,可發(fā)現(xiàn)搜索行為與社會現(xiàn)象高度關(guān)聯(lián)的客觀規(guī)律,可為政府運(yùn)用大數(shù)據(jù)提升治理能力、實(shí)現(xiàn)精準(zhǔn)治理和高效回應(yīng)提供科學(xué)依據(jù)。當(dāng)然,由于采集搜索數(shù)據(jù)的體量龐大、維度多樣,本文對公共關(guān)注度的時(shí)空模式和宏觀規(guī)律的分析尚未窮盡,可能掛一漏萬。這需要未來進(jìn)一步有效利用海量搜索行為數(shù)據(jù),進(jìn)行更為深入和系統(tǒng)的研究。


———————————————————————————————————————————————————————————


“銳研”是萌泰數(shù)據(jù)旗下社會科學(xué)專題數(shù)據(jù)庫及科研服務(wù)平臺,旨在為學(xué)者和科研人員提供專題數(shù)據(jù)庫和科研數(shù)據(jù)采集與分析服務(wù),以及各類社會調(diào)查研究方法工具支持。旗下產(chǎn)品包括五大特色數(shù)據(jù)庫、三大指數(shù)產(chǎn)品、六大社會調(diào)查研究工具以及智慧蜂眾包任務(wù)平臺等科研服務(wù)產(chǎn)品。

 

萌泰數(shù)據(jù)是社會科學(xué)領(lǐng)域知名數(shù)據(jù)服務(wù)商和科研教學(xué)工具廠商,面向社會科學(xué)教育實(shí)踐、學(xué)術(shù)研究和社會服務(wù),提供一體化數(shù)據(jù)解決方案。目前旗下包括銳研”智社”兩大子品牌。



銳研產(chǎn)品矩陣


萌泰官網(wǎng):www.monetware.com

銳研中國www.51diu.com

銳研專題數(shù)據(jù)平臺:www.ringdata.com

銳研中國官方微信公眾號




    發(fā)表評論
    評論通過審核后顯示。
    移動訪問