互聯網大數據解讀中國媒體經濟信心
- 2015-12-28 12:00:00
- admin 原創
民眾經濟信心指數是衡量民眾對經濟環境的信心強弱的指標,是綜合反映并量化民眾對當前經濟形勢評價和對經濟前景、收入水平、收入預期以及消費心理狀態的主觀感受,是預測經濟走勢和消費趨向的一個先行指標,同時也是監測經濟周期變化不可缺少的依據1。經濟學界通常認為,民眾的行為并不是實際經濟結構的被動反應者,他們的態度和預期會影響經濟發展趨勢,所有民眾審慎決策的加總,就足以影響國民經濟的發展趨勢2。國外五十多年的理論研究和實踐活動也表明,消費者的信心與重要宏觀經濟指標之間存在密切聯系,它對未來經濟發展趨勢有相當的預見性,是宏觀經濟決策的重要參考3。
1.如何測量中國民眾經濟信心指數
調查問卷是目前收集民眾經濟信心的重要方法。隨著互聯網的出現,特別是社會化媒體的普及,網絡中包含了越來越多由用戶或機構生產的信息,為民眾經濟信心的統計提供了新的數據源。且相較傳統調查問卷數據,該類數據有采集簡單、迅速等特點,可在一定程度上克服傳統方法的不足。考慮到網絡數據的特點,本報告主要從三個渠道采集數據(即百度指數、新浪微博、門戶網站等),綜合采用指數統計、內容分析、情感分析等方法進行數據分析,通過問題與數據的對應,進行民眾經濟信心的統計。
不同國家和機構在設計民眾經濟信心調查問卷時考慮的問題內容有所區別,但大多包含如下幾個方面內容:即“經濟發展”、“就業形勢”、“家庭收入”與“消費意愿”。因此,本報告設計了如表1.1所示的四類八個問題進行本次中國民眾經濟信心的統計。另外,為了便于后面分析,將每個問題的答案從正向到負向統一命名,具體如表1.2所示。
本報告將對每類問題進行信心指數統計,具體計算過程如公式(1)所示,其中“總數”表示對應問題包含的文本數量,“樂觀數”表示對應問題包含的表達樂觀情感傾向的文本數量(微博文本或新聞報道),其它與之類似。另外,針對每類數據源(意見領域發表的微博文本、五大門戶網站的新聞報道),將綜合四類問題計算一個總的經濟信心指數,該指數為四類問題信心指數的平均值。
2.民眾在關注什么?關鍵詞搜索變化趨勢分析
以往關于經濟信心指數的分析著重關注指數本身,忽略了表征經濟信心的各個方面的問題。因此,在進行指數統計之前,有必要弄清針對四類問題民眾的關注焦點及其變化趨勢。考慮到“百度”在中國搜索領域的地位,本報告采用百度指數(http://index.baidu.com)作為統計民眾關注焦點及其變化趨勢的工具。具體過程如下所示:
①關鍵詞的確定
針對每個問題的特點選擇國家統計局、社會勞動保障部、購物網站等提供的分類目錄,結合百度提供的關鍵詞推薦功能和人工判斷,為每個問題確定100-1000不等的表征關鍵詞。
②關鍵詞的分類
根據一定規則將每個問題對應的關鍵詞分成數量不等的大類與小類,其中小類包含在大類中。
③關鍵詞搜索變化趨勢計算
首先,利用百度指數獲取關鍵詞今年與去年的搜索趨勢,并據此得到關鍵詞搜索變化趨勢初始值;其次,考慮到相較2014年,2015年我國網民基數有所增加,對搜索變化趨勢初始值進行加權,得到最終的關鍵詞搜索變化趨勢值。另外,值得一提的是:
“關鍵詞搜索變化趨勢值”>1表示相較去年,關鍵詞今年搜索量增加;
“關鍵詞搜索變化趨勢值”<1表示相較去年,關鍵詞今年搜索量減少;
“關鍵詞搜索變化趨勢值”=1表示相較去年,關鍵詞今年搜索量基本不變。
④小類與大類搜索變化趨勢計算
小類搜索變化趨勢值為小類包含的關鍵詞的搜索變化趨勢值的平均值。
大類搜索變化趨勢值則為大類包含的小類的搜索變化趨勢值的平均值。
2.1“經濟發展”類問題統計結果
首先,按照國家統計局對三次產業的劃分,將國民經濟劃分為第一產業、第二產業和第三產業3個大類;其次,根據國民經濟的《行業分類標準》,將農林牧漁業、建筑業、金融業等20個行業門類作為小類。《行業分類標準》中對20個行業門類都進行了細分,通過從細分門類中抽取關鍵詞的方式來確定基礎關鍵詞集。通過百度指數的關鍵詞推薦功能,對基礎關鍵詞集進行擴展。摒除掉百度指數中沒有收錄的部分關鍵詞(不是“熱詞”),最終確定的關鍵詞數量為:587個。最后,通過收集并計算小類搜索變化趨勢值及其平均值,得到“經濟發展”類問題的關鍵詞搜索變化趨勢(表2.1和圖2.1)。
可以看出:
① 民眾對于三大產業的關注度較去年均有所上升,按關鍵詞搜索變化趨勢,由高到低依次為第三產業、第一產業和第二產業。
②除“水利、環境和公共設施管理業”小類的關注度較去年有所下降之外,其他所有行業的關注度較去年均有所上升。
③ 民眾關注度較去年上升幅度最大的前5個行業依次為金融業、房地產業、住宿和餐飲業、租賃和商業服務業、建筑業和教育。
2.2“就業形勢”類問題統計結果
首先,將就業形勢劃分為就業與失業兩類。其次,從人力資源和社會保障部的《政策法規》中提取與就業相關的關鍵詞,結合百度指數的關鍵詞推薦功能,對基礎關鍵詞集進行擴展。摒除掉百度指數中沒有收錄的部分關鍵詞(不是“熱詞”),最終確定的關鍵詞數量為:123個。根據就業類與失業類關鍵詞的特點,將就業大類又分為“招聘”、“創業”、“公務員與事業單位”、“技能培訓”與“保險與保障”五小類,失業大類僅包括“失業”一個小類。最后,通過收集并計算小類搜索變化趨勢值及其平均值,得到“就業形勢”類問題的關鍵詞搜索變化趨勢(表2.2和圖2.2)。
可以看出:
① 無論關于就業還是失業,民眾的關注度均較去年有所上升,其中就業的關注度上升幅度高于失業。
② 從關鍵詞搜索變化趨勢上看,民眾最為關注的依次是招聘、公務員與事業單位、創業、技能培訓、失業、保險與保障。
2.3“家庭收入”類問題統計結果
首先,由于直接確定“家庭收入”類問題的表征關鍵詞較困難,同時考慮到家庭收入主要用于家庭支出,因此本文將“家庭支出”作為“家庭收入”的表征。家庭支出分為“必需品”與“非必需品”兩大類。其中“必需品”分為服裝、食品、住房、交通、醫療、通訊6小類,“非必需品”分為“3C ”、奢侈品、汽車、投資、教育、娛樂、大家電、旅游8小類。其次,通過百度指數的關鍵詞推薦功能,對基礎關鍵詞集進行擴展。摒除掉百度指數中沒有收錄的部分關鍵詞(不是“熱詞”),最終確定的關鍵詞數量為:196個。最后,通過收集并計算小類搜索變化趨勢值及其平均值,得到“家庭收入”類問題的關鍵詞搜索變化趨勢(表2.3和圖2.3)。
可以看出:
① 必需品的搜索變化趨勢值(1.16)小于非必需品的搜索變化趨勢值(1.61),說明民眾對非必需品的關注度上升幅度高于必需品,可能表明民眾收入更多地流向非必需品。
②在非必需品的八個小類中,投資的搜索變化趨勢值為4.99,遠遠高于其他關鍵詞集,表明今年民眾對投資領域的關注度大幅提升。
在所有14個小類中,必需品中的“住房”和非必需品中的“3C”兩個小類的搜索變化趨勢值均小于1,表明民眾今年對這兩方面的關注度有所下降。
2.4“消費意愿”類問題統計結果
首先,人工分析消費者的購買行為和習慣,將消費品分為“便利品”、“選購品”、“特殊品”、“非渴求品”四大類。其次,根據國家統計局提供的商品零售價格分類指數,并輔之以人工分析,將四大類細分為包括“食品”、“飲料煙酒”、“日用品”等在內的21個小類。通過從21個小類中抽取關鍵詞的方式來確定基礎關鍵詞集,利用百度指數的關鍵詞推薦功能,對基礎關鍵詞集進行擴展。摒除掉百度指數中沒有收錄的部分關鍵詞(不是“熱詞”),最終確定的關鍵詞數量為:1153個。最后,通過收集并計算小類搜索變化趨勢值及其平均值,得到“消費意愿”類問題的關鍵詞搜索變化趨勢(表2.4和圖2.4)。
可以看出:
① 四類商品的搜索變化趨勢值均大于1,表明民眾對這四類商品的關注度較去年均有所上升。
②體育娛樂用品、家用電器及音像器材與化妝品三個小類的搜索變化趨勢值小于1,中西藥品及醫療保健用品與書報雜志及電子出版物兩個小類的搜索變化趨勢值等于1,說明體育娛樂用品、家用電器及音像器材與化妝品的關注度小于去年,而中西藥品及醫療保健用品與書報雜志及電子出版物的關注度與去年類似。
③證券的搜索變化趨勢值遠遠高于其他小類,說明今年與證券有關的關鍵詞的搜索量增幅較大。
2.5部分小類的百度指數詳細統計
本部分將對幾個表征經濟信心能力強且搜索變化趨勢特別的小類進行單獨分析,獲取每個小類在2015年1月到11月的百度搜索指數,繪制搜索指數變化圖。
⑴“失業”小類的百度指數分析
圖2.5是失業小類的百度指數變化趨勢圖。從圖2.5可以看出,失業小類的搜索指數在3月份出現峰值。
⑵“投資”小類的百度指數分析
圖2.6是投資小類的百度指數變化趨勢圖。從圖2.6可以看出,投資小類的搜索指數在7月份出現峰值。
⑶“3C”小類的百度指數分析
圖2.7是包含智能手機、平板電腦等在內的3C小類的百度指數變化趨勢圖。從圖2.7可以看出,3C小類的搜索指數在7月份出現峰值。
⑷“住房”小類的百度指數分析
圖2.8是住房小類的百度指數變化趨勢圖。從圖2.8可以看出,住房小類的搜索指數在3月份出現峰值。
3.意見領袖對中國經濟信心的統計分析
傳播學理論發現,意見領袖作為媒介信息和影響的中繼和過濾環節,對大眾傳播效果會產生影響4。因此,意見領袖的觀點也可能會對民眾產生一定影響,考慮將其納入分析范圍。
3.1數據來源與處理方法
首先,選擇“新浪微博”為數據獲取平臺,以新浪搜索的“找人”為檢索入口,分別以“經濟”、“就業”、“收入”、“消費”等作為檢索詞進行檢索;
其次,在檢索結果中綜合考慮博主的粉絲數、職業、身份等信息,共選定35名博主作為意見領袖;
然后,進入意見領袖在新浪微博的個人主頁,瀏覽其一年里所發微博內容,篩選出與問題相關的微博文本共210條。對這些文本進行問題分類,發現針對“就業形勢”與“家庭收入”類問題的微博文本數較少,前者17條,后者8條,共25條,不具備代表性,考慮將其刪除。
最后,對185條微博文本進行情感分析,并與問題的答案進行對應。基于此,進行兩類問題信心指數(即“經濟發展”與“消費意愿”)與總的經濟信心指數計算,并對計算結果進行詳細分析。
3.2統計結果與分析
首先,統計每類意見領域發表微博文本的情感傾向,并進行各類問題信心指數計算與意見領域總的經濟信心指數計算,得到如表3.1與圖
3.1所示的結果:
綜合分析得到:
①分析每類問題包含的微博文本數可知,意見領袖對“經濟發展”類問題最為關注,“家庭收入”類問題相對關注較少;
②針對兩類問題,意見領袖對“經濟發展”最有信心,“消費意愿”次之。
其次,以問題為維度制作意見領袖情感傾向分布圖,如圖3.2與3.3所示:
4.五大門戶網站新聞報道對中國經濟信心的
統計分析
門戶網站是網絡時代民眾獲取信息的重要渠道,而新聞報道依托于平臺本身的權威性與傳播性能在很大程度上對民眾的觀點產生影響。因此本報告將主要門戶網站上與經濟信心相關的新聞報道納入分析范圍,并通過情感分析獲取相關報導的情感傾向,計算四類問題與總的經濟信心指數,以期為民眾經濟信心分析提供支持。
4.1數據來源與處理方法
首先,選擇五大門戶網站(新浪、鳳凰、網易、騰訊、搜狐)作為數據獲取平臺;
其次,利用各個門戶網站提供的搜索功能,以“經濟發展”、“就業形勢”、“家庭收入”、“消費意愿”為關鍵詞,分別在五大門戶網站檢索,選取有效檢索結果的前150名,共3000條新聞為分析對象;
最后,分析3000條新聞的情感傾向,并進行結果的統計與分析。值得一提的是,這部分數據將分成“當前”問題與“未來”問題分別統計。
4.2統計結果與分析
統計結果將以兩種形勢展示:
首先,是四類問題總的統計結果;
其次,將四類問題“當前”與“未來”的分別統計結果。
⑴總體統計結果
綜合分析表4.1與圖4.1得到:
①根據總的經濟信心指數可知,五大門戶網站相關新聞報道對中國的經濟信心持樂觀態度;
② 根據四類問題的信心指數可知,五大門戶網站相關新聞報道對中國經濟發展、家庭收入與消費意愿持樂觀態度。
⑵四類問題“當前”與“未來”分別統計結果
這部分數據將分成“當前”與“未來”分別統計。統計結果如表4.2和圖4.2a-4.5b所示。
綜合分析得到:
①從五大門戶網站相關新聞報道數量看,有1887條關注了當前的經濟狀況,而有1113條關注了未來的經濟狀況,即關注“當前”的新聞報道更多。
② 在關注當前經濟狀況的1887條新聞中,關于就業形勢的報道最多,其次是家庭收入,再次是消費意愿,最后是經濟發展。而在關注未來經濟狀況的1113條新聞中,報道最多的是經濟發展,其次是消費意愿,再次是家庭收入,最后是就業形勢。說明對“當前”和“未來”的關注點是不同的。五大門戶網站相關新聞報道更加關注未來的經濟發展,而當前則更加關注諸如就業、消費等與民眾切身利益相關的問題。
③ 從“當前”與“未來”的經濟信心指數看,五大門戶網站相關新聞報道不僅對當前經濟信心持樂觀態度,并且對未來更加有信心。
④ 分析四個問題“當前”與“未來”的統計結果可知,五大門戶網站相關新聞報道對“當前”的家庭收入最樂觀,其次是消費意愿,再次是經濟發展;對“未來”的經濟發展最樂觀,其次是就業形勢,再次是家庭收入。
考察“當前”與“未來”信心指數的差值可以發現,五大門戶網站相關新聞報道對經濟發展和就業形勢具有最為積極的期待。
5.結語
本報告以互聯網數據為分析對象進行2015年中國民眾經濟信心指數統計分析,得到以下發現:第一,利用百度指數對表征四類問題的關鍵詞進行搜索變化趨勢計算,發現相較去年,“投資”與“證券”兩個小類今年的網絡搜索量大幅增加。由此可知,今年民眾對于投資、證券、股票等較為關注;第二,意見領袖對經濟發展持樂觀態度;第三,五大門戶網站對中國當前與未來的經濟信心都呈現樂觀態度,由其是對于未來更有信心。
隨著中國經濟發展進入新的階段,民眾消費對經濟發展的重要性不斷增加。民眾經濟信心指數是衡量民眾未來消費意愿的重要指標,本報告通過對網絡大數據進行統計分析發現,無論是微博上的意見領袖還是門戶網站中各種新聞報道,總體上呈現出的都是對未來經濟發展持樂觀態度。這種樂觀態度將為未來中國經濟的發展提供充足動力。
注:
1參見國家統計局中國經濟景氣監測中心:http://www.cemac.org.cn/Gxfzxx.html
2國家統計局中國經濟景氣監測中心.消費者信心調查方法與應用[EB/OL].[2015-12-20]. http://www.ce.cn/cysc/ztpd/zt/bg/X/201011/16/t20101116_20544836.shtml。
3李曉玉:《消費者信心指數的理論背景與實際意義》,《統計教育》2006年第1期。
4Lazarsfield P, et al., The People’s choice[M]. New York: Columbia University Press, 1948.