超越調查:研究方法的創新 Beyond the Survey: Innovation of Research Method
- 2020-06-04 16:12:00
- admin 原創
一、前言
應中國商業統計學會之約,在全國大學生市場調查與分析大賽十周年之際,給同學們談談自己的作為大賽評委的體會,希望能夠給同學們的大賽旅程提供一些指引和幫助。從2015開始,我有幸加入中國商業統計學會,并與大家一起見證了學會和大賽過去五年的成長過程。這五年里,我非常幸運。作為大賽評委,每一次閱讀同學們一份份精致的調查報告,每一次欣賞同學們一張張精美的幻燈展示,每一次享受同學們一次次精彩的匯報演講,我的內心都充滿感激和喜悅。
我要感激大家,感激大家利用團隊的智慧、辛勤的汗水以及美麗的心靈,去探索和發現我們這個世界和社會上那些影響經濟運行的商業邏輯、關系我們和諧發展的社會問題以及涉及當今大學生學習生活的各類現象和規律。每一支參賽團隊都是我的眼睛和大腦,你們的報告中將你們的所見所聞、所感所受,所思所想一并毫無保留地呈現出來——數據充分、方法得當、結論準確、建議合理。 這也讓我豐富了見聞、拓展了視野、增長了知識。孔子說:“三人行,必有我師焉”,各位參賽的老師和同學們也是我的老師。
除此之外,同學們的現場表現穿著得體、思路敏捷、表達清晰、情感真摯,每一次看到大家熱情洋溢的笑容、青春陽光的神情、酣暢淋漓的配合,每一次聽到整齊劃一的口號、生動有趣的對話、深入淺出的分析,我也仿佛融入到了大家的團隊之中,成為大家團隊中的一員,與大家一起分享辛勤的汗水和收獲的喜悅。
五年來,我很享受這一切美好的回憶,因此也想借此十周年之際,寫一點文字表達對中國商業統計學會以及全國大學生市場調查與分析大賽的最美好的祝福。
我要分享的內容是關于研究方法的話題,事實上,這也是我特別想和各位同學交流的話題。在過去五年的擔任評委的經歷中,我完整閱讀了數百篇大家的調查報告,最大的感受就是研究方法的單一和同質化。因此,我特別為本文的標題中加入了一個吸引眼球的關鍵詞——“超越調查”,并特別增加了英文的翻譯“Beyond the Survey”。我需要提前聲明的是,我的本意并非是否定調查或摒棄調查,也不是要指出調查方法的不足,而是想強調“市場調查與分析大賽”中的調查,不僅是“調查”(Survey),更是“研究”(Research)的意思。本文將帶領大家,分別從概念、方法和思維三個角度來重新認識“調查”。
二、超越調查
1.概念的超越:從調查到研究
一提到“市場調查”或“社會調查”,我們常識的第一反應就是“問卷調查”或“統計調查”。究其原因,我想是因為我們的日常生活中經常接觸問卷,比如,電話里經常接到商家的滿意度調查,微信群和朋友圈有各式各樣的學術調查或有獎調查,商場或交通樞紐經常有各類攔截的消費者調查。這些調查,絕大部分都是以問卷形式展開,只不過形式上有些是通過電話,有些是通過網絡,有些是通過Pad或者傳統的紙質問卷。
然而,從中文概念上來看,調查還有考察、巡查、審查之意,不僅對應于英文的survey,還有investigate之意。學術領域的“調查”是指為了探尋一個問題而開展學術活動,可進一步引申為 “研究”(research)。因此,廣義的“調查”可以同等理解為 “研究”,這種情況下,調查和研究可以互通,比如,社會調查方法、社會調查研究方法、社會研究方法在學術語境下是基本一致的,再比如,市場調查和市場研究也是一致的,其英文均對應于market research。由于中文“調查”的多義性,狹義的“調查”,僅指問卷調查、抽樣調查或統計調查方法。在學術領域,尤其是涉及方法論討論時,“調查”和“研究”的概念往往會有區分,“調查”專指一種“調查法”,是“研究”活動的資料收集方式之一。一般來講,“調查”強調資料的收集過程,而“研究”強調整個學術活動的過程。
再看“研究”的概念,中文的“研究”,研”指審查、細磨,“究”是指窮盡、追根求底。英文“research”=“re”+“search”,也就是反反復復尋找的意思。“研究”指人對事物真相、性質、規律等進行的無窮盡的積極探索。簡單地說,“研究”就是一個認真的提出問題,并以系統的方法尋找問題答案的過程,是人類認識世界、認識社會、認識自己的途徑。
因此,“調查”,或者更準確的說,“研究”,作為人類認識世界的主要方式,不應囿于“問卷”和“抽樣”的束縛,而應該從更廣闊的方法論視野中尋找從不同角度認識世界的方式。只有當我們在概念上,首先認識到調查和研究的關系,才能在“研究”的工具箱中找到更適合某個問題的研究方法。
2.方法的超越:研究方法的創新
翻看任何一本介紹調查研究方法的書籍,我們都知道,研究方法除了調查法,還有實驗法、實地法和文獻法。這四種研究方法自300多年前現代意義上的調查誕生以來,就已經被逐步采用。
讓我們回溯到近現代,來看看最初的調查形式。一般普遍認為現代意義上的社會調查始于始于17世紀下半葉的歐洲的行政調查和社會問題調查,比較有代表性的人物是法國的科爾伯和英國的經濟學家威廉·配第。柯爾柏在擔任法國財政部長期間,主持了一系列的大規模的社會調查,如1664年-1665年先后開展的法國社會概況調查和法國制造業調查。1672年,威廉·配第在《政治算術》一書中運用了統計數字、圖表等一系列統計指標來分析英國社會經濟狀況,并提出任何社會現象都應用數字、重量和尺度的比較來進行說明。1774年,英國社會改革家霍華德通過對犯人進行訪談的方法,廣泛地調查歐洲各國監獄狀況,最終說服英國的眾議院通過了改善犯人待遇的監獄改革法案。
威廉·配第(William Petty, 1623-1687)
1831年開始,比利時社會統計學家,近代統計學的創始人凱特勒,開始從事有關人口和犯罪問題的統計學研究,通過掌握的統計資料,發現社會犯罪的現象規律,這可以看做是文獻研究的一種形式。1840年,德國心理學家韋伯通過實驗發現了差別感覺閾限的定律,即韋伯定律,這是最早的社會科學實驗研究方法的運用。1855年,法國冶金學教授、社會學家黎普萊 ,以歐洲勞工家庭為基本調查單位,結合問卷和訪談方法開展個案研究,收集家庭的收支、固定資產以及家庭成員的態度和互動,出版了《歐洲勞工》。1879年,德國心理學家、實驗心理學之父馮特,在萊比錫大學創立世界上第一個專門研究心理學的實驗室。1886年,英國統計學家、社區生活調查的創始人布思,對倫敦居民的貧困問題進行廣泛調查,綜合使用了訪談法、問卷法和觀察法等多種方法,以及地圖、圖表和統計表等工具和技術。1897年,法國社會學家、社會學理論三大奠基人之一的涂爾干出版了《自殺論》,該書利用廣泛收集的自殺統計資料,首次確立了“假設-推測-檢驗”的研究范式,是社會經驗研究的典范,某種意義上也是一種基于文獻的統計分析方法。
凱特勒 (Quetelet, 1796-1874)
到了20世紀初,各類社會調查與研究快速發展,如美國的匹茨堡調查、春田調查、密蘇里調查、蓋洛甫民意測驗所的總統選舉調查以及各類早期的社會心理學實驗等;同時社會調查也在中國扎根,如1928年李景漢先生“定縣調查”、燕京大學社會學系的清河調查、1936年費孝通先生的“江村調查”等。這些研究或采用統計資料、或采用問卷,或采用觀察,或采用訪談、或采用實驗,涉及調查法、實地法、實驗法和文獻法等多種研究方法。
黎普萊(Le Play, 1806-1882)
當然,“調查法”由于其數據存儲的方式通常是以結構化的數值進行存儲,不僅可以借助統計學上的各類數學模型進行分析,而且相比實驗等其他方法,操作更加便捷。隨著20世紀初抽樣理論的逐步完善,尤其是20世紀下半葉計算機和互聯網技術的發展,“調查法”,主要是問卷調查的形式,從樣本的選取、數據的收集到數據的分析都形成了一整套完整的、便捷的、可操作化和的理論、方法、技術和工具,從而被廣泛應用于現代社會的各類調查中。目前,社會科學領域的幾個主要的學術調查,如中國人民大學的中國綜合社會調查(CGSS)、中國社科院的中國社會狀況綜合調查(CSS)、北京大學的中國家庭追蹤調查(CFPS)、中山大學的中國勞動力動態調查(CLDS)等,均采用抽樣問卷調查的研究方法。
但不論采用哪種調查研究方法,其核心均涉及到資料的采集和分析方法,換句話說,研究的探索過程必須針對一定的資料展開,研究無法立足于純粹的想象之上,即使是哲學的思辨也是建立在研究者對前人的理論或經驗之上。調查法、實驗法、實地法強調主動的收集一手資料,而文獻法也被看做是對二手資料的研究。
隨著物聯網、大數據、人工智能等新一代信息技術的不斷發展,資料來源的不斷豐富,資料的采集和分析方法朝著更多元化的方向發展。尤其是基于大數據的研究方法,自2012年舍恩伯格的《大數據時代》發表以來,大數據研究在社會科學界引起了廣泛的討論,一度被認為其有可能顛覆傳統的社會科學研究方法。在過去幾年中,我本人也曾在多個場合,不遺余力地呼吁和提倡采用這種研究方法,并把大數據研究方法與抽樣調查、普遍調查并列的一種新型統計調查方法。然而,當我重新回顧調查的歷史,重新思考研究的本質,我不得不重新修訂我的認識:大數據的研究方法與其說是一種新型研究方法,不如說是一種升級版的文獻研究方法。
文獻研究,這不僅包括書籍、期刊論文、雜志、報紙、統計年鑒等印刷資料,還包括電視、廣播等媒體產生的音視頻資料,當然也應包括互聯網、移動APP,物聯網以及已有信息系統的數據庫中所存儲的數字資料。就文獻資料而言,大量的資料是以非結構化或半結構化數據存在,在資料數量不是很多的情況下,這并不影響開展對資料(尤其是文本資料)的定性分析和解讀,探討這些資料背后蘊藏的價值和文化意義,亦或者通過人工對資料進行編碼,開展定量的統計分析;但當資料數量超過一定的規模,達到“海量”的時候,傳統的人工內容分析方法將存在很大的困難,這時,大數據的分析技術將派上用場。通過技術手段,我們可以對海量大數據開展各類數據預處理和統計分析工作。比如,通過自然語言處理(NLP)技術,我們可以將文本按詞性或者自定義的詞典進行分詞,執行詞頻統計;通過分類、聚類、主題模型等機器學習算法,可以對海量文本按主題自動進行分類;通過情感分析可以對文本的情感進行計算;通過圖像識別可以對圖片進行分類;通過語音識別技術可以對聲音資料文字化,再進一步進行文字處理;當然,通過數據挖掘算法還可以幫助找出隱藏在數據之中的特定模式和規律;當下最熱的以深度學習為代表的人工智能技術將進一步提升各類文本挖掘算法、圖像識別算法、語音識別算法、推薦算法、預測算法的精度和自動化水平。所有這些技術主要用于對已有數據的預處理,預處理之后的數據將更有利于使用傳統的定量統計分析方法,如從非結構化的數據中提取出結構化的變量。當然,大數據技術也可以用于定性分析,比如通過詞頻統計生成的詞云圖,或者通過自動摘要技術提取文章的核心觀點,或者通過機器聚類技術幫助對海量數據進行歸類,這些技術完全可以輔助對內容的解讀。
因此,技術本身是為研究方法而服務的,大數據的研究雖然取得了一系列的研究發現和成果,但大數據研究方法還無法成為一種獨立于調查法、實驗法、實地法和文獻法的研究方法。就大數據和人工智能算法而言,其基礎仍然是數學和統計學,那種擔心大數據和人工智能可能顛覆社會科學研究方法的想法,目前看來,是沒有必要的。
盡管如此,就研究方法的創新而言,大數據是對傳統文獻研究方法內涵的延伸,資料收集和分析手段的升級,是互聯網、大數據和人工智能時代最有應用前景的研究方法之一。因此,超越調查的第二個層次,我的觀點是在市場或社會研究中要敢于使用多種研究方法,尤其是大數據的研究方法。
社會研究的基本方式[備注2]
3.思維的超越:方法論的融合
我想討論的第三個超越,是關于方法論的層面,為了通俗一點,我冠以“思維”的超越。目前關于經驗研究,主要有實證主義和人文主義兩種方法論和價值取向。
實證主義強調對經驗事實的進行客觀的分析,由于數字的客觀性,因此實證主義常使用定量分析的方法,調查法和實驗法是典型的實證主義研究方法;人文主義強調文化和意義的重要性,注重對現象的解釋,對理論的思辨,對知識的建構,人文主義常采用定性研究的方法,對定性研究而言,數字僅僅是作為一種分析來源資料,人文主義者常采用實地法和文獻法開展研究。
當然,就實地法和文獻法而言,以結構化方式存在的資料也可以開展定量分析,對于非結構化的文字資料,訪談文本甚至多媒體資料,通過合適的技術處理,也可以轉換成結構化的數據,從而便于開展定量分析。
我想指出的是,定量和定性的研究取向是就資料的分析方法而言,就資料本身,以及資料的收集方法,兩者并沒有本質的區別,即便是問卷調查收集的結構化數據,也可以基于研究者的經驗以及與其他資料的對比,開展文化和意義的深入解讀。當然,由于定性研究對文化和意義的關注,定性研究特別重視資料收集過程中的情境、互動、體驗和感受,因此定性研究的資料收集過程往往更依賴于研究者的個人能力和經驗,而無法像定量研究的資料收集過程的標準化和可復制性。
我還想說明的是,定量分析和定性分析都各有其優勢和不足。定量分析完全基于收集的客觀數字開展統計分析,雖然能夠有助于發現事物的精確的相關關系和因果關系,但也可能會陷入以偏概全、虛假關系、淺嘗輒止等陷阱;定性分析雖然能夠有助于挖掘事物的文化和意義,開展或宏觀、或微觀的深入分析和討論,但同樣可能會導致結論主觀、適用局限等問題。
因此,當我們就一個具體問題開展研究時,我們應該根據我們的研究目標需要,采用最合適的研究方法,我們不應糾結于不同主義之爭(實證主義和人文主義),或者是不同方法之爭(定量方法和定性方法)。當我們熟悉了所有這些思維的方式(實證思維,人文思維,定量思維,定性思維),我們就能夠做到不同方法論的融合。
當一個定性研究者具備定量思維時,我們就能夠突破定性研究的局限,反之,當一個定量研究者具備定性思維時,我們也能夠彌補定量研究的不足。同理,當我們具備大數據思維時,我們就能突破傳統的抽樣思維,從而強調總體數據的重要,重視對大數據技術的利用。
這種思維的突破不是從一個思維變遷到另外一個思維,而是不同思維方式相互之間的借鑒,是方法論的融合。理解不同方法論的差異,優點和不足,可以開展更具包容性的研究。
研究方法論的融合
最后,讓我們來一起重新認識“調查”。
調查,起源于近代的行政統計調查,隨后被擴大到社會生活領域,在20世紀早期被廣泛應用到了民意調查、市場調查和社會調查等領域,隨著抽樣理論的完善,基于問卷調查的量化研究被更普遍的使用,而隨著互聯網、物聯網、大數據、人工智能等新一代信息技術的發展,在研究資料收集和分析過程中,計算機技術將發揮越來越重要的作用。
調查,有四種主要研究方法,涉及實證主義和人文主義兩種方法論以及定量和定性兩種研究取向。針對不同的研究問題,我們可以融合兩種方法論,采用多種研究方法和多種資料收集和分析技術,開展定量分析或定性分析,從不同的角度做出更全面、更科學的研究。
“調查”就是“研究”,是人類認識世界、認識社會、認識自己的探索過程,是人類自我成長的助推器,是個人突破自我的催化劑。因此,從這個意義上講,“全國大學生市場調查與分析大賽”對了解我國經濟社會現狀,促進社會健康和諧發展,幫助大學生提升自我具有重要的作用。在此,也提前祝第十屆“全國大學生市場調查與分析大賽”成功舉辦,祝各位參賽老師和同學取得優異的成績。
需要特別說明的是,由于我在理論和實踐方面的欠缺,我的一些觀點,還存在一些不足,也一定有可以改進和完善的空間,歡迎大家批評指正,我將不勝感激。
備注:
【1】本文作者李軍為南京大學社會學在讀博士,中國商業統計學會理事,江蘇省統計行業協會理事,紫金傳媒智庫特約研究員,上海萌泰數據科技股份有限公司總經理。萌泰數據是國內知名的社會科學專題數據庫和科研教學工具廠商,統計調查研究工具廠商,業界領先的智能化數據采集與分析服務供應商,面向教育科研、統計調查、社會治理、輿情分析、市場研究等領域提供一體化數據解決方案。
【2】本圖原創在風笑天老師的《社會研究方法》一書中,筆者僅在文獻法中補充了當下流行的大數據分析子類型,以及循證研究的系統評價分析子類型(可對應于風老師書中的二次分析子類型,系統評價可以采用薈萃分析技術進行量化研究,也可以進行定性的比較研究);筆者不是為了指出風老師的書中的不足,相反,筆者恰恰認為風老師的分類方式即使在大數據時代依然成立,只不過資料的存儲形式或收集方式有了升級而已。大數據的文本分析也可以認為是一種內容分析,海量的結構化數據的挖掘也可以看做是對統計資料分析的升級。筆者將大數據分析單獨列出,是因為其對大數據等計算機技術的依賴,這與傳統的文獻分析技術有了較大的變化。另外一個補充是將結構化觀察也納入實地研究的一種資料收集方式,比如在商場超市觀察以測量人流量,因此實地研究也可以開展定量分析。
——————————————————————————————————————————————————————
萌泰數據是社會科學領域知名數據服務商和科研教學工具廠商,面向社會科學教育實踐、學術研究和社會服務,提供一體化數據解決方案。目前旗下包括“銳研”和“智社”兩大子品牌。
“銳研”是萌泰數據旗下社會科學專題數據庫及科研服務平臺,旨在為學者和科研人員提供專題數據庫和科研數據采集與分析服務,以及各類社會調查研究方法工具支持。旗下產品包括五大特色數據庫、三大指數產品、六大社會調查研究工具以及智慧蜂眾包任務平臺等科研服務產品。
銳研產品矩陣
銳研中國:www.51diu.com
銳研專題數據平臺:www.ringdata.com
銳研中國官方微信公眾號
智社官方微信公眾號
Campbell中國聯盟官方微信公眾號