99re在线视频观看|日韩 欧美 国产 亚洲 制服|男人的天堂视频网站清风阁|亚洲经典激情春色另类|五月天精品视频

從質性研究到大數據方法: 超越與回歸

2019-03-27 16:36:00
admin
轉貼

社會學研究一向有定量、質性之爭,這兩種源于不同范式傳統的方法之爭,近些年似乎有分出高下的意味來。定量占據主流及有意識地搶占主流位置,質性研究方法在各方面似乎都顯現出弱勢。 如何看待不同的研究方法取向,尤其是能否理清社會學質性研究方法、傳統量化分析方法和正在興起的大數據方法之間的關系糾葛,對于未來研究當有借鑒。


一、方法之爭及其范式起源起源

討論不同方法的差異,有必要追溯學科發展的歷史起源及其傳統。社會學和人類學可以算是最相近的學科,就其早期形成的各自研究對象和領域而言,社會學研究工業社會、現代社會,人類學研究傳統社會、游牧社會、“土著”社會。

西方社會學的誕生與現代化、工業化的進展息息相關,社會學的創始人孔德一開始就將社會學置于以數學為基礎的自然科學大廈之最頂層,并將其命名為“社會物理學”,確立了實證主義、科學主義的方法導向。 而西方人類學的興起深受達爾文進化論的影響,與當時航海探險、殖民擴張的熱潮分不開。早期人類學者主要由航海家、旅行家、傳教士、商人等構成,以“他者”身份對“遠方的”原始部落、少數民族的異質文化開展考察,逐漸形成了人文主義、自然主義的方法特色。

科學主義范式的社會學自誕生起就以自然科學為樣板,借鑒和遵循近代自然科學認知原理和方法論原則,逐步形成了一整套成熟的量化分析研究方法。最具代表性的是建立在統計學意義上的問卷調查研究,包括理論假設、調查設計、資料收集、量表測量、信度效度檢驗、統計分析等環節,一般通過人為控制和區分自變量、因變量,運用回歸分析等統計學方法,確定相關性,判斷因果關系,建構數學模型。這一過程中,重要的步驟之一是概念的操作化,也就是根據研究需要把概念變為一套可測量的、能夠用數字表述的信息。譬如用五分制量表測量人們的滿意度;將幸福感分解為主觀指標和客觀指標進行測量,以建構“幸福指數”。

隨著大數據時代的到來,為區分起見,也有人把這種大多來源于抽樣調查、訪談、行政記錄和實驗設計等傳統統計方法的數據稱為“小數據”,把傳統的量化分析方法稱為“小數據”方法。

一般來說“小數據”體積小、易于快速理解、數據的讀取分析和處理都相對簡單。而大數據指“無法在可容忍的時間內用傳統IT技術和軟硬件工具對其進行感知、獲取、管理、處理和務的數據集合”。數據科學家將大數據的特點總結為4個V;Volume、Variety、Velocity、Value,即體量浩大、模態繁多、生成快速、價值巨大但密度很低。具體到量級,大數據的量級已從GB到TB再到PB級,甚至開始以EB和ZB來計數。

質性研究方法包括參與觀察、個案研究、深度訪談、焦點小組法、民族志(人種志)方法、扎根理論、敘事研究、行動研究等一整套方法體系。質性研究方法從起源上可以追溯到15、16世紀的人類學研究,但作為一種系統的方法體系得到歸納總結,是直到20世紀70年代的事情。

到20世紀初,社會工作領域興起的個案小組實務中,質性研究方法的應用被拓展到心理學、教育學領域;20世紀中葉,西方社會科學領域開始涌現各種“后現代”理論和思潮。社會學理論也從邏輯實證主義轉向闡釋和批判主義,社會學領域出現對量化研究的“反抗”思潮,這些思潮也影響、促成了質性研究方法的成熟。

雖然量化研究方法源自西方的科學主義范式,同樣也是西方思潮產物的質性研究方法卻可以在古老的東方思維中找到哲學基礎。中國古代的自然哲學是以“天人合一”的整體觀和“陰陽對立統一”的辯證觀為基點的。以中華文化為代表的東方文化思維方式著眼整體思維,注重辯證思維,擅長關聯思維,習慣類比思維,突出直覺思維。20世紀初社會學、人類學傳入中國,中國最早的社會學家多從事人類學、民族學研究,如吳文藻、潘光旦等,早期社會學研究主要使用的方法之一也是基于人類學田野工作的質性研究方法。到1979年中國社會學恢復重建,在研究方法體系上則主要引進了美國的社會學量化分析方法,科學主義范式在中國社會學研究領域成為絕對主流。20世紀90年代中期,帶有西方“后現代”色彩的質性研究方法被介紹到中國,某種程度上與中國傳統文化思維方式內在契合,也喚起了中國早期社會學所形成的人文主義傳統。

隨著我國社會學學科建設由恢復重建伊始的“拿來主義”到本土化中國化的探索越來越深入,源自不同傳統的質性研究方法和量化分析方法的分離和對立逐漸顯現且愈演愈烈。學界對這種方法孰優孰劣、以及“代表性”、“科學性”等問題莫衷一是。大數據時代的到來,為社會學研究打開了一扇新的窗戶,同時也為原本的方法之爭更添紛擾。

有觀點認為,大數據可能引發一場社會科學革命,另有觀點則認為,大數據面臨著諸多挑戰。 人們擔憂,大數據的出現有可能把質性方法和量化方法“兩張皮”進一步撕裂為“三張皮”。在此背景下,也有學者認為“方法主義是今日學界危機的根源”,呼吁“破除方法主義迷信”。應當看到,學術論爭、學派林立恰好是學科繁榮發展的表現,是學科走向成熟過程的必然。方法論爭源自“與生俱來”的不同研究傳統,面向未來也需要進一步探究其發展趨勢。


二、工具演進、機器依賴及對象變遷

從時間序列看,人類學方法的形成要稍早于社會學。質性研究方法雖然直到20世紀70年代才形成普遍認同的方法體系,但其實際的社會學應用卻要早于傳統量化分析方法。大數據方法的出現,則是直到今天才剛剛開始。因此按照出現時間的早晚,可以粗略地把社會學研究方法的發展脈絡歸納為“質性研究方法——傳統量化分析方法——大數據方法”。可以看到,這是一個由“純人工”到“機器”參與介入研究越來越多的過程。

具有鮮明人類學田野色彩的質性研究方法,強調參與、體驗、感悟、在場、情景,設身處地、將心比心,依賴于直覺、聯想、類比、領悟。要求置身于現實的社會群體生活空間,研究人們的社會活動及社會關系。其研究特點決定了質性研究方法主要是基于人工的個體勞動,很大程度上依靠人腦的直覺。即使發展到現在,口述史、影像志、深度訪談等引入了現代錄音錄像設備、計算機編輯處理工具,人的“與”、“在場”仍然是質性方法的基本要求和靈魂。

傳統量化分析方法一開始也是“全人工”收集人們特定的社會活動及社會關系的數據,并進行分析和處理的過程。早期問卷調查基本是純手工操作,隨著計算機和信息技術的發展,機器編碼識別、統計分析軟件把過去復雜的統計計算變得輕而易舉,傳統量化研究逐漸由以人工為主過渡到機器參與成分越來越多。但是,現代社會大型調查研究即使計算機全程參與,也必須以研究者主觀設計、人為主觀賦值編碼為前提。也就是說,傳統量化分析方法始終是以人工為主,機器處理作為輔助手段的研究方法。

大數據方法則依托于人類“數字化生存”的時代背景。正是云計算、云存儲、物聯網、二維碼、傳感器、GPS等互聯網技術的廣泛應用,微信微博新媒體的大規模使用,以及手機網絡支付手段的更加便捷化,人類社會的各種社交網絡、人際互動、經濟活動都被客觀記錄下來,留下“數字痕跡”,形成海量的大數據。正是由于數據量大到無法由傳統軟硬件處理,且數據具有多樣化的結構特征,所以大數據的獲取不再是通過人工采集得來,而是由“機器爬梳”來。

大數據方法主要是通過機器學習,運用適當的算法,對數據自動進行學習,識別事物間的關聯性和規律。當然,數據爬梳、分析的背后也有“人”,但這里的人已由臺前退居幕后,機器承擔了大量繁重的工作。

從質性研究到傳統量化分析方法再到大數據方法,工具的變化某種程度上見證了研究對———社會本體的變遷。從微觀層級的個體行動、人際互動,到宏大的社會系統或結構等,在不同的社會形態下有著不同的特征。質性研究源自“田野”的方法無疑帶有濃厚的傳統社會印記;傳統量化分析對應著的是現代社會,如果說這兩種方法主要研究現實社會,大數據方法則顯然是互聯網時代信息社會的產物。

在網絡愈益發達的今天,人們在網絡上的行為與現實行為具有越來越多的同一性,網絡上的個人、群體間的互動與行為,以及網絡上的組織結構都已經影響到現實社會,對人們的生產方式、生活方式、行為方式的影響之大前所未有。

譬如手機及其他即時交流工具成為個人與社會交流交往的基本中介橋梁,隨之帶來了社會關系的變化;人工智能改變了人類生產方式、生活方式,引發了職業分化的加速;物聯網、眾籌經濟正在促生新的社會價值觀;等等。這些都意味著傳統的社會關系、社會結構已經發生且仍在發生著深刻的變化。社會本體發生了改變,對于這些關系、行為、結構變化所形成的大數據進行研究,就具有現實重要性。從這一角度而言,大數據研究對于社會學的本體論意義大于方法論意義。


三、社會學科學性與人文性的融合統一

費孝通先生2003年提出“社會學是具有‘科學’和‘人文’雙重性格的學科”,這是費老晚年最重要的學科建設思想。然而,方法論視角下“雙重性格”如何融合,卻是困擾中國社會學多年未能解決的問題。大數據方法的社會學應用,或許可以為二者方法上的結合提供現實可能性和路徑。

所謂大數據方法,不是指某種程式化規范化的單一方法,而是充分運用人工智能、機器學習對大數據進行分析開發利用的一整套開放、包容、靈活的方法體系。這一方法體系既包含了數據科學家進行的借助機器的質性研究,又包含了傳統量化分析方法的延伸運用。羅瑋、羅教講也明確指出了“質性研究與定量研究的融合”是社會學大數據方法的基本內容和重要特征。

實際的大數據分析過程中方法的運用,包括了模型方法,基于混沌理論和分形理論的數值方法、隱喻方法、模擬方法等。大數據方法或者說大數據分析技術的核心之一是“數據挖掘”,是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。也被稱為知識發現(即KDD,Knowledge Discovery in Database)的這一方法,是從大型數據庫中揭示海量數據中有意義的潛在規律和提取人們感興趣的知識的處理過程。

什么是“人們感興趣的知識”首先出自于人的主觀判斷,這種主觀判斷很大程度上來自于建立在經驗基礎上的直覺。大數據方法中諸如中文自然語言處理、中文分詞技術、語義分析、情感分析或意見挖掘以及隱喻手法等,一定程度上也借鑒自質性研究。

大數據輿情分析、社會網絡分析等都需要以相應的質性研究為基礎或輔證。直覺、類比、聯想、隱喻等質性研究方法的要義同樣內在地滲透于數據挖掘全過程。某種程度上,相當于數據科學家進行借助機器的質性研究,只不過這里質性研究的“在場”體現為“在線”。

因此,一方面質性研究方法的核心理念和想象力貫穿在大數據分析過程中,另一方面傳統量化分析所依賴的統計學方法也在其中得到應用和延伸。大數據分析過程實際上體現了質性研究方法和傳統量化分析方法的有機融合。

在機器學習的算法之外,人工智能的發展帶來了更多人與機器的“融合”。以“人機回圈”、“眾機回圈” 為例。在人工智能領域, “人機回圈”是一種輔助機器決策的重要“算法”模式,其基本邏輯是,人是規劃環路的一部分,人的判斷既用于業務決策,又被反饋到機器學習算法中使其加“智能”,這一模式如同質性方法,有人的深度參與,并不斷形成反饋。

在社會問題的研究中,計算機科學家將“人機回圈”拓展為“眾機回圈”,由社會眾籌得到一些社會問題的共識,形成“自動算法+社會判斷”的反饋路,從而改進算法。 在能夠控制近億輛自動駕駛汽車的AI算法中,或影響數十億民眾政治信仰和偏好的新聞過濾算法、調節整個經濟體的資源與勞動力分配的算法中,都可以使用“眾機回圈”的反饋模式。在這一過程中,社會群體的道德、情感、文化因素進入機器學習和決策。

通過“人機回圈”、“眾機回圈”,人類價值觀與機器算法之間建立了渠道。將融合了人工智能的大數據方法用于社會學學術研究,就會發現,在人與機器的融合中,社會學研究中人文性與科學性的分離一定程度上得到了彌合。

盡管大數據已經廣泛應用于社會科學研究,但大數據方法存在著相當多的局限。就國內而言,迄今為止,社會學大數據研究取得的成果確實不多,影響也算不上大,甚至目前尚沒有明顯超過傳統量化研究的成就。

其中的核心問題有二:其一是社會學研究者數據獲取的局限,研究者利用軟件工具在網絡社交平臺進行數據爬梳挖掘,有諸如隱私權等方面的隱憂,面臨著技術平臺壁壘(通常只有大型商業企業互聯網巨頭以及政府機構、軍事國防部門、情報部門、金融機構、統計部門才能夠擁有自己強大的大數據庫)、金錢壁壘(購買真正有用的大數據需花大價錢且難以買到)等多重制約。完全意義上的大數據的開放與共享仍然面臨著諸多挑戰。其二與專業分工有關,社會學學者自身知識結構和能力存在局限。

不僅如此,由于存在信息鴻溝,并不是所有人都能在網絡上留下痕跡,大數據所指向的行動主體并非所有社會成員,而是那些有能力使用新技術媒介的群體,所以在某些情況下,大數據是有偏或有缺失的。另外,大數據方法長于相關性判斷,在因果關系的判斷上,較之傳統量化分析方法也更有難度。


四、復雜性科學整體論對簡單性科學還原論的超越

大數據方法之于社會學,也意味著研究理念、思維方式的革新。大數據方法更加著眼于整體,強調復雜性、系統性,其分析邏輯與基于“簡單性”、“還原論”思維的傳統量化分析方法迥然不同。

僅從數據結構看,大數據和“小數據”的差異明顯。數據科學家將數據信息劃分為兩大類。一類信息能夠用數據或統一的結構加以表示,稱之為“結構化數據”,如數字、符號;而另一類信息無法用數字或統一的結構表示,如文本、圖像、聲音、視頻、網頁等,稱之為“非結構化數據”。記錄人類社會生活原始狀態的未經處理的大數據是一堆亂七八糟的“非結構化數據”,模態多樣,而傳統量化分析所使用的數據是經人工設計后采集獲取的有序的數據集合,可以直接以數字或符號集表示,納入計算分析,屬于“結構化數據”。

數據結構的差異反映了大數據、“小數據”各自不同的哲學依據。近代自然科學的成功,得益于其思維方式追求精確(確定性)和量化,起步于“分析”思維———將高層的、復雜的對象分解為較低層的、簡單的對象來處理,將整體分解為部分來加以研究。從牛頓到愛因斯坦等科學大師都堅信,世界的本質在于簡單性。

建立在此基礎上的“還原論”認為,任何復雜的事物、現象都可以分解為更為簡單的各個組成部分來加以認識、描述和處理。傳統量化分析的社會學研究也遵循了相似的路徑,盡可能把復雜問題簡單化,抽象概念具象化,概念的操作化實際上就是一個“還原”的過程。

人們研究關系網絡,先界定出強關系、弱關系、弱強關系、強強關系等,并分別賦值;研究農民工的城市社會融合,要區分經濟融合、社會融合、政治融合、文化融合等不同層次再加以測量。從這一點上來看,傳統量化分析方法的哲學依據實際上是“確定性”信仰、“簡單性”原則、“還原論”思維。

不過,當近代自然科學跨入現代后,相對論力學打破了傳統的絕對時空觀,量子力學的產生進一步顛覆了我們對物質實在結構、確定性的理解,整個近代自然科學的哲學基礎被動搖。簡單性是科學家的追求,復雜性則是世界呈現的現實。社會是高度復雜的巨系統,簡化處理、量化分析當然可以解決一些特定領域的局部問題,但顯然也受到很大局限。20世紀中葉先后誕生了系統論、控制論和信息論“老三論”,耗散結構理論、協同論和突變論“新三論”。在此基礎上逐步形成了“復雜性科學”和“復雜性方法”。“整體大于部分之和”、“漲落”、“平衡”、“突變”、“涌現”等系統論思維和復雜性科學方法論崛起。這些系統論思維被認為是大數據方法的理論基礎。

對使用大數據方法的“社會計算”則界定為:“社會計算是使用系統科學、人工智能、數據挖掘等科學計算理論作為研究方法,將社會科學理論與計算理論相結合,為人類更深入地認識社會、改造社會,解決政治、經濟、文化等領域復雜性社會問題的一種理論和方法體系”,系統科學等背景被再次強調。

從結構化數據到非結構化數據,從“小數據”到大數據,從“數據分析”到“數據挖掘”,無疑是一種認識論的進步、方法論的超越,是“復雜性科學”對“簡單性科學”方法的超越,系統整體論對分析還原論的超越。需要指出的是,傳統量化分析方法在揭示現實世界上,仍有著獨特的優勢。傳統量化分析方法,尤其是其中的統計抽樣調查方法,具有低成本的優勢和優良的代表性,更能反映總體特征,較為全面真實地揭示事物間的關系。而在有些狀況中,大數據指向的主體有偏或缺失,會在反映全局和整體方面落入下風。當然,隨著互聯網技術的普及和廣泛運用,這種缺憾會逐漸得到改善。


五、數字化時代社會學想象力的回歸

或許是長期進化過程中大自然賦予人腦的功能,人類有一種認知真理的直覺方法,與邏輯理性主義的求知傳統完全不同。好的直覺超越邏輯。不同時期的人類學研究認為,“在人類知識積累的大多數案例中,頓悟,或者創造性,不是一種理性的和邏輯的知識創造,而是一種由直覺而產生的結果”,“在我們使用邏輯獲得知識之時,我們更要注意到存在靠直覺的感受性獲得知識的途徑”。

基于經驗的直覺正是質性研究方法的核心,因此,盡管長期以來傳統量化分析方法在中國社會學研究中居主導地位,學者們也不得不承認:中國社會學“最優秀的研究在方法論上更多采用的是質性方法”社會學研究無論任何時候都不能忽視“社會學想象力”。無論東西方的社會學家,都將社會學想象力視為社會學的核心和靈魂,強調參與、在場、理解的質性研究方法無疑是最能體現和直接發揮社會學想象力的方法體系,也正因此,質性研究中“人”的作用尤為重要。

而傳統量化研究風靡的背后,或多或少隱藏了學術研究工具化的傾向,非模型、非數據不成文。社會研究愈來愈工具化,幾乎成為一個純技術問題,作為研究主體的個體的社會學想象力在這一過程中被大大削弱了。

大數據方法的出現,一方面構建了可持續完善和豐富的數據集和分析工具,其可用性、共享性、協作性進一步大大增強,提供了人文社會科學學者大規模協作的可能;另一方面這種協作合作研究方式,是要求每一個參與者都發揮獨立作用和主觀能動性的“系統工程”。

非結構化的大數據對于普通人而言只是一堆無法理解也就毫無意義的數據。而數據科學家所擁有的大數據分析處理能力,說到底是一種復雜系統思維能力。大數據方法本質上依然是數據分析,但已經在傳統量化分析方法基礎上發生了質的飛躍。大數據方法的開放性延伸和拓展了傳統量化分析方法的空間。大數據方法沒有固定模式,只能根據研究目的、研究對象靈活地尋求和確定算法,而算法的優劣取決于研究者的社會學想象力。

大數據方法也為質性研究方法的發展帶來新的機遇。其一體現在,質性研究方法的核心要素是“參與”、“體驗”,深入生活、設身處地,需要花費較長的時間深入極為有限的空間。但當傳統社會的“田野”演化為信息時代“萬物互聯”的網絡,人們可以借助大數據方法,對數十年、上百年乃至更長時間的人類活動所形成的大數據記錄進行研究,跨越時空的約束,實現借助于網絡的“在場”研究。

對依托于網絡的人類的各種社會活動與行為,也可以通過“在線”的方式實現“在場”研究,而不一定需要深入現場、持續幾十年。其二,質性研究的“口述史”、“影像文化志”等具體方法,有了人工智能、云計算的幫助,其圖像識別、語義分析、詞頻分析的效率也將大大提高。當然,網絡空間畢竟有別于現實空間,“在線”與“在場”仍然有差異,不能因此否定深入真實的社會生活的重要性。

互聯網時代網絡社會與真實社會之間的聯結愈來愈密,“虛擬社會”越來越趨近于真實社會。傳統社會所對應的社會學想象力,也需要“升級”為信息社會的社會學想象力。要從浩如煙海而又雜亂無章的大數據中“爬梳”蛛絲馬跡、“挖掘”隱藏價值,需要“一事一策”地設計“算法”。從形式上看,似乎機器的介入程度越來越高,逐漸替代了人;但實質上,機器學習的背后,作為主體的人的作用、人腦的功能重新被突出。大數據研究是社會學研究個性化的回歸,是“機器”與“人”的融合,更為重要的意蘊,是數字化時代社會學想象力的回歸。

當我們把質性研究方法的起源歸結為來自于人類學傳統,可以發現其內在的思想淵源契合于人類早期認識世界自發的樸素的整體論哲學;而伴隨著近代自然科學誕生和發展的傳統量化分析方法,其認識論依據是基于“簡單性學”的還原論哲學;互聯網時代大數據的方法論意蘊,則是“復雜性科學”視域下的系統整體論哲學。

由此,從質性研究方法、傳統量化分析方法到大數據方法,顯現的是“樸素整體論———分析還原論———系統整體論”的演進軌跡,這是一種否定之否定意義上的超越與回歸。已經到來的大數據時代必將是一個方法多元的時代,而其中的核心議題是,社會學研究方法呼喚社會學想象力的回歸。


發表評論
評論通過審核后顯示。
移動訪問