大數據、數據科學與管理學研究
- 2016-12-09 10:17:37
- admin 轉貼
一般而言,大數據與數據科學兩個概念常常被交替使用。事實上,“大數據”指可收集和整理的、規模巨大、形式多樣的數據。最廣為人知的大數據定義是Gartner給出的大數據的3V特性:巨大的數據量(Volume)、數據的快速處理(Velocity)、多變的數據結構和類型(Variety)。這三個屬性揭示了通過大數據生產知識的復雜性。“數據科學”目標是通過發展分析模型,以捕捉和分析數據中的潛在模式,并加以可視化。數據科學強調對數據的構成、屬性的系統分析,探討這些數據在推論中的作用,包括推斷的置信力。大數據與數據科學作為新的工具,有發展管理學理論的潛力。
作者認為,當前管理學的研究模型都是析因分析或事后分析(post hoc analysis),所以大數據在數據的快速處理(Velocity)方面的特性,對于管理學學者而言可能并不是很重要,而規模大和多樣性更具有潛在意義。作者基于這兩個維度,建構了數據范圍(Data Scope)和數據結構(data granularity)兩個概念。
(1)數據范圍指的是一系列變量和人口總體或者對每個參與者的巨量觀測,而不是以往的抽樣和樣本。大規模增加的觀測和更加廣泛的人口范圍使得研究從樣本轉向了總體,研究者有可能收集到總體的數據,就可以擺脫以往研究中樣本選擇性、偏差的限制。例如對企業組織的研究,可以通過電子郵件溝通、辦公室進出、射頻識別標簽、可穿戴傳感器、瀏覽器、移動電話等方式和技術收集到所有員工的數據,且是持續不間斷數據。Chaffin and colleagues (2015)等學者已經可穿戴傳感器的可行性,他們使用藍牙傳感器測量行動者之間面對面的物理距離變化,用麥克風捕捉語言活動,以此探測社會網絡中的結構。
(2)數據結構要表達的是對要素結構特征的直接測量,而不是通過數據進行數字推斷。在一項關于員工壓力的研究中,數據的結構精細度包括了基于面部識別模式或生物測定學的情緒測量,如在一份工作或任務中每分鐘的心跳頻率,就不需要像以往那樣進行問卷調查或訪談。在社會網絡分析中,研究者可以通過監測員工之間的溝通內容與類型來分析他們的社會網絡,這可以取代以往通過回顧的方式收集他們互動的數據。
大數據與數據科學的上述特征使得管理學學者可以發現新的問題,發展新的理論,以及為現有問題提供更好的答案。如下圖1所示,以數據范圍和數據結構為兩個維度,展示了大數據為管理學提供更好答案和新問題的可能性。
(1)關于為現有問題提供新答案。數據科學技術使得研究者獲取更多即時、精確的信息以檢驗現有理論成為可能。如此,研究者并可以獲得對效應值及其置信區間更為準確的估計。效應值的精確估計可以使研究結論的應用變成可能,而不僅僅是進行行為研究。
更好的答案還可以來自建立清晰的因果機制。例如在社會網絡研究中,時間維度常常是缺失的,關于社會交往的時間先后順序常常難以調查到,因此很難確定是否網絡結構對行為有影響,反之亦然。在大數據時代,收集持續性的電郵或其他通訊工具內的信息成為可能,它使研究者可以測量網絡與行為的動態變化情況。
此外,對于稀有事件,如管理學中的組織應對災難、風險行為和系統彈性等問題,大數據使得這些事件相對不再那么稀有,便于從事研究分析。
(2)關于新問題。隨著數據在范圍和結構上的擴展升級,使得發現和探索以往未曾研究過的新問題成為可能。范圍廣泛又精細的數據可以開展對移動、溝通、物理空間和合作類型等新領域的研究,深入分析潛在合作、團隊動態變化、決策、空間環境、工作場所設計和實際合作之間的內在因果機制。例如,跟蹤電話使用與空間靠近的過程,并可以深入分析個體是否在工作或家中耗費太多時間在溝通技術和社會情境的注意力分配上。研究表明,時間耗費在電子郵件上增加了工作中或家中憤怒和沖突的可能性(Butts, Becker, & Boswell, 2015)。這個分析方法還可以擴展到物理和社會突發事件,工作性質,工作績效的結果,以及生活質量的研究中。此外,關于顧客的購買決策和社會反饋機制的數據,以及補充數字支付和交易的數據,便可以深入研究創新和產品選擇,以及對特定客戶進行市場劃分。基于移動平臺的電子貨幣,通過分析電話信貸、商品與服務的交易,為社會和金融延伸品的創新提供了非常好的機會。
新問題也可以來自現有理論,例如,一旦研究者可以觀察和分析電子郵件溝通火災在線數據,就可以回答他們所關注的管理層決策過程。研究過程中可以使用非結構性的視頻、圖片數據,并通過臉部識別情緒。
總之,要重新檢驗理論,發現新問題,學者們需要不斷探索和接受來自數據范圍和數據結構兩個維度的數據處理挑戰。現在,企業內部的數據,以及一些開放數據更加容易獲得,新的數據源和分析方法將促進管理學繼續發展。