我們往往覺(jué)得,數(shù)據(jù)是跟科學(xué)或者經(jīng)濟(jì)有關(guān),而跟讀歷史好像沒(méi)什么關(guān)系。但是,著名經(jīng)濟(jì)學(xué)家、耶魯大學(xué)終身教授陳志武對(duì)此有不同看法。近幾年,陳志武一直在推動(dòng)用量化方法來(lái)研究歷史。最近,他在《經(jīng)濟(jì)觀察報(bào)》上發(fā)布了一篇文章,專門(mén)談了量化史學(xué)研究的價(jià)值,里面有很多顛覆我們習(xí)慣認(rèn)知的觀點(diǎn)。
陳志武教授認(rèn)為,原先的歷史研究主要是“細(xì)讀個(gè)案”的方法,這種方法很好,但當(dāng)面對(duì)超大規(guī)模的資料時(shí),這種方法就行不通了。就拿中國(guó)的近代史來(lái)說(shuō),光是清朝有關(guān)刑事案件的奏疏,就有將近60萬(wàn)本,加在一起就是1800萬(wàn)頁(yè),這么多資料,很難逐個(gè)細(xì)讀。而且,面對(duì)這么多資料,無(wú)論研究者持哪種假設(shè),往往都能從里面找到合適的論據(jù),這就使得同一段歷史被解讀出不同的結(jié)論,甚至有“歷史被任意化妝”的嫌疑。要想改變這種“偏重樹(shù)木而忽視森林”的局面,就必須引入大樣本,用大數(shù)據(jù)的方法研究歷史。
那么,大數(shù)據(jù)量化方法為什么能幫我們看懂歷史呢?陳志武主要談了三個(gè)方面的價(jià)值:
第一,文化是很難量化的,但引入大數(shù)據(jù)方法,就可以讓文化這個(gè)似乎看不見(jiàn)摸不著的東西,也變得可以量化。比如我們都說(shuō)儒家文化過(guò)去兩千多年對(duì)中國(guó)社會(huì)影響巨大,但是用什么來(lái)證明呢?這時(shí)大數(shù)據(jù)就發(fā)揮作用了。
有學(xué)者統(tǒng)計(jì)了清朝1644年到1910年間,山東107個(gè)縣的農(nóng)民暴動(dòng)情況,他們發(fā)現(xiàn),山東各縣發(fā)生農(nóng)民暴動(dòng)的頻次和當(dāng)?shù)乜讖R的數(shù)量成反比,也就是說(shuō),孔廟數(shù)量越多,暴動(dòng)次數(shù)就越少。在排除了收入水平、教育水平、社會(huì)流動(dòng)性等因素后,基本可以推測(cè),受儒家文化影響越深的地區(qū),家族宗族的網(wǎng)絡(luò)越堅(jiān)固,在面對(duì)災(zāi)荒沖擊時(shí),宗族內(nèi)部互通互助的程度就越高,這就降低了人們走投無(wú)路、訴諸暴力的幾率。這樣就從一個(gè)角度證明了儒家文化對(duì)社會(huì)的影響力。
量化研究的第二個(gè)價(jià)值,是幫助我們檢驗(yàn)一些歷史假說(shuō),這些假說(shuō)往往都是我們根深蒂固的觀念。比如關(guān)于傳統(tǒng)中國(guó)社會(huì)的高利貸,我們的觀念中,放貸的往往占據(jù)優(yōu)勢(shì)地位,欠債的如果還不上錢(qián),很可能會(huì)被債主逼得家破人亡。那么,到底真實(shí)情況到底是什么樣的呢?陳志武就曾經(jīng)連同幾位學(xué)者一起,用量化的方法做了研究,他們選取了1732年到1895年間,官方記載的5000條因借貸糾紛引發(fā)的命案,結(jié)果發(fā)現(xiàn),如果貸款沒(méi)有利息,那么被打死的一方更可能是借錢(qián)的一方,而如果貸款利率越高,那么貸方被打死的幾率就越大,也就是說(shuō),放高利貸的反倒面臨更高的生命危險(xiǎn)。陳志武分析,這恰恰說(shuō)明高利貸的成因之一,就是民間借貸背后包含了不小的生命風(fēng)險(xiǎn),這些高生命風(fēng)險(xiǎn)迫使借貸利率必須高,否則沒(méi)有人愿意把錢(qián)放貸出去。
量化研究的第三個(gè)價(jià)值,是能夠帶來(lái)新的認(rèn)知,引出新的研究話題和視角。比如,陳志武曾參與統(tǒng)計(jì)了中國(guó)從秦朝開(kāi)始的658個(gè)皇帝的死因,結(jié)果發(fā)現(xiàn),有38%左右的皇帝死于非命,比普通人死于非命的概率高1000多倍。同時(shí),陳志武還統(tǒng)計(jì)了公元600年到1800年間歐洲的1513個(gè)國(guó)王,死于非命的比例是22%,大概是中國(guó)的一半多。
我們可以推測(cè),中國(guó)皇帝因?yàn)闄?quán)力更大,所以引發(fā)的爭(zhēng)奪也越激烈,殺死皇帝帶來(lái)的好處實(shí)在太有誘惑力了,所以才讓皇帝成了“高危職業(yè)”。而歐洲在上層制度建設(shè)方面,很早就走上了改良的發(fā)展軌道,權(quán)力制衡做得更好,權(quán)力交接的制度更完善,或者說(shuō)皇帝的權(quán)力沒(méi)那么大,所以皇帝死于非命的比例會(huì)低很多。
大數(shù)據(jù)處理信息服務(wù)商金盛網(wǎng)聚WJFabric認(rèn)為,大數(shù)據(jù)之所以能夠說(shuō)明問(wèn)題,得出有別于慣常思維的結(jié)論,關(guān)鍵在于其選擇數(shù)據(jù)樣本的真實(shí)性。初選的數(shù)據(jù)必然魚(yú)龍混雜,但經(jīng)過(guò)層層篩選與處理,最終支持結(jié)論的數(shù)據(jù)必以真實(shí)為基礎(chǔ)。數(shù)據(jù)收集、處理是一個(gè)動(dòng)態(tài)的過(guò)程,以金盛網(wǎng)聚WJFabric旗下“大數(shù)據(jù)信息監(jiān)測(cè)系統(tǒng)”為例,該系統(tǒng)能夠根據(jù)用戶需要關(guān)注的領(lǐng)域?qū)ヂ?lián)網(wǎng)指定渠道進(jìn)行7*24小時(shí)不間斷的數(shù)據(jù)采集,再依據(jù)決策者最需要信息層層分解與提煉,實(shí)現(xiàn)從95%相關(guān)信息中找出最具價(jià)值的20%有用信息;同時(shí)也可以對(duì)社會(huì)化碎片信息歸類、統(tǒng)計(jì)形成不同維度的趨勢(shì)分析和市場(chǎng)調(diào)研,真正了解消費(fèi)者的最新觀點(diǎn)和趨勢(shì)。正是這樣動(dòng)態(tài)化的工作機(jī)理保證了數(shù)據(jù)樣本的客觀性,從而在源頭上確保了后期數(shù)據(jù)處理結(jié)果的可信度。
金盛網(wǎng)聚(北京)科技有限公司成立于2012年,是一家數(shù)據(jù)處理與信息咨詢服務(wù)商,公司擁有自主核心技術(shù)與服務(wù)咨詢的團(tuán)隊(duì), 公司“WJFbaric-互聯(lián)網(wǎng)大數(shù)據(jù)信息監(jiān)測(cè)SaaS平臺(tái)”目前注冊(cè)使用客戶將近上萬(wàn)個(gè),為企業(yè)、政府、學(xué)術(shù)機(jī)構(gòu)、成功人士等提供在線信息收集、展示、閱讀、存儲(chǔ)的免費(fèi)平臺(tái),公司遠(yuǎn)景致力于通過(guò)數(shù)據(jù)+計(jì)算形成可視化的人工智能決策平臺(tái)。