信息科學(xué)家杰文•韋斯特(Jevin West)和生物學(xué)家卡爾•伯格斯特龍(Carl Bergstrom)在華盛頓大學(xué)開設(shè)了一門新課,課程的名字叫做“在大數(shù)據(jù)時代拆穿胡扯”(Calling Bullshit in the Age of Big Data)。韋斯特和伯格斯特龍認(rèn)為,人們很容易就能識別出口頭上的胡扯,畢竟我們已經(jīng)使用語言數(shù)千年了,但數(shù)據(jù)和圖表是19世紀(jì)80年代才流行起來的。由于數(shù)據(jù)呈現(xiàn)出的復(fù)雜性和準(zhǔn)確性很容易高效地偽裝成胡扯的信息,導(dǎo)致人們上當(dāng)受騙。
事實上,大數(shù)據(jù)行業(yè)本身也存在著弊端。目前通過互聯(lián)網(wǎng)應(yīng)用,對于大量數(shù)據(jù)的產(chǎn)生與收集成為現(xiàn)實?;诤A繑?shù)據(jù),人工智能可以通過數(shù)據(jù)匯集進行學(xué)習(xí),因此我們生活的每個角落都可以被數(shù)據(jù)化。但大數(shù)據(jù)行業(yè)遇到的問題是,擁有數(shù)據(jù)的和能夠處理數(shù)據(jù)的往往是兩個不同人群,可能是兩個不同的公司,相互之間不一定有信任。如是,數(shù)據(jù)將不能得到實時分析,這將導(dǎo)致所得出的結(jié)論未必客觀公正。有專家推薦了一個新型算法,叫做同態(tài)加密,這個新的算法能夠在加密的數(shù)據(jù)上學(xué)習(xí)到里面的智慧,不一定要看到數(shù)據(jù)本身,這樣的話,數(shù)據(jù)擁有者和數(shù)據(jù)處理者能夠分開,能夠建立信任基礎(chǔ)上的合作。
此外,伯格斯特龍表示,對于普通用戶來講,想要拆穿數(shù)據(jù)的胡扯也很簡單,需要的是一些常識和思維習(xí)慣。兩位教授提供了一些建議:首先,看到一則信息時,你可以問自己三個問題:誰告訴我的?他是怎么知道的?他想向我兜售什么?其次,如果一個數(shù)據(jù)看起來特別好,好的都不那么真實,那很可能就不是真的。尤其是那些和你的個人觀點或者經(jīng)歷十分一致的結(jié)論,特別值得懷疑。第三,警惕不公正的比較。比如,有人告訴你,觀看特朗普就職典禮直播的人數(shù)要比看奧巴馬就職直播的人數(shù)多,那是因為2017年看直播比奧巴馬就職那年容易多了。第四,要知道機器也可能有偏見。比如,用來預(yù)測個人犯罪行為的計算機模型對少數(shù)族裔表現(xiàn)出了偏見,很有可能是因為用來“訓(xùn)練”算法的數(shù)據(jù)反映了現(xiàn)有的文化偏見。機器和給他們編程的人一樣容易犯錯,而且不會因為感到內(nèi)疚而糾正自己的行為。
大數(shù)據(jù)處理信息服務(wù)商金盛網(wǎng)聚WJFabric認(rèn)為,對于任何一種新興資源的開發(fā)和利用,都需要一個批判、漸進的過程。單純的依賴新生事物,徹底的摒棄過往經(jīng)驗都不是明智的處理方法。大數(shù)據(jù)作為新近科技的代表,預(yù)示著新技術(shù)風(fēng)口的出現(xiàn),但對于大數(shù)據(jù)的認(rèn)識、利用仍處于初級階段,需要在實踐中總結(jié)其使用規(guī)律,打磨實操模式,抱有對待一種新工具的態(tài)度,而非評判事物的方式。
金盛網(wǎng)聚(北京)科技有限公司成立于2012年,是一家數(shù)據(jù)處理與信息咨詢服務(wù)商,公司擁有自主核心技術(shù)與服務(wù)咨詢的團隊, 公司“WJFbaric-互聯(lián)網(wǎng)大數(shù)據(jù)信息監(jiān)測SaaS平臺”目前注冊使用客戶將近上萬個,為企業(yè)、政府、學(xué)術(shù)機構(gòu)、成功人士等提供在線信息收集、展示、閱讀、存儲的免費平臺,公司遠(yuǎn)景致力于通過數(shù)據(jù)+計算形成可視化的人工智能決策平臺。