我們常說(shuō)大數(shù)據(jù),但是很多人不知道什么是真正的大數(shù)據(jù),大數(shù)據(jù)怎么應(yīng)用?!独顺敝畮p》的作者吳軍在新書(shū)《智能時(shí)代》里專(zhuān)門(mén)講了大數(shù)據(jù)的特點(diǎn)和應(yīng)用領(lǐng)域。
首先,大數(shù)據(jù)比傳統(tǒng)數(shù)據(jù)牛的地方,不光是體量大,還有兩個(gè)重要特征,一個(gè)是多維度,一個(gè)是時(shí)效性。
先說(shuō)多維度是什么意思。百度曾經(jīng)發(fā)布過(guò)一個(gè)統(tǒng)計(jì)結(jié)果,叫《中國(guó)十大“吃貨”省市排行榜》。榜單上一些內(nèi)容還挺有趣,像北京網(wǎng)友最經(jīng)常問(wèn)的問(wèn)題是“某某的皮能不能吃”;內(nèi)蒙古網(wǎng)友最關(guān)心“蘑菇能吃嗎”,寧夏網(wǎng)友最關(guān)心的竟然是“螃蟹能吃嗎”。這個(gè)榜單的數(shù)據(jù)是怎么來(lái)的呢?百度沒(méi)做民意調(diào)查和飲食習(xí)慣的研究,而是從“百度知道”的7700萬(wàn)條和吃有關(guān)的問(wèn)題里“挖掘”出來(lái)的。
為什么說(shuō)這件事就反映了大數(shù)據(jù)的多維度呢?因?yàn)?ldquo;百度知道”的數(shù)據(jù)維度很多,不光涉及食物的做法、吃法、成分、價(jià)格,還能收集一些隱含信息。比如提問(wèn)者或回答者的個(gè)人信息,用的是手機(jī)還是電腦,用什么瀏覽器。這樣,百度就可以得到不同年齡、性別和文化背景的人的飲食習(xí)慣。如果再結(jié)合每個(gè)人使用的手機(jī)或電腦的品牌和型號(hào),分析他們的收入,百度甚至能分析出不同收入階層的人的飲食習(xí)慣。也就是說(shuō),這些隱形維度對(duì)于飲食習(xí)慣雖然沒(méi)有直接影響,但是如果把原來(lái)看上去沒(méi)關(guān)系的維度聯(lián)系起來(lái),經(jīng)過(guò)挖掘、加工和整理,就能得出有意義的統(tǒng)計(jì)規(guī)律。
接下來(lái)我們看看大數(shù)據(jù)的時(shí)效性,它幫助我們做到了很多過(guò)去做不到的事情,比如城市的智能交通管理。以前沒(méi)有智能手機(jī)和智能汽車(chē),很多大城市雖然有交通管理中心,但它們收集的路況信息最快也要滯后20分鐘。用戶(hù)看到的,可能已經(jīng)是半小時(shí)前的路況了。這樣的信息就沒(méi)啥價(jià)值。但是,能定位的智能手機(jī)普及以后可就不一樣了。大部分用戶(hù)開(kāi)放了實(shí)時(shí)位置信息,做地圖服務(wù)的公司就能實(shí)時(shí)得到人員流動(dòng)信息,并且根據(jù)流動(dòng)速度和所在位置,區(qū)分步行的人群和汽車(chē),然后提供實(shí)時(shí)的交通路況信息,給用戶(hù)帶來(lái)便利。這就是大數(shù)據(jù)的時(shí)效性帶來(lái)的好處。
光擁有大數(shù)據(jù)還不夠,還得學(xué)會(huì)利用大數(shù)據(jù)。接下來(lái)給你講個(gè)故事,看看美國(guó)警察是怎么用大數(shù)據(jù)思維來(lái)打擊毒品犯罪的。
毒品一直是美國(guó)社會(huì)的毒瘤。過(guò)去,美國(guó)警方緝毒重點(diǎn),是切斷南美洲的毒品供應(yīng)。但后來(lái)他們發(fā)現(xiàn),這樣不行,因?yàn)橛行┠芴釤挾酒返闹参铮热绱舐?,可以在家里種。有人就買(mǎi)下豪宅,外邊的花園里種上鮮花,里邊裝上LED燈,種盆栽大麻。每年賣(mài)大麻的錢(qián)除了給豪宅分期付款,攢起來(lái)還夠給第二座豪宅付首付。警察即使懷疑也不能輕易進(jìn)去搜查。但是到了大數(shù)據(jù)時(shí)代,通過(guò)分析智能電表收集的用電量,就能抓住很多在家里種大麻的人。
為什么說(shuō)這是用大數(shù)據(jù)思維解決的問(wèn)題呢?因?yàn)橐郧暗睦鲜诫姳碇荒苡涗浢考颐吭碌挠秒娏?,而智能電表可以記錄用電模式。種大麻的房子用電模式跟普通住戶(hù)不一樣,只要把每家每戶(hù)的用電模式跟典型的居家用電模式進(jìn)行比對(duì),就能圈定一些犯罪嫌疑人。
這個(gè)案例體現(xiàn)了用大數(shù)據(jù)思維解決社會(huì)問(wèn)題的亮點(diǎn):首先用統(tǒng)計(jì)規(guī)律和個(gè)案對(duì)比,做到精準(zhǔn)定位。然后呢,在取證時(shí)利用相關(guān)性代替直接證據(jù)。最后,執(zhí)法成本大幅下降。這都是大數(shù)據(jù)帶給社會(huì)的便利。
在商業(yè)領(lǐng)域,大數(shù)據(jù)也有更廣泛的應(yīng)用。比如一家連鎖百貨通過(guò)分析顧客購(gòu)買(mǎi)的商品,判斷顧客的身份和購(gòu)物偏好,有針對(duì)性地推送促銷(xiāo)信息,營(yíng)業(yè)額取得了快速增長(zhǎng)。
因此說(shuō),大數(shù)據(jù)能帶給商家更多的機(jī)會(huì),也給社會(huì)更多便利。未來(lái),在商業(yè)社會(huì),誰(shuí)能占有更多更有價(jià)值的數(shù)據(jù),誰(shuí)就能在競(jìng)爭(zhēng)激烈的環(huán)境里快人一步。
大數(shù)據(jù)處理信息服務(wù)商金盛網(wǎng)聚WJFabric認(rèn)為,任何一項(xiàng)新技術(shù)的發(fā)展,由小眾變?yōu)橹髁鞯闹匾獦?biāo)志便是,其體現(xiàn)出的價(jià)值從商業(yè)價(jià)值拓展為社會(huì)價(jià)值。如果僅僅止步于商業(yè)化,那么意味著其應(yīng)用領(lǐng)域已有“天花板”所限,進(jìn)而也就很難得到更廣泛的支持。大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用已漸成常態(tài),作為社會(huì)發(fā)展的新基建之一,大數(shù)據(jù)應(yīng)用的商業(yè)化只是“小試牛刀”,更大的歷練在于社會(huì)固有問(wèn)題的解決。社會(huì)在發(fā)展的過(guò)程中“復(fù)雜程度”越來(lái)越高已是事實(shí),如何實(shí)現(xiàn)針對(duì)具體問(wèn)題的“化繁為簡(jiǎn)”,大數(shù)據(jù)技術(shù)從掌握事實(shí)的角度提供了必要的資源。同時(shí)借鑒已掌握的經(jīng)驗(yàn),通過(guò)對(duì)數(shù)據(jù)的挖掘與利用,為目標(biāo)問(wèn)題的解決提供必要條件。
金盛網(wǎng)聚(北京)科技有限公司成立于2012年,是一家數(shù)據(jù)處理與信息咨詢(xún)服務(wù)商,公司擁有自主核心技術(shù)與服務(wù)咨詢(xún)的團(tuán)隊(duì), 公司“WJFbaric-互聯(lián)網(wǎng)大數(shù)據(jù)信息監(jiān)測(cè)SaaS平臺(tái)”目前注冊(cè)使用客戶(hù)將近上萬(wàn)個(gè),為企業(yè)、政府、學(xué)術(shù)機(jī)構(gòu)、成功人士等提供在線信息收集、展示、閱讀、存儲(chǔ)的免費(fèi)平臺(tái),公司遠(yuǎn)景致力于通過(guò)數(shù)據(jù)+計(jì)算形成可視化的人工智能決策平臺(tái)。