“最近,P2P平臺連環(huán)爆雷。回歸到金融的本質(zhì),風(fēng)控的作用將變得越來越重要。大數(shù)據(jù)如何更好地賦能金融科技,這個(gè)風(fēng)口剛剛來到。”一家數(shù)據(jù)公司的負(fù)責(zé)人做了如上表述。
挖掘數(shù)據(jù)藍(lán)海
“這個(gè)行業(yè)看似紅海,其實(shí)是藍(lán)海。”一家數(shù)據(jù)征信公司的創(chuàng)業(yè)者表示?;ヂ?lián)網(wǎng)的出現(xiàn),改變了數(shù)據(jù)采集的方式,增加了新的數(shù)據(jù)緯度,也提升了獲取數(shù)據(jù)的效率。但是,數(shù)據(jù)的有效性和對獨(dú)特?cái)?shù)據(jù)源的掌控與挖掘能力,依然制約著大數(shù)據(jù)行業(yè)的發(fā)展。
“PC端數(shù)據(jù)的用量已經(jīng)越來越小了,而且越來越不精準(zhǔn)。”一家專注移動端數(shù)據(jù)服務(wù)公司的創(chuàng)業(yè)者這樣評價(jià)PC端數(shù)據(jù)。
隨著移動互聯(lián)網(wǎng)的普及,智能終端和移動App的發(fā)展,越來越多的用戶將上網(wǎng)行為從PC端過渡到移動端,交互數(shù)據(jù)顯得越來越重要。
據(jù)介紹,相比PC端,移動端的IT性更強(qiáng)。比如PC端瀏覽器的收藏條可以被要求重置,跟使用者的關(guān)聯(lián)時(shí)間短,對用戶的刻畫能力并不強(qiáng);而移動端的手機(jī)號、IDFA等數(shù)據(jù),跟設(shè)備ID之間的關(guān)聯(lián)是持久性的,大量的行為數(shù)據(jù)和情景數(shù)據(jù)可以對用戶做出更精準(zhǔn)的分析。
“而且,傳統(tǒng)數(shù)據(jù)公司擁有的數(shù)據(jù)更多是宏觀的、偏靜態(tài)的數(shù)據(jù),移動端的數(shù)據(jù)是偏動態(tài)、偏實(shí)時(shí)的數(shù)據(jù)。”
眾所周知,數(shù)據(jù)源是數(shù)據(jù)服務(wù)公司第一原動力。
據(jù)了解,在確保合規(guī)的前提下,數(shù)據(jù)來源主要可以分為幾類:第一類是移動設(shè)備,包括App、微信小程序等移動端產(chǎn)品,可以直接在用戶授權(quán)的前提下獲得用戶的相關(guān)信息。第二類是跟各個(gè)機(jī)構(gòu)的數(shù)據(jù)交換與合作,比如商戶授權(quán)的回流數(shù)據(jù),通過數(shù)據(jù)公司的評估模型進(jìn)行分析處理、脫敏后,就可以形成標(biāo)簽級數(shù)據(jù)。
數(shù)據(jù)的價(jià)值在于對數(shù)據(jù)用途的定義,而數(shù)據(jù)本身的場景屬性決定了數(shù)據(jù)的主要用途。
“以BAT為例,百度專注搜索,騰訊深挖社交,阿里聚焦電商。這三個(gè)不同的場景衍生出了不同的業(yè)務(wù)。其實(shí),線下零售也是很重要的消費(fèi)場景,通過有效手段對這些消費(fèi)數(shù)據(jù)進(jìn)行分析,同樣可以衍生出各種服務(wù)。”
“線下數(shù)據(jù)和線上數(shù)據(jù)完全匹配還是很難。有一部分?jǐn)?shù)據(jù)靠機(jī)器是無法自動實(shí)現(xiàn)的,還是得靠人。”一位大數(shù)據(jù)行業(yè)的資深專家認(rèn)為,線下的數(shù)據(jù)有兩大難點(diǎn):一是從線下到線上的過程中,如果是用人工進(jìn)行輸入或者采集,整個(gè)流程將非常不嚴(yán)謹(jǐn)。
“比如一個(gè)地址可能會有二三十種不同的輸入方法,這個(gè)是一點(diǎn)。另外一點(diǎn),從線下到線上的過程中,如果要是采集的方法,比如照一張相片或者一張銀行打出來的賬單,現(xiàn)在的技術(shù)很難識別得非常完美,這就變成了一個(gè)非結(jié)構(gòu)化的數(shù)據(jù)。如果要想用非結(jié)構(gòu)化的數(shù)據(jù),就需要用結(jié)構(gòu)科學(xué)進(jìn)行一些模糊匹配處理,會有很高的錯(cuò)誤率。”
“如果是從線上直接抓取數(shù)據(jù)的話,抓來的時(shí)候就是一個(gè)結(jié)構(gòu)化的數(shù)據(jù),然后在整合、分析、最后的應(yīng)用過程中,都有巨大的優(yōu)勢。”
突破應(yīng)用困境
“從數(shù)據(jù)公司到金融機(jī)構(gòu),怎樣合規(guī)地利用數(shù)據(jù)創(chuàng)造出商業(yè)價(jià)值,怎樣充分挖掘大數(shù)據(jù)的底層價(jià)值,提煉出更強(qiáng)大的風(fēng)控能力?其實(shí),還有很多事兒要做。”
“輸出形態(tài)并不是把這些數(shù)據(jù)拿出來,這些數(shù)據(jù)公司也不會拿出來。我們會根據(jù)金融場景的需要,深入這些數(shù)據(jù)的底層建立風(fēng)險(xiǎn)模型,做一個(gè)脫敏化的輸出。既保證了安全合規(guī),同時(shí)底層數(shù)據(jù)的風(fēng)控價(jià)值也得到了充分的挖掘和提煉。”
一個(gè)值得關(guān)注的事實(shí)是:在國外,數(shù)據(jù)源和數(shù)據(jù)使用者,兩者明顯區(qū)別開。數(shù)據(jù)運(yùn)營商比如法院,會把數(shù)據(jù)上傳到征信機(jī)構(gòu),征信機(jī)構(gòu)再給使用者。而在國內(nèi),數(shù)據(jù)源和使用者往往是同一批人。這也導(dǎo)致了數(shù)據(jù)公司的商業(yè)模式與收費(fèi)標(biāo)準(zhǔn)體系難以建立。
據(jù)了解,在美國的個(gè)人信用體系下,“數(shù)據(jù)”是由益博睿(Experian)、艾克菲(Equifax)、環(huán)聯(lián)(TransUnion)為代表的三大征信機(jī)構(gòu)提供信息,并按合同規(guī)定從征信機(jī)構(gòu)購買信用報(bào)告。
目前,國內(nèi)基本成型的個(gè)人征信格局是“央行征信局+8家準(zhǔn)牌照擁有者+規(guī)模不等的能夠提供征信服務(wù)的放貸機(jī)構(gòu)”。
按照《征信業(yè)管理?xiàng)l例》和《國家發(fā)展改革委關(guān)于中國人民銀行征信中心服務(wù)收費(fèi)標(biāo)準(zhǔn)有關(guān)問題的批復(fù)》(發(fā)改價(jià)格[2016]54號)規(guī)定,中國人民銀行征信中心自2016年1月15日起,個(gè)人到柜臺查詢自身信用報(bào)告,每年第3次起的收費(fèi)標(biāo)準(zhǔn)由每次25元降低至10元,通過互聯(lián)網(wǎng)查詢及每年前2次到柜臺查詢繼續(xù)實(shí)行免費(fèi)。
“對數(shù)據(jù)公司來說,僅僅靠賣數(shù)據(jù),并不是一個(gè)可持續(xù)的生存方式。”通過對數(shù)據(jù)的脫敏和建模,可以延展到更多的領(lǐng)域。比如為企業(yè)客戶提供深層次的分析報(bào)告,包括渠道質(zhì)量、壞賬率預(yù)判、催收建議、用戶激活等。
也有公司開始與一些知名的電商平臺和理財(cái)平臺對接,期望通過幫助機(jī)構(gòu)用戶更有效地找到貸款用戶和便宜的資金,在快速安全撮合交易時(shí)分得合理的傭金。
當(dāng)然,也有創(chuàng)業(yè)者為此擔(dān)心,在這個(gè)市場里每個(gè)角色都有自己定位,需求方跟供給方是一個(gè)博弈關(guān)系。利益是互相矛盾的。“而且,一家數(shù)據(jù)公司往往只是針對某一個(gè)領(lǐng)域有深刻的了解和理解。當(dāng)他們遇到數(shù)據(jù)無法覆蓋,或者業(yè)務(wù)無法覆蓋的客群,這種服務(wù)產(chǎn)品就會顯得捉襟見肘。”
金盛網(wǎng)聚(北京)科技有限公司成立于2012年,是一家數(shù)據(jù)處理與信息咨詢服務(wù)商,公司擁有自主核心技術(shù)與服務(wù)咨詢的團(tuán)隊(duì), 公司“WJFbaric-互聯(lián)網(wǎng)大數(shù)據(jù)信息監(jiān)測SaaS平臺”目前注冊使用客戶將近上萬個(gè),為企業(yè)、政府、學(xué)術(shù)機(jī)構(gòu)、成功人士等提供在線信息收集、展示、閱讀、存儲的免費(fèi)平臺,公司遠(yuǎn)景致力于通過數(shù)據(jù)+計(jì)算形成可視化的人工智能決策平臺。