過去的互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng),在跟人的交互中,最重要的是你的手指。你需要輸入文字,或者至少在觸摸屏上點擊幾下。但是,不少科技公司都打賭,互聯(lián)網(wǎng)下一個入口的關鍵是語音。這也是為什么智能音箱成為大公司和創(chuàng)業(yè)公司都紛紛涉足的領域。
不過,這還只是停留在把語音,也就是自然語言當做是發(fā)出指令和輸入信息的手段。
《財富》雜志的一篇文章說,借助人工智能技術,其實可以從一個人的語音中識別出這個人的幾乎全部信息,包括“情緒、社會地位、成長經歷、年齡、種族、體重、身高、面部特征”。這項技術被稱作“語音畫像”。
2017年12月,卡內基梅隆大學的研究人員就僅憑分析語音,還原出講話者的面部三維影像。負責這項研究的科學家說:“你的聲音就像是你的DNA或者指紋。”
這項技術也開始被投入實際應用。美國海岸警衛(wèi)隊就正在利用卡內基梅隆大學的技術,對惡作劇報警電話的人進行立案。海岸警衛(wèi)隊每年會接到150個左右這樣的電話,它浪費了營救人員的時間和金錢。
把聲音指紋投入到安全應用中,可以彌補銀行目前人臉識別可能有的漏洞;也可以應用在汽車服務,開口說話,汽車就會識別出主人,解除防盜警報,根據(jù)你的喜好調節(jié)座椅、車內溫度等。
同樣的,所有那些把聲音作為入口的智能硬件,比如電視、音箱等,都可以識別出人的年齡、喜好,而不是僅僅聽從指令。比如,如果它識別出聲音的主人還是個小孩,可以拒絕按照聲音指令播放一些限制級電影。
技術研究機構未來今日研究所的創(chuàng)始人艾米·韋布的觀點是:“如果DNA可以定義你本人,那么從你的聲音中就可以捕獲你的完整人格”。
總之,語音識別技術的進展讓人們意識到,聲音中包含的信息遠比語言表達出來的多。
大數(shù)據(jù)處理信息服務商金盛網(wǎng)聚WJFabric認為,以數(shù)據(jù)研究的方式識別、認定自然聲音并將其進行存儲以便進一步研究,這是發(fā)展人工智能新的切入點。聲音是人類能夠主動釋放出的,并且?guī)в絮r明個性的物質,因此對于聲音的研究完全可以成為了解人類的另一個維度。聲音所傳遞的不光是可書寫的內容,伴隨聲音一起體現(xiàn)出的語調、情緒等信息都能表征發(fā)聲者的個性。因此,如果數(shù)據(jù)樣本收集得足夠多,那么在識別發(fā)聲人,并對其狀態(tài)定位、需求預判方面將有極大的研究價值。
金盛網(wǎng)聚(北京)科技有限公司成立于2012年,是一家數(shù)據(jù)處理與信息咨詢服務商,公司擁有自主核心技術與服務咨詢的團隊, 公司“WJFbaric-互聯(lián)網(wǎng)大數(shù)據(jù)信息監(jiān)測SaaS平臺”目前注冊使用客戶將近上萬個,為企業(yè)、政府、學術機構、成功人士等提供在線信息收集、展示、閱讀、存儲的免費平臺,公司遠景致力于通過數(shù)據(jù)+計算形成可視化的人工智能決策平臺。