憑聲音描繪出人臉只聞其聲不見其人成過去式？

2019年06月24日 18點56分 來源：億恩IDC資訊 有0人參與

云主機服務器租用服務器托管虛擬主機域名注冊網(wǎng)站建設

麻省理工學院的研究人員發(fā)明一種技術，能夠僅憑借聲音描繪出人臉。值得一提的是，該系統(tǒng)并不能準確還原一個講話者的面容，而是只能根據(jù)學習到的基本特征大致模擬人臉圖像。這是不是意味著“只聞其聲不見其人”成過去式？

黑科技：憑聲音描繪出人臉

人們常用“只聞其聲不見其人”，來形容某些人神秘，比如你常聽到的客服MM甜美的聲音，是不是想知道她的長相如何？現(xiàn)在，有了新技術，憑聲音描繪出人臉，這或許你解決你的心里的疑問。

外媒稱，麻省理工學院的研究人員發(fā)明一種技術，能夠僅憑借聲音描繪出人臉。

據(jù)阿根廷布宜諾斯艾利斯經(jīng)濟新聞網(wǎng)6月18日報道，僅憑聲音就可以描繪出人臉，這聽起來似乎匪夷所思?，F(xiàn)在一個名為Speech2Face的自主智能學習系統(tǒng)已經(jīng)將其變?yōu)楝F(xiàn)實。

據(jù)麻省理工學院的研究人員稱，這個憑聲音描繪出人臉系統(tǒng)實際上就是一個神經(jīng)網(wǎng)絡。他們搜集了來自YouTube等網(wǎng)站上的海量視頻，而所有視頻內容都是人在講話。隨后他們利用這些資料對這個能夠自主智能學習的神經(jīng)網(wǎng)絡加以訓練。通過訓練，這個系統(tǒng)學習到了聲音和面部特征的相關聯(lián)系，掌握了講話者的一些基本特征，例如年齡、性別、種族和音色等。

報道稱，自主智能學習系統(tǒng)能夠利用聲音與面部特征的關系，根據(jù)少量聲音片段大致推測出一個從未見過的講話者的面容。

值得一提的是，該系統(tǒng)并不能準確還原一個講話者的面容，而是只能根據(jù)學習到的基本特征大致模擬人臉圖像。

研究人員指出，這是因為該系統(tǒng)的訓練方向就是捕捉與年齡、性別等特征相關的視覺特點，而這些特點屬于多位講話者的共性。在海量資料的基礎上，該系統(tǒng)只有在從未見過的講話者身上找到足夠多的共性之后，才能大致模擬出一幅人臉圖像。因此這幅圖像無法做到精確還原講話者的面容。

此外，雖然該系統(tǒng)的資料庫規(guī)模龐大，但畢竟無法涵蓋全世界所有人，因此該系統(tǒng)模擬出來的圖像仍需要進一步調整和完善。

目前該憑聲音描繪出人臉系統(tǒng)面臨的最大挑戰(zhàn)就是如何給這個資料庫擴容，進而使其描繪的講話者面容更加接近原型，但這項任務絕非易事，仍需研究人員進一步努力。

但是，我想到有一類人會不會讓“憑聲音描繪出人臉”無效？那就是聲優(yōu)大神們!

河南億恩科技股份有限公司(www.riomediacenter.com)始創(chuàng)于2000年，專注服務器托管租用，是國家工信部認定的綜合電信服務運營商。億恩為近五十萬的用戶提供服務器托管、服務器租用、機柜租用、云服務器、網(wǎng)站建設、網(wǎng)站托管等網(wǎng)絡基礎服務，另有網(wǎng)總管、名片俠網(wǎng)絡推廣服務，使得客戶不斷的獲得更大的收益。
服務器/云主機 24小時售后服務電話：0371-60135900
虛擬主機/智能建站 24小時售后服務電話：0371-55621053
網(wǎng)絡版權侵權舉報電話：0371-60135995
服務熱線：0371-60135900