AI配音拉動的兩駕“馬車”
發布時間:2018/5/9 12:54:51 訪問次數:1124
- 51電子網公益庫存:
- IRFR310TR
- J210G
- KSH44H11
- LD1117AG-1.8V-A
- MC78M05
- NTD3055VLT4G
- PZT772-P
- RFD15P05
- SFR9220
- TA58MS12F
- UR133AL-3.3V-A
- Z3M
- KSC5042FTU
- J210G
- HX3021-3.0
在前文字時代,聲音曾經是人類唯一的交流工具。由于聲音的傳播距離非常有限,所以那個時候人類的生存以“部落”為單位,關系十分緊密。后來隨著傳播媒介的一步步發展,我們開始不再需要彼此近距離交流就能獲得大量信息,反而,卻開始突然懷念單一的聲音帶給我們的感覺,這種最原始的媒介承載著人類最充沛的情感。http://weiyoudu01.51dzw.com
今年1月份,世界首部利用人工智能模擬人聲的紀錄片在央視播出,而這部名為《創新中國》的紀錄片解說詞卻全程是由在2013年就“已逝”的聲音完成的。這個奇跡的背后是科大訊飛利用語言合成技術成功幫ai模擬出了我國已故著名配音演員,語言藝術家李易的聲音。
科大訊飛強勁的語言合成技術讓ai模擬的聲音成功打動了李易老師的學生、朋友和家人。在ai自然流暢的語言解說當中,似乎還能再見故人的音容笑貌。科大訊飛這項語音合成技術主要由三個步驟構成:
一是輸入文本,讓機器模擬人對自然語言的理解過程,對文本進行語言處理,主要包括文本規整、詞語切分、語法語義分析,然后給出后續步驟所需要的發音提示;
二是規劃音段特征,比如音調、音長、音重等等,讓機器可以對語言的特有韻律進行處理,使機器模擬的聲音更自然并且更準確地傳達實際語義。http://weiyoudu01.51dzw.com
最后根據前兩部分處理的結果進行語音合成即可。通過這幾個步驟,ai模擬的聲音與人聲已經非常相似,即使是最熟悉的人在某些情況下也很難分辨機器人與人聲的界限。
那么這么驚艷的人工智能配音技術,它的邊界究竟能夠延伸到多遠的地方呢?智能相對論分析師楊蘇穎就此提出了人工智能配音的兩個用武之地。
“粉絲經濟”已經成為現在文娛產業經濟增長的主要支柱之一。隨著最近養成類偶像節目的火爆,粉絲對明星投入的情感越來越多,隨之帶動這個群體為明星付費的意愿同樣水漲船高。網傳范冰冰弟弟范丞丞在新浪微博發布付費閱讀的自拍,一夜徒手狂賺幾百萬(后遭到經紀人否認)。既然,明星的周邊如此火爆,何不運用配合人工智能語音合成的vr、ar技術來打造的虛擬范丞丞們,讓他們更真實地出現在粉絲的日常生活當中呢?要深挖中國的粉絲潛力,比起像騰訊視頻之前在明日之子上打造虛擬二次元偶像“荷茲”,聽著現實當中熟悉的偶像聲音叫自己起床,陪自己聊天,這樣的虛擬真人版偶像或許更能得到粉絲認可。http://weiyoudu01.51dzw.com
據國外媒體報道,有研究表明,年邁夫婦可能因為一方喪偶而增大死亡率,這種現象被稱為“心碎綜合癥”。這項研究由哈佛大學和威斯康斯大學麥迪遜分校的兩位科學家負責,研究結果顯示,男性喪妻后“全因死亡率”的概率增大了18%,女性喪夫后“全死因死亡率”的概率增大了16%。并且我們還可以做一個合理推斷,在其他喪子或者喪雙親的情況下,這種“心碎綜合癥”的表現也一定存在,比如在唐山大地震和汶川地震之后。心理學家表示,要想修復這種創傷是非常困難的。但是人工智能配音的ai或許可以做到呢,它能夠利用過去已有的音頻合成親人的聲音,如果心理醫生說的話能夠用親人的聲音來傳達,也許可以幫助病人更快地走出陰霾。
來源:eefocus
- 51電子網公益庫存:
- IRFR310TR
- J210G
- KSH44H11
- LD1117AG-1.8V-A
- MC78M05
- NTD3055VLT4G
- PZT772-P
- RFD15P05
- SFR9220
- TA58MS12F
- UR133AL-3.3V-A
- Z3M
- KSC5042FTU
- J210G
- HX3021-3.0
在前文字時代,聲音曾經是人類唯一的交流工具。由于聲音的傳播距離非常有限,所以那個時候人類的生存以“部落”為單位,關系十分緊密。后來隨著傳播媒介的一步步發展,我們開始不再需要彼此近距離交流就能獲得大量信息,反而,卻開始突然懷念單一的聲音帶給我們的感覺,這種最原始的媒介承載著人類最充沛的情感。http://weiyoudu01.51dzw.com
今年1月份,世界首部利用人工智能模擬人聲的紀錄片在央視播出,而這部名為《創新中國》的紀錄片解說詞卻全程是由在2013年就“已逝”的聲音完成的。這個奇跡的背后是科大訊飛利用語言合成技術成功幫ai模擬出了我國已故著名配音演員,語言藝術家李易的聲音。
科大訊飛強勁的語言合成技術讓ai模擬的聲音成功打動了李易老師的學生、朋友和家人。在ai自然流暢的語言解說當中,似乎還能再見故人的音容笑貌。科大訊飛這項語音合成技術主要由三個步驟構成:
一是輸入文本,讓機器模擬人對自然語言的理解過程,對文本進行語言處理,主要包括文本規整、詞語切分、語法語義分析,然后給出后續步驟所需要的發音提示;
二是規劃音段特征,比如音調、音長、音重等等,讓機器可以對語言的特有韻律進行處理,使機器模擬的聲音更自然并且更準確地傳達實際語義。http://weiyoudu01.51dzw.com
最后根據前兩部分處理的結果進行語音合成即可。通過這幾個步驟,ai模擬的聲音與人聲已經非常相似,即使是最熟悉的人在某些情況下也很難分辨機器人與人聲的界限。
那么這么驚艷的人工智能配音技術,它的邊界究竟能夠延伸到多遠的地方呢?智能相對論分析師楊蘇穎就此提出了人工智能配音的兩個用武之地。
“粉絲經濟”已經成為現在文娛產業經濟增長的主要支柱之一。隨著最近養成類偶像節目的火爆,粉絲對明星投入的情感越來越多,隨之帶動這個群體為明星付費的意愿同樣水漲船高。網傳范冰冰弟弟范丞丞在新浪微博發布付費閱讀的自拍,一夜徒手狂賺幾百萬(后遭到經紀人否認)。既然,明星的周邊如此火爆,何不運用配合人工智能語音合成的vr、ar技術來打造的虛擬范丞丞們,讓他們更真實地出現在粉絲的日常生活當中呢?要深挖中國的粉絲潛力,比起像騰訊視頻之前在明日之子上打造虛擬二次元偶像“荷茲”,聽著現實當中熟悉的偶像聲音叫自己起床,陪自己聊天,這樣的虛擬真人版偶像或許更能得到粉絲認可。http://weiyoudu01.51dzw.com
據國外媒體報道,有研究表明,年邁夫婦可能因為一方喪偶而增大死亡率,這種現象被稱為“心碎綜合癥”。這項研究由哈佛大學和威斯康斯大學麥迪遜分校的兩位科學家負責,研究結果顯示,男性喪妻后“全因死亡率”的概率增大了18%,女性喪夫后“全死因死亡率”的概率增大了16%。并且我們還可以做一個合理推斷,在其他喪子或者喪雙親的情況下,這種“心碎綜合癥”的表現也一定存在,比如在唐山大地震和汶川地震之后。心理學家表示,要想修復這種創傷是非常困難的。但是人工智能配音的ai或許可以做到呢,它能夠利用過去已有的音頻合成親人的聲音,如果心理醫生說的話能夠用親人的聲音來傳達,也許可以幫助病人更快地走出陰霾。
來源:eefocus上一篇:英特爾10納米制程遭遇瓶頸
熱門點擊
- 超級電容與電解電容的最大區別
- 指標驅動型的市場情報
- 改進型加速MOS關斷
- EEPROM的耐用性問題
- 高通驍龍835的手機
- 超級電容的未來
- 多種因素導致供過于求
- 大唐電信和高通合資會阻礙自主芯片的發展嗎?
- 三大芯片廠商的產能利用率均持續提升
- 半導體硅晶圓廠環球晶圓第1季財報亮眼
推薦電子資訊
- 最差勁科技合作品盤點
- 最差勁的科技合作品。 LG普拉達: 看到這個不得... [詳細]