下载APP

麻省理工的智能语音,可以让彩虹小马说“我爱北京天安门”了

kong
趣闻 2020-03-14
趣闻 > 麻省理工的智能语音,可以让彩虹小马说“我爱北京天安门”了
收听文本
0:00/0:00

小马同人即将迎来新的高峰。

文本智能生成语音的TTS系统现在已经挺成熟的了。先进的TTS系统早就脱离了单纯的“机械棒读”,通过人工智能辅助训练,在音调和语气上已经十分接近真人。

最近,MIT一位AI研究员的成果,把TTS往前又推进了一步。他编写的新AI,极大缩短了训练需要的样本数量。最少只要30分钟的语音素材,就可以用文本生成质量极高的语音。

也就是说,哪怕只是把游戏或者动画里某个角色的对话拆出来,跑一遍机器学习算法,AI就能模仿游戏中角色的语气生成新的语音。

目前这个AI提供了几种范例音色,在网上可以供人任意尝试。有《传送门》里的大Boss机器人GLADoS,有《小马宝莉》里的紫悦和柔柔,还有《史丹利寓言》里的旁白君。

其中,两个小马的配音质量是最让人震撼的,外网网友们普遍觉得这个AI已经十分接近动画里的语气和感觉了。当然这两个角色使用的训练素材也是最多的,除了全部的9季动画,据说还“通过各种手段”拿到了无背景音的配音原声。用这个AI生成的语音自制粉丝剧情,代入感肯定十足。

网友透露小马的音色素材质量和数量都是最好的网友透露小马的音色素材质量和数量都是最好的

其次就是GLADoS,人工智能去学习人工智能呆板脱线的语气,传统艺能玩得有模有样。《史丹利寓言》的旁白和其他几个声线,可能因为是人类语气,素材又少了点,最终的效果还是稍微差一些。

这个AI最大的缺陷还阅读能力不太过关。根据作者的说明,AI对于多音字的处理比较愚蠢。比如“玩家” Gamer这个词,你打“Gamer”,AI就会念成“嘎们儿”。非得要打成“Gaymer”,它才能念对。

AI的阅读能力比较呆板,需要用技巧辅助发音AI的阅读能力比较呆板,需要用技巧辅助发音

我调戏了一下这个AI,想要试试能不能教小马紫悦说两句中文。我们尝试了好几次,发现紫悦在说“我爱北京天安门”的时候,发音和语气不能两全。语气很象样的时候,发音不太对。发音调对了,语气又变得有点奇怪了。看来中文对小马驹来说还是太难了点。

网站上还有两个非常奇怪的范例角色:一个是《传说之下》里的骷髅人Sans,另一个是《传送门》里的主角Chell。如果你很好奇这俩人是怎么TTS的,那么恭喜你发现了重点。

??????

下面是我教小马说中文的视频:

如果你也想试试这个TTS的话,可以点击这里,选择第二栏“App”可以调戏AI,第三项“Examples”可以听听作者精选的几条语音,效果确实非常棒。


展开全文

扫码关注

游研社公众号

小程序

游研社精选

8
快速评论
热门评论
全部评论
评论时间
查看全部评论
  • 首页
  • 下一页
  • 页 / 共
App内打开