科技发展越来越快速,很多科技都是通过人工智能(AI)完成的,AI合成的专业播音员,不仅缩短了配音时间,还节省了制作成本和人工成本。AI超拟真有声书还原度有多高?人类的黑科技让你叹观为止,具体内容跟小编一起去看看吧。
成立两年的TTS(语音合成)技术初创公司reflect Sound开启了新一轮融资。过去一年的时间,在reflect Audio推出的有声读物制作平台上,AI主播的制作速度超过500万字/天,录制成本可节省90%以上。在今年3月份,它与中央广播电视总台的音频APP云天合作,开发基于集团IP和金融媒体的人工智能产品。音频反射的核心团队大多来自百度、Microsoft、Ali等公司。
reflect Sound基于端到神经网络和深度学习合成器开发了自己的情感和感控模块,在音色仿真、情感显示、定制服务、多语言等方面达到了行业领先水平。深入了解公司的诞生和成长故事,也对AI语音技术创新的很多探索和坚持,比如促进百度小米智能音箱的诞生,反映声音的开始。
在有声书、广播剧等长音频作品的制作过程中,前期需要手工绘制大量的文本脚本,中期需要进行配音,后期需要进行编辑,整个过程需要几个月的时间,涉及大量的劳动力成本。如果采用语音合成技术,只需几天甚至几个小时,就能完成一个很长的音频制作。然后,因为用户有很高的要求,这项技术不能实现效应水平与真实的人,很难让用户支付。所以语音合成是语音交互链上的最后一击,一旦实现,市场将会更大。
其实科技城建设背后,语音合成有三大优势。无论是有声读物还是人工智能新闻广播,都离不开反射音频在语音合成领域的技术积累与创新。随着端到端深度学习延伸到语音合成领域,语音很撑技术实现了质的飞跃。总之,反射声音的语音合成技术主要有三个核心优势,一是拟像度;二是定制能力;三是结合语音合成技术。未来随着语音合成技术逐渐进入爆发时发展阶段,期待能为各行业带来更多的创新突破和转型。