二宗 二宗

猜猜小米 9 的「王源专线」是怎么实现的?

在早些时候的小米发布会上,小米与王源的深度合作让台下粉丝尖叫不断,但作为一位典型工科软件学子,我更好奇的是,小米 9 中王源自然的声线究竟是怎么实现的,或者换句话说,是哪家的人工智能方案做到了如此自然流畅的智能语音。

而近日,「王源专线」背后的团队也站了出来,但让人没想到的是,实现了「王源专线」的,居然是在大家眼中与爱豆毫不搭边的微软。 深度学习降低了采集音源的难度 不同于以往提前录制好的语音服务,采用了深度神经网络语音合成技术训练出的人工智能声音模型,为小米 9 带来实时、在线的原声对话。全新的人工智能声音模型以录音棚录制的数百句语音数据为基础,利用深度神经网络与深度学习优化,创造出了自然流畅、抑扬顿挫的人工智能声音模型。 据微软全球云及人工智能语音产品负责人闫勃和资深产品总监丁秉公介绍,小米 9 内置的人工智能版王源背后的技术,其实是生成于微软智能云平台 Azure 上神经网络驱动的文本到语音转换功能,可以实时在线合成的语音,完美还原王源独特的声线。

▲ Azure 多地数据中心保证了时效性 微软与小米的合作,其实从很早事前就开始了 早在 2015 年,小米就采用了 Microsoft Azure 作为照片的云端储存服务;2016 年,小米在智能手机与平板中预装微软 Office,方便用户快速使用;2018 年的小米 AIoT 大会上,来自微软的小冰与来自小米的小爱更是实现了强强联手。微软与小米还就利交叉许可及转让达成协议,为小米产品进军国际市场提供支持。

热卖爆款
没有更多啦