三花快讯 · 2025, 3月3日

Conversational Speech Model:超真实 AI 语音模型

两个演示角色:Maya(女声)和 Miles(男声)

Sesame 团队弄了个叫 Conversational Speech Model (CSM) 的语音技术,其主要目的是解决现阶段语音助手那种“死板”的问题,让人觉得是在跟一个真人在说话,能听懂你情绪,还能跟你聊出点感觉来

他们还设计了两个演示角色:Maya(女声)和 Miles(男声)。根据用户反馈,这些角色确实表现出色。

例如,当你停下来不说话时,Maya 会主动询问“你咋了?”或者用之前聊过的梗儿来 cue 你。与那些只会“嗯嗯啊啊”的助手相比,CSM 更像是一个有灵魂的朋友。不过,目前它仅支持英语。

佬们可以在 Sesame 官网上体验看看。

商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。