三花快讯 · 2024, 4月26日

Hume AI : 有情感的对话AI--EVI

一个由情感大型语言模型 (eLLM) 驱动的 API,能够理解和模仿语音的音调、词语强调等,以优化人与 AI 之间的互动

Hume AI 发布了情感智能技术,Empathic Voice Interface (EVI)。EVI 是一个由情感大型语言模型 (eLLM) 驱动的 API,能够理解和模仿语音的音调、词语强调等,以优化人与 AI 之间的互动。

功能特点:

  • 端对端检测:利用语音的音调进行先进的端对端检测,避免尴尬的重叠。
  • 可打断性:当被打断时停止说话并开始倾听,类似于人类的反应。
  • 响应表达:理解音调的自然起伏,传达超出文字的意义。
  • 表达性 TTS:生成适当的语调以回应自然、富有表现力的语音。
  • 与应用对齐:通过学习用户的反应来自我改进,优化幸福感和满意度。

商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。

三花 AI 导航 Logo