三花快讯 · 2024, 7月12日

Whisper Timestamped:在浏览器中运行的语音转录

可实现类似 PR 的转录文本和文字编辑的定位功能

类似 PR 的转录文本功能,Whisper Timestamped 是一个开源的支持多语言的语音识别技术,能够精确对应每个单词到对应帧,可以在播放时高亮当前单词,也可以通过点击单词快速定位到对应时间,该技术完全运行在浏览器中,可以在这里直接用,第一次使用需要先下载模型~

商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。

三花 AI 导航 Logo