丝美导航 AI技能集 AI智能技能

eleven-stt

ElevenLabs语音转文本(本地CLI)是一款基于命令行的音频转录工具,将音频文件转换为文本,支持自然语音和多种语言。

标签:
分享到:

eleven-stt

eleven-stt是什么

ElevenLabs语音转文本(本地CLI)是一款适用于命令行环境的音频转录工具,通过自然语音技术将音频内容转换为文本,适用于需要快速转录音频文件的用户。

开源协议:MIT-0

eleven-stt的主要功能

  • 本地CLI:通过命令行直接转录音频文件,无需额外软件安装。
  • 自然语音:使用ElevenLabs的自然语音技术,提供更自然流畅的转录结果。
  • 多种语言支持:支持多种语言的音频转录,满足不同用户需求。
  • 语音分离:支持语音分离功能,将多个说话人的语音分别转录。
  • 实时流和监听:提供实时流功能和实时监听模式,满足实时转录需求。

如何使用eleven-stt

  • 安装依赖:确保已安装curl、jq、python3、ffmpeg和websocat。
  • 设置API密钥:在环境中设置ELEVENLABS_API_KEY。
  • 运行脚本:运行scripts/transcribe.sh脚本,并指定音频文件路径或URL。
  • 配置选项:根据需要配置额外选项,如语言、语音分离等。
  • 查看结果:查看转录结果,可以是文本文件或JSON格式。

eleven-stt的应用场景

  • 学术研究:快速转录讲座和研讨会内容。
  • 内容创作:将访谈和播客内容转换为可搜索的文本。
  • 客户服务:转录客户电话通话,提高工作效率。
  • 教育培训:转录课程内容,方便学生复习和搜索信息。

相关导航