丝美导航 AI技能集 开发工具技能

Whisper STT

基于OpenAI Whisper的免费本地语音转文字工具,支持多种音频格式,无需API费用。

标签:
分享到:

Whisper STT

Whisper STT是什么

Whisper STT是一款基于OpenAI Whisper技术的免费本地语音转文字工具,适用于需要将音频文件快速转换为文字的场景,如会议记录、音频内容编辑等。

nickylin 开发 | 累计安装 311 次 | 开源协议:MIT-0

Whisper STT的主要功能

  • 多格式支持:支持mp3, wav, m4a, ogg等多种音频格式转文字。
  • 免费使用:无需API费用,降低使用成本。
  • 本地处理:本地处理,无需上传音频文件到云端。
  • 模型选择:提供不同大小和精度的模型选择,满足不同需求。
  • 灵活输出:支持多种输出格式,如txt, srt等。

如何使用Whisper STT

  • 安装依赖:安装openai-whisper和torch,可选安装ffmpeg。
  • 下载模型:下载所需模型权重。
  • 运行脚本:使用提供的脚本进行音频转写。
  • 参数设置:根据需要设置模型大小、语言和输出格式等参数。
  • 查看结果:查看转换后的文字内容。

Whisper STT的项目地址

  • 项目官网https://clawhub.ai/nickylin/whisper-stt

Whisper STT的应用场景

  • 会议记录整理
  • 音频内容编辑
  • 语音数据标注

相关导航