丝美导航 AI技能集 AI智能技能

speech-recognition-local

本地语音识别工具,利用faster-whisper模型实现语音转文字,无需API费用。

标签:
分享到:

speech-recognition-local

speech-recognition-local是什么

本地语音识别工具,支持多种语音格式,利用faster-whisper模型进行语音转文字,无需支付API费用,适用于需要本地语音转文字功能的场景。

开源协议:MIT-0

speech-recognition-local的主要功能

  • 本地执行:使用faster-whisper在本地执行Whisper模型,无需依赖外部API。
  • 多种语言支持:支持中文和英文语音转文字,可自定义语言。
  • 模型选择:提供小型、基础、中型三种模型,满足不同需求。
  • 免费使用:本地运行,无需支付API费用。
  • 易于配置:已安装faster-whisper,小型模型可自动下载。

如何使用speech-recognition-local

  • 上传音频文件:上传格式为.ogg, .m4a, .mp3的语音文件。
  • 选择语言:默认为中文,也可选择英文。
  • 执行转录命令:使用提供的命令进行语音转文字。
  • 模型下载:首次使用将自动下载小型模型(约75MB)。
  • 模型切换:通过修改脚本中的参数切换不同大小的模型。

speech-recognition-local的应用场景

  • 个人或团队内部语音记录转文字
  • 会议记录自动生成文字
  • 语音助手语音转文字功能开发
  • 在线教育平台语音内容处理

相关导航