
speech-recognition-local是什么
本地语音识别工具,支持多种语音格式,利用faster-whisper模型进行语音转文字,无需支付API费用,适用于需要本地语音转文字功能的场景。
开源协议:MIT-0
speech-recognition-local的主要功能
- 本地执行:使用faster-whisper在本地执行Whisper模型,无需依赖外部API。
- 多种语言支持:支持中文和英文语音转文字,可自定义语言。
- 模型选择:提供小型、基础、中型三种模型,满足不同需求。
- 免费使用:本地运行,无需支付API费用。
- 易于配置:已安装faster-whisper,小型模型可自动下载。
如何使用speech-recognition-local
- 上传音频文件:上传格式为.ogg, .m4a, .mp3的语音文件。
- 选择语言:默认为中文,也可选择英文。
- 执行转录命令:使用提供的命令进行语音转文字。
- 模型下载:首次使用将自动下载小型模型(约75MB)。
- 模型切换:通过修改脚本中的参数切换不同大小的模型。
speech-recognition-local的应用场景
- 个人或团队内部语音记录转文字
- 会议记录自动生成文字
- 语音助手语音转文字功能开发
- 在线教育平台语音内容处理
YouTube ASR Summarize (Local)
Whisper Local Api
macOS Local Voice
Local Vosk STT
Local STT (Nvidia Parakeet + Whisper Support)
渝公网安备50011302222466号
暂无评论