speech-recognition-local

丝美导航 AI技能集 AI智能技能

speech-recognition-local

本地语音识别工具，利用faster-whisper模型实现语音转文字，无需API费用。

标签：本地语音识别 faster-whisper 语音转文字

链接直达手机查看

speech-recognition-local

speech-recognition-local是什么

本地语音识别工具，支持多种语音格式，利用faster-whisper模型进行语音转文字，无需支付API费用，适用于需要本地语音转文字功能的场景。

开源协议：MIT-0

speech-recognition-local的主要功能

本地执行：使用faster-whisper在本地执行Whisper模型，无需依赖外部API。
多种语言支持：支持中文和英文语音转文字，可自定义语言。
模型选择：提供小型、基础、中型三种模型，满足不同需求。
免费使用：本地运行，无需支付API费用。
易于配置：已安装faster-whisper，小型模型可自动下载。

如何使用speech-recognition-local

上传音频文件：上传格式为.ogg, .m4a, .mp3的语音文件。
选择语言：默认为中文，也可选择英文。
执行转录命令：使用提供的命令进行语音转文字。
模型下载：首次使用将自动下载小型模型（约75MB）。
模型切换：通过修改脚本中的参数切换不同大小的模型。

speech-recognition-local的应用场景

个人或团队内部语音记录转文字
会议记录自动生成文字
语音助手语音转文字功能开发
在线教育平台语音内容处理

相关导航

YouTube ASR Summarize (Local)

本地语音识别提取YouTube视频内容，生成无字幕视频摘要。

Whisper Local Api

提供本地、安全的Whisper ASR服务，适用于OpenClaw，支持离线操作和隐私保护。

speech-recognition-local

本地语音识别工具，利用faster-whisper模型实现语音转文字，无需API费用。

macOS Local Voice

macOS Local Voice是一款基于原生Apple功能的离线语音识别和语音合成工具，无需API密钥。

Local Vosk STT

Local Vosk STT是一款轻量级、离线的语音转文本工具，适用于转录Telegram语音消息和音频文件。

Local STT (Nvidia Parakeet + Whisper Support)

提供本地语音识别功能，支持Parakeet和Whisper后端，实现高精度和快速识别。

暂无评论