
Speech To Text是什么
Speech To Text是一款基于Whisper模型的音频转文本工具,适用于开发者需要将音频内容快速转换为可编辑文本的场景。
由 okaris 开发 | 累计安装 1,629 次 | 开源协议:MIT-0
Speech To Text的主要功能
- 音频转录:支持Fast Whisper Large V3和Whisper V3 Large模型,实现高精度音频到文本的转换。
- 翻译功能:具备音频翻译能力,支持多种语言之间的转换。
- CLI操作:通过inference.sh CLI进行操作,方便集成到自动化流程中。
- 快速部署:一键安装,快速启动转录服务,无需复杂配置。
- 安全合规:遵循MIT-0开源协议,免费使用、修改和重新分发。
如何使用Speech To Text
- 安装CLI:通过curl命令安装inference.sh CLI工具。
- 登录服务:使用infsh login命令登录inference.sh服务。
- 运行转录:使用infsh app run命令运行转录任务,指定模型和输入音频。
- 获取结果:转录完成后,CLI将输出文本结果。
- 处理文本:根据需要,对转录得到的文本进行进一步处理或编辑。
Speech To Text的项目地址
- 项目官网:https://clawhub.ai/okaris/speech-to-text
Speech To Text的应用场景
- 自动生成会议记录,提高会议效率。
- 将语音播客内容转换为可搜索的文本。
- 辅助语音助手进行语音识别,提升交互体验。
- 在多语言环境中,实现音频内容的快速翻译。
whisperkit-cli
Whisper Transcribe
Whisper Tailnet API
Webchat Voice Full Stack
Voice Recognition
Telegram Voice Transcribe
Speech to Text
skillboss
self-hosted-whisper-api
Ressemble TTS e STT
Phone Call Agent
渝公网安备50011302222466号
暂无评论