Speech To Text

丝美导航 AI技能集开发工具技能

Speech To Text

利用Whisper模型，通过inference.sh CLI将音频文件转录为文本。

标签：音频转录开发工具

链接直达手机查看

Speech To Text

Speech To Text是什么

Speech To Text是一款基于Whisper模型的音频转文本工具，适用于开发者需要将音频内容快速转换为可编辑文本的场景。

由 okaris 开发 | 累计安装 1,629 次 | 开源协议：MIT-0

Speech To Text的主要功能

音频转录：支持Fast Whisper Large V3和Whisper V3 Large模型，实现高精度音频到文本的转换。
翻译功能：具备音频翻译能力，支持多种语言之间的转换。
CLI操作：通过inference.sh CLI进行操作，方便集成到自动化流程中。
快速部署：一键安装，快速启动转录服务，无需复杂配置。
安全合规：遵循MIT-0开源协议，免费使用、修改和重新分发。

如何使用Speech To Text

安装CLI：通过curl命令安装inference.sh CLI工具。
登录服务：使用infsh login命令登录inference.sh服务。
运行转录：使用infsh app run命令运行转录任务，指定模型和输入音频。
获取结果：转录完成后，CLI将输出文本结果。
处理文本：根据需要，对转录得到的文本进行进一步处理或编辑。

Speech To Text的项目地址

项目官网：https://clawhub.ai/okaris/speech-to-text

Speech To Text的应用场景

自动生成会议记录，提高会议效率。
将语音播客内容转换为可搜索的文本。
辅助语音助手进行语音识别，提升交互体验。
在多语言环境中，实现音频内容的快速翻译。

相关导航

whisperkit-cli

whisperkit-cli：基于本地文件的音频输入/输出，设备端语音转文本和文本转语音命令行工具。

Whisper Transcribe

Whisper Transcribe，利用OpenAI Whisper技术，实现音频文件到文本的快速转录，支持多种格式和批量处理。

Whisper Tailnet API

Whisper Tailnet API提供基于Tailnet的Whisper语音转文本服务，支持OpenAI音频转录。

Webchat Voice Full Stack

提供OpenClaw WebChat本地语音输入的一站式全栈解决方案，实现快速语音转文本。

Voice Recognition

基于OpenAI Whisper CLI的本地语音转文本工具，支持多语言翻译和摘要。

Telegram Voice Transcribe

利用OpenAI Whisper API将Telegram语音消息转录为文本，提高沟通效率。

Speech to Text

利用Hugging Face Whisper Space，通过Gradio界面将音频文件转换为文本。

Speech To Text

利用Whisper模型，通过inference.sh CLI将音频文件转录为文本。

skillboss

SkillBoss，AI代理瑞士军刀，集成50多个模型，支持智能路由，实现多场景AI应用。

self-hosted-whisper-api

自托管Whisper API，提供音频转录、语音转文本、字幕生成和音频翻译服务，无需API密钥。

Ressemble TTS e STT

Ressemble TTS e STT是一款基于Resemble AI HTTP API的文本转语音和语音转文本集成开发工具。

Phone Call Agent

电话呼叫代理，AI语音外呼工具，支持生成呼叫链接，接收来电，并提供通话记录和摘要。

暂无评论