Voice Transcribe

丝美导航 AI技能集通讯协作技能

Voice Transcribe

基于OpenAI gpt-4o-mini-transcribe模型的音频转录工具，支持词汇提示和文本替换。

标签：音频转录

链接直达手机查看

Voice Transcribe

Voice Transcribe是什么

Voice Transcribe是一款基于OpenAI技术的音频转录工具，能够将音频文件转换为文本，支持词汇提示和文本替换功能，适用于需要快速将语音信息转换为文字的场景。

由 darinkishore 开发 | 累计安装 4,258 次 | 开源协议：MIT-0

Voice Transcribe的主要功能

音频转录：利用OpenAI的gpt-4o-mini-transcribe模型，准确转录音频文件为文本。
词汇提示：通过vocab.txt文件添加词汇提示，帮助模型识别特定名称或术语。
文本替换：通过replacements.txt文件进行文本替换，修正转录错误。
格式支持：支持多种音频格式，包括mp3, mp4, mpga, m4a, wav等。
缓存机制：通过音频文件的sha256哈希缓存，提高转录效率。

如何使用Voice Transcribe

安装uv工具：首先确保已安装uv工具，用于运行Voice Transcribe。
配置OpenAI API密钥：将OpenAI API密钥添加到Voice Transcribe的.env文件中。
添加词汇提示和文本替换：根据需要，将词汇提示和文本替换添加到vocab.txt和replacements.txt文件中。
运行转录命令：使用uv run命令运行转录，例如：uv run /path/to/audio-file.mp3。
查看转录结果：转录完成后，查看生成的文本文件。

Voice Transcribe的项目地址

项目官网：https://clawhub.ai/darinkishore/voice-transcribe

Voice Transcribe的应用场景

将语音备忘录转换为文字，方便查阅和回复。
转录会议或讲座内容，便于整理和分享。
处理语音数据，进行语音识别和情感分析等后续处理。

相关导航

发票查验(invoice-verify) - 慧穗云

慧穗云发票查验API，快速查询发票详细信息。

发票查验 - Invoice Verification

通过API查询发票详情及获取发票类型列表的发票查验工具。

ZUGFeRD Invoice Merger

ZUGFeRD 发票合并工具，将 ZUGFeRD 2.1 标准的发票和时间报告合并为 PDF/A-3b 文件，适用于德国 B2B/Gov。

youtube-voice-summarizer

利用ElevenLabs TTS技术，快速将YouTube视频转换为专业语音摘要。

X Voice Match

X Voice Match是一款分析Twitter/X账户发布风格并生成与其声音相符的帖子的工具。

whatsappVoiceOpenSkill

whatsappVoiceOpenSkill：实时处理WhatsApp语音消息，语音转文字，识别意图，执行处理并自动回复。

wevoicereply

自动化语音合成与推送工具，实现自然口语化文本的语音回复。

Webchat Voice Proxy

提供本地HTTPS/WSS代理和UI注入的Webchat语音交互解决方案。

Webchat Voice Gui

Webchat Voice Gui是一款为OpenClaw WebChat添加语音输入和麦克风按钮的工具，支持音频录制和本地转录。

Webchat Voice Full Stack

提供OpenClaw WebChat本地语音输入的一站式全栈解决方案，实现快速语音转文本。

voice-to-text

火山引擎语音转文字工具，利用BigModel ASR技术，实现快速、准确的语音到文字转换。

voiceskill123

OpenClaw语音通话插件，通过指令适配器启动和管理语音通话。

暂无评论