
Voice Transcribe是什么
Voice Transcribe是一款基于OpenAI技术的音频转录工具,能够将音频文件转换为文本,支持词汇提示和文本替换功能,适用于需要快速将语音信息转换为文字的场景。
由 darinkishore 开发 | 累计安装 4,258 次 | 开源协议:MIT-0
Voice Transcribe的主要功能
- 音频转录:利用OpenAI的gpt-4o-mini-transcribe模型,准确转录音频文件为文本。
- 词汇提示:通过vocab.txt文件添加词汇提示,帮助模型识别特定名称或术语。
- 文本替换:通过replacements.txt文件进行文本替换,修正转录错误。
- 格式支持:支持多种音频格式,包括mp3, mp4, mpga, m4a, wav等。
- 缓存机制:通过音频文件的sha256哈希缓存,提高转录效率。
如何使用Voice Transcribe
- 安装uv工具:首先确保已安装uv工具,用于运行Voice Transcribe。
- 配置OpenAI API密钥:将OpenAI API密钥添加到Voice Transcribe的.env文件中。
- 添加词汇提示和文本替换:根据需要,将词汇提示和文本替换添加到vocab.txt和replacements.txt文件中。
- 运行转录命令:使用uv run命令运行转录,例如:uv run /path/to/audio-file.mp3。
- 查看转录结果:转录完成后,查看生成的文本文件。
Voice Transcribe的项目地址
- 项目官网:https://clawhub.ai/darinkishore/voice-transcribe
Voice Transcribe的应用场景
- 将语音备忘录转换为文字,方便查阅和回复。
- 转录会议或讲座内容,便于整理和分享。
- 处理语音数据,进行语音识别和情感分析等后续处理。
发票查验(invoice-verify) - 慧穗云
发票查验 - Invoice Verification
ZUGFeRD Invoice Merger
youtube-voice-summarizer
X Voice Match
whatsappVoiceOpenSkill
wevoicereply
Webchat Voice Proxy
Webchat Voice Gui
Webchat Voice Full Stack
voice-to-text
voiceskill123
渝公网安备50011302222466号
暂无评论