丝美导航 AI技能集 通讯协作技能

Voice Transcribe

基于OpenAI gpt-4o-mini-transcribe模型的音频转录工具,支持词汇提示和文本替换。

标签:
分享到:

Voice Transcribe

Voice Transcribe是什么

Voice Transcribe是一款基于OpenAI技术的音频转录工具,能够将音频文件转换为文本,支持词汇提示和文本替换功能,适用于需要快速将语音信息转换为文字的场景。

darinkishore 开发 | 累计安装 4,258 次 | 开源协议:MIT-0

Voice Transcribe的主要功能

  • 音频转录:利用OpenAI的gpt-4o-mini-transcribe模型,准确转录音频文件为文本。
  • 词汇提示:通过vocab.txt文件添加词汇提示,帮助模型识别特定名称或术语。
  • 文本替换:通过replacements.txt文件进行文本替换,修正转录错误。
  • 格式支持:支持多种音频格式,包括mp3, mp4, mpga, m4a, wav等。
  • 缓存机制:通过音频文件的sha256哈希缓存,提高转录效率。

如何使用Voice Transcribe

  • 安装uv工具:首先确保已安装uv工具,用于运行Voice Transcribe。
  • 配置OpenAI API密钥:将OpenAI API密钥添加到Voice Transcribe的.env文件中。
  • 添加词汇提示和文本替换:根据需要,将词汇提示和文本替换添加到vocab.txt和replacements.txt文件中。
  • 运行转录命令:使用uv run命令运行转录,例如:uv run /path/to/audio-file.mp3。
  • 查看转录结果:转录完成后,查看生成的文本文件。

Voice Transcribe的项目地址

  • 项目官网https://clawhub.ai/darinkishore/voice-transcribe

Voice Transcribe的应用场景

  • 将语音备忘录转换为文字,方便查阅和回复。
  • 转录会议或讲座内容,便于整理和分享。
  • 处理语音数据,进行语音识别和情感分析等后续处理。

相关导航