丝美导航 AI技能集 通讯协作技能

speech-recognition

基于SenseVoice API的通用语音识别工具,实现音频文件到文字的转换。

标签:
分享到:

speech-recognition

speech-recognition是什么

通用语音识别Skill,适用于多种音频格式,利用SenseVoice API将语音转换为文字,适用于通讯协作场景。

demo112 开发 | 累计安装 652 次 | 开源协议:MIT-0

speech-recognition的主要功能

  • 多格式支持:支持ogg、mp3、wav和m4a等多种音频格式
  • 自动触发:用户发送语音消息、音频文件或需要转录音频时自动触发
  • 语音转文字:利用SenseVoice API实现高精度语音转文字功能
  • 免费使用:遵循MIT-0许可证,免费使用、修改和重新分发
  • 安全可靠:经过VirusTotal和OpenClaw安全扫描,确保安全可靠

如何使用speech-recognition

  • 上传音频:将音频文件上传至系统
  • 自动识别:系统自动识别音频内容并转换为文字
  • 文字输出:识别的文字输出至指定位置或设备
  • 结果验证:检查转换的文字是否准确无误
  • 保存或分享:保存转换后的文字或分享至其他平台

speech-recognition的项目地址

  • 项目官网https://clawhub.ai/demo112/speech-recognition

speech-recognition的应用场景

  • 通讯协作中的语音记录转录
  • 会议记录和总结
  • 语音邮件处理
  • 在线教育中的语音内容转换
  • 客服中心语音转文字处理

相关导航