丝美导航 AI技能集 AI智能技能

MOSS Transcribe Diarize API Skill

MOSS Transcribe Diarize API Skill提供多说话人语音转写服务,支持时间戳和说话人标识,适用于会议纪要和访谈整理。

标签:
分享到:

MOSS Transcribe Diarize API Skill

MOSS Transcribe Diarize API Skill是什么

MOSS Transcribe Diarize API Skill是一款基于MOSS技术的多说话人语音转写工具,通过API接口提供带时间戳和说话人标识的结构化转写结果,适用于会议纪要、访谈录音和多人对话整理。

helloeveryworlds 开发 | 累计安装 38 次 | 开源协议:MIT-0

MOSS Transcribe Diarize API Skill的主要功能

  • 多说话人识别:自动识别并标注多说话人,实现清晰对话记录。
  • 时间戳标注:输出带时间戳的转写结果,方便快速定位对话内容。
  • 格式灵活:支持JSON、逐段文本和按说话人汇总等多种输出格式。
  • 兼容性强:支持通过URL、本地文件或Base64音频输入,满足不同使用场景。
  • 易于集成:提供Python脚本,方便快速集成到现有系统中。

如何使用MOSS Transcribe Diarize API Skill

  • 设置API凭证:在环境中设置MOSS_API_KEY。
  • 选择输入方式:通过URL、本地文件或Base64音频输入语音数据。
  • 运行转写脚本:执行scripts/transcribe.py脚本进行语音转写。
  • 输出结果:查看生成的JSON、逐段文本或按说话人汇总的转写结果。
  • 格式转换:根据需要,选择输出格式进行格式转换。

MOSS Transcribe Diarize API Skill的项目地址

  • 项目官网https://clawhub.ai/helloeveryworlds/moss-transcribe-diarize

MOSS Transcribe Diarize API Skill的应用场景

  • 会议纪要整理
  • 访谈录音分析
  • 多人对话记录
  • 学术研究资料整理

相关导航