丝美导航 AI技能集 内容创作技能

iFlytek ASR - 讯飞语音转文字

讯飞语音转文字,利用科大讯飞API实现音频视频到文字的转换,支持本地文件及YouTube视频。

标签:
分享到:

iFlytek ASR - 讯飞语音转文字

iFlytek ASR - 讯飞语音转文字是什么

讯飞语音转文字是一款基于科大讯飞API的语音转文字工具,适用于会议记录、视频字幕制作、语音笔记等场景,支持本地音频文件转录和YouTube视频下载转文字。

harven-droid 开发 | 累计安装 73 次 | 开源协议:MIT-0

iFlytek ASR - 讯飞语音转文字的主要功能

  • 音频转录:支持多种音频格式,将本地音频文件转换为文字。
  • 视频转文字:可下载YouTube视频并转换为文字,方便制作字幕。
  • 方言识别:自动识别中文方言,提高转录准确性。
  • 自动标点:转录过程中自动添加标点符号,提高文字可读性。
  • 文件限制:支持文件大小≤500MB,时长≤5小时。

如何使用iFlytek ASR - 讯飞语音转文字

  • 获取API凭证:在科大讯飞开放平台注册并创建应用,获取所需凭证。
  • 配置环境变量:在工具目录下创建.env文件,填写API凭证信息。
  • 安装依赖:使用pip3安装yt-dlp、requests和python-dotenv等依赖。
  • 转录音频:运行speech_to_text.py脚本,指定音频文件路径和输出文本路径。
  • 视频转文字:运行download_and_transcribe.py脚本,自动下载YouTube视频并转文字。

iFlytek ASR - 讯飞语音转文字的项目地址

  • 项目官网https://clawhub.ai/harven-droid/iflytek-asr

iFlytek ASR - 讯飞语音转文字的应用场景

  • 会议记录转录,快速整理会议内容。
  • 视频字幕制作,为视频添加字幕。
  • 语音笔记整理,方便后续查阅。
  • 学术研究,从音频资料中提取文字信息。
  • 新闻播报,实时生成文字新闻稿。

相关导航