丝美导航 AI技能集 内容创作技能

TencentCloud General OCR

腾讯云通用OCR,从图片中提取文字内容,支持中英文、多方向识别,返回文本框位置与文字内容。

标签:
分享到:

TencentCloud General OCR

TencentCloud General OCR是什么

腾讯云通用OCR是一款基于腾讯云广告文字识别接口的技能,适用于从图片中提取文字内容,支持多种语言和方向,返回文字位置及内容,适用于内容创作和数据分析等场景。

zt1314p-design 开发 | 累计安装 152 次 | 开源协议:MIT-0

TencentCloud General OCR的主要功能

  • 多语言支持:支持中英文等多种语言文字识别
  • 多方向识别:支持横排、竖排及倾斜场景的图片文字识别
  • 翻转识别:支持90度、180度、270度翻转场景的图片识别
  • 坐标返回:返回文本框位置与文字内容,便于后续处理
  • 灵活输入:支持图片Base64和URL两种输入方式,方便使用

如何使用TencentCloud General OCR

  • 安装技能:在ClawHub中安装腾讯云通用OCR技能
  • 配置环境:设置腾讯云API密钥ID和密钥Key
  • 上传图片:上传需要识别的文字图片,可以是Base64编码或URL
  • 执行识别:运行scripts/main.py脚本,执行图片文字识别
  • 获取结果:查看返回的JSON格式结果,获取文字内容和位置坐标

TencentCloud General OCR的项目地址

  • 项目官网https://clawhub.ai/zt1314p-design/tencentcloud-ocr-general

TencentCloud General OCR的应用场景

  • 从广告图片中提取文字内容进行分析
  • 从合同或文档中提取关键信息
  • 在内容创作中自动提取图片中的文字
  • 在数据分析中识别图片中的文字数据
  • 在信息检索中快速提取图片中的文字

相关导航