
TencentCloud General OCR是什么
腾讯云通用OCR是一款基于腾讯云广告文字识别接口的技能,适用于从图片中提取文字内容,支持多种语言和方向,返回文字位置及内容,适用于内容创作和数据分析等场景。
由 zt1314p-design 开发 | 累计安装 152 次 | 开源协议:MIT-0
TencentCloud General OCR的主要功能
- 多语言支持:支持中英文等多种语言文字识别
- 多方向识别:支持横排、竖排及倾斜场景的图片文字识别
- 翻转识别:支持90度、180度、270度翻转场景的图片识别
- 坐标返回:返回文本框位置与文字内容,便于后续处理
- 灵活输入:支持图片Base64和URL两种输入方式,方便使用
如何使用TencentCloud General OCR
- 安装技能:在ClawHub中安装腾讯云通用OCR技能
- 配置环境:设置腾讯云API密钥ID和密钥Key
- 上传图片:上传需要识别的文字图片,可以是Base64编码或URL
- 执行识别:运行scripts/main.py脚本,执行图片文字识别
- 获取结果:查看返回的JSON格式结果,获取文字内容和位置坐标
TencentCloud General OCR的项目地址
- 项目官网:https://clawhub.ai/zt1314p-design/tencentcloud-ocr-general
TencentCloud General OCR的应用场景
- 从广告图片中提取文字内容进行分析
- 从合同或文档中提取关键信息
- 在内容创作中自动提取图片中的文字
- 在数据分析中识别图片中的文字数据
- 在信息检索中快速提取图片中的文字
渝公网安备50011302222466号
暂无评论