丝美导航 AI技能集 内容创作技能

ollama-vision

ollama-vision是一款基于Ollama qwen3-vl:4b模型的本地图片分析工具,支持自动压缩、描述、OCR文字提取和自定义信息抽取。

标签:
分享到:

ollama-vision

ollama-vision是什么

ollama-vision是一款本地运行的图片分析工具,适用于需要快速分析图片内容、提取文字信息等场景,支持多种分析模式,操作简便。

LZM2023 开发 | 累计安装 80 次 | 开源协议:MIT-0

ollama-vision的主要功能

  • 自动压缩:超过2MB的图片会自动压缩,提高分析效率。
  • 多模式分析:支持描述、OCR文字提取和自定义信息抽取,满足不同需求。
  • 临时文件清理:压缩产生的临时文件会自动删除,确保系统整洁。
  • 质量优先:优先降低JPEG质量,必要时缩小尺寸,保证分析质量。
  • 本地部署:无需联网,本地部署即可使用,安全可靠。

如何使用ollama-vision

  • 安装Ollama:确保Ollama已安装并运行。
  • 下载模型:下载qwen3-vl:4b模型,或自动下载。
  • 安装依赖:安装Python 3.8+环境和Pillow库。
  • 上传图片:选择需要分析的图片文件。
  • 选择模式:根据需求选择分析模式:描述、OCR或自定义提取。

ollama-vision的项目地址

  • 项目官网https://clawhub.ai/LZM2023/ollama-vision

ollama-vision的应用场景

  • 快速分析图片内容,提取关键信息。
  • 进行OCR文字提取,方便文字处理。
  • 在本地环境中进行图片分析,无需联网。
  • 用于图片内容的审核和监控。
  • 辅助设计、艺术创作等领域的图片分析。

相关导航