丝美导航 AI技能集 AI智能技能

Midscene Automations Skills for Browser

Midscene Automations Skills for Browser是一款基于视觉驱动的浏览器自动化工具,无需DOM或无障碍标签,通过截图操作实现所有可见元素的交互。

标签:
分享到:

Midscene Automations Skills for Browser

Midscene Automations Skills for Browser是什么

Midscene Automations Skills for Browser是一款免费、基于视觉的浏览器自动化工具,适用于需要浏览、数据抓取、UI验证或网页截图的场景。

quanru 开发 | 累计安装 265 次 | 开源协议:MIT-0

Midscene Automations Skills for Browser的主要功能

  • 视觉驱动:完全基于截图操作,无需DOM或无障碍标签,简化自动化流程。
  • 无需安装:无需额外安装,通过npx执行,简化使用步骤。
  • 免费使用:遵循MIT-0许可证,免费使用、修改和重新分发。
  • 安全扫描:经过VirusTotal和OpenClaw安全扫描,确保使用安全。
  • 任务同步:每个命令同步运行,确保自动化流程的连贯性。

如何使用Midscene Automations Skills for Browser

  • 配置环境:配置Midscene模型API密钥。
  • 启动浏览器:使用npx @midscene/web自动化网络浏览启动持久化的无头Chrome。
  • 执行命令:根据截图决定采取的行动,执行Midscene命令。
  • 读取输出:读取命令输出,包括截图和关键数据。
  • 报告结果:在任务完成后,主动总结结果给用户。

Midscene Automations Skills for Browser的项目地址

  • 项目官网https://clawhub.ai/quanru/midscene-computer-browser

Midscene Automations Skills for Browser的应用场景

  • 自动化网页浏览和导航
  • 从网站抓取、提取或收集数据
  • 验证或测试前端UI行为
  • 生成网页截图
  • 与现有浏览器标签页协同工作

相关导航