丝美导航 AI技能集 安全合规技能

Gemini Computer Use

使用Playwright构建和运行Gemini计算机使用模型,实现Web浏览器任务自动化,提供代理循环和风险UI操作安全确认。

标签:
分享到:

Gemini Computer Use

Gemini Computer Use是什么

Gemini Computer Use是一款基于Playwright的浏览器自动化工具,适用于需要通过Gemini模型自动化Web浏览器任务、实现代理循环和风险UI操作安全确认的场景。

am-will 开发 | 累计安装 3,066 次 | 开源协议:MIT-0

Gemini Computer Use的主要功能

  • 自动化任务:通过Gemini模型自动化Web浏览器任务,提高工作效率。
  • 代理循环:实现截图 → 函数调用 → 操作 → 函数响应的代理循环,满足复杂任务需求。
  • 安全确认:集成风险UI操作的安全确认机制,保障操作安全。
  • Playwright支持:基于Playwright技术,提供强大的Web浏览器自动化能力。
  • 灵活配置:支持浏览器选择、视口大小等配置,满足不同需求。

如何使用Gemini Computer Use

  • 设置环境:复制env.example文件为env.sh,并设置API密钥。
  • 安装依赖:创建虚拟环境,安装google-genai和playwright等依赖。
  • 运行代理脚本:使用指定参数运行computer_use_agent.py脚本。
  • 配置浏览器:选择合适的浏览器和配置文件。
  • 执行任务:根据需求执行自动化任务。

Gemini Computer Use的项目地址

  • 项目官网https://clawhub.ai/am-will/gemini-computer-use

Gemini Computer Use的应用场景

  • 自动化Web浏览器任务,提高工作效率。
  • 实现复杂任务,如代理循环和风险UI操作。
  • 保障操作安全,防止误操作。
  • 适用于需要Web浏览器自动化的开发者和企业。
  • 满足不同浏览器和配置需求。

相关导航