
Gemini Computer Use是什么
Gemini Computer Use是一款基于Playwright的浏览器自动化工具,适用于需要通过Gemini模型自动化Web浏览器任务、实现代理循环和风险UI操作安全确认的场景。
由 am-will 开发 | 累计安装 3,066 次 | 开源协议:MIT-0
Gemini Computer Use的主要功能
- 自动化任务:通过Gemini模型自动化Web浏览器任务,提高工作效率。
- 代理循环:实现截图 → 函数调用 → 操作 → 函数响应的代理循环,满足复杂任务需求。
- 安全确认:集成风险UI操作的安全确认机制,保障操作安全。
- Playwright支持:基于Playwright技术,提供强大的Web浏览器自动化能力。
- 灵活配置:支持浏览器选择、视口大小等配置,满足不同需求。
如何使用Gemini Computer Use
- 设置环境:复制env.example文件为env.sh,并设置API密钥。
- 安装依赖:创建虚拟环境,安装google-genai和playwright等依赖。
- 运行代理脚本:使用指定参数运行computer_use_agent.py脚本。
- 配置浏览器:选择合适的浏览器和配置文件。
- 执行任务:根据需求执行自动化任务。
Gemini Computer Use的项目地址
- 项目官网:https://clawhub.ai/am-will/gemini-computer-use
Gemini Computer Use的应用场景
- 自动化Web浏览器任务,提高工作效率。
- 实现复杂任务,如代理循环和风险UI操作。
- 保障操作安全,防止误操作。
- 适用于需要Web浏览器自动化的开发者和企业。
- 满足不同浏览器和配置需求。
Zown Gemini Governor
ZenMux Image Gen (Nano Banana 2)
Video Understanding
Veo 3 Video Gen (Gemini API)
Unified LLM Gateway - One API for 70+ AI models. R
Unified API for powerful image and video generatio
Transcribe audio files via OpenRouter using audio-
Skill X Post Ai Image
Skill Veo3 Video Gen
Security News Feed
research
PDF OCR Using Gemini LLM
渝公网安备50011302222466号
暂无评论