Skip to content
Claude 3.5 Computer Use:AI 可以操作电脑了
今天 Anthropic 正式开放了 Claude 的 Computer Use 功能。
这是一个里程碑:AI 终于能像人一样操作电脑了。
什么是 Computer Use
简单说,Claude 可以:
- 看到你的屏幕
- 移动鼠标
- 点击按钮
- 输入文字
- 执行完整的工作流
比如你说:"帮我在 Excel 里做一个销售数据图表",它会:
- 打开 Excel
- 输入数据
- 选择数据范围
- 插入图表
- 调整样式
全程自动完成。
实测效果
测试了几个场景:
网页操作
"帮我在 GitHub 上 star 这个仓库" - ✅ 成功
"帮我发一条微博" - ⚠️ 能打开网页,但中文输入有点问题
软件操作
"用 PS 给这张图加个滤镜" - ✅ 成功,虽然选的滤镜不是我最想要的
"在终端里运行 npm install" - ✅ 成功
复杂任务
"帮我整理下载文件夹,把图片、文档、视频分类" - ✅ 成功,花了两分钟
技术原理
- 视觉理解:通过截图理解当前屏幕内容
- 操作规划:把任务分解成一系列操作步骤
- 执行操作:调用系统 API 控制鼠标键盘
- 反馈循环:操作后再次截图,确认结果
每次操作都会确认,不会失控。
怎么用
目前有几种方式:
bash
# 使用官方 Docker 镜像
docker run -p 8080:8080 anthropic/computer-use
# 或者用 Python SDK
pip install anthropic
# 需要在允许的环境中运行注意:出于安全考虑,建议在虚拟机或沙盒环境中使用。
局限性
- 速度慢:比人类操作慢很多,每步都要截图分析
- 容易出错:UI 变化、弹窗会让它困惑
- 安全风险:让 AI 控制电脑需要谨慎
对未来的影响
这是 AI Agent 的一大步。
以后可能真的会有"AI 员工"帮你处理重复性工作:填表格、整理文件、发邮件...
作为学生,学会给 AI 下达正确的指令,可能比自己动手更重要。
