Skip to content

Claude 3.5 Computer Use:AI 可以操作电脑了

发布时间:2025-03-15 08:00
最后编辑:2025-03-15 08:00
全文大约 0 字(读完需 1 分钟)

今天 Anthropic 正式开放了 Claude 的 Computer Use 功能。

这是一个里程碑:AI 终于能像人一样操作电脑了。

什么是 Computer Use

简单说,Claude 可以:

  • 看到你的屏幕
  • 移动鼠标
  • 点击按钮
  • 输入文字
  • 执行完整的工作流

比如你说:"帮我在 Excel 里做一个销售数据图表",它会:

  1. 打开 Excel
  2. 输入数据
  3. 选择数据范围
  4. 插入图表
  5. 调整样式

全程自动完成。

实测效果

测试了几个场景:

网页操作

"帮我在 GitHub 上 star 这个仓库" - ✅ 成功

"帮我发一条微博" - ⚠️ 能打开网页,但中文输入有点问题

软件操作

"用 PS 给这张图加个滤镜" - ✅ 成功,虽然选的滤镜不是我最想要的

"在终端里运行 npm install" - ✅ 成功

复杂任务

"帮我整理下载文件夹,把图片、文档、视频分类" - ✅ 成功,花了两分钟

技术原理

  1. 视觉理解:通过截图理解当前屏幕内容
  2. 操作规划:把任务分解成一系列操作步骤
  3. 执行操作:调用系统 API 控制鼠标键盘
  4. 反馈循环:操作后再次截图,确认结果

每次操作都会确认,不会失控。

怎么用

目前有几种方式:

bash
# 使用官方 Docker 镜像
docker run -p 8080:8080 anthropic/computer-use

# 或者用 Python SDK
pip install anthropic
# 需要在允许的环境中运行

注意:出于安全考虑,建议在虚拟机或沙盒环境中使用。

局限性

  1. 速度慢:比人类操作慢很多,每步都要截图分析
  2. 容易出错:UI 变化、弹窗会让它困惑
  3. 安全风险:让 AI 控制电脑需要谨慎

对未来的影响

这是 AI Agent 的一大步。

以后可能真的会有"AI 员工"帮你处理重复性工作:填表格、整理文件、发邮件...

作为学生,学会给 AI 下达正确的指令,可能比自己动手更重要。

Built with ❤️ using VitePress v2 & Vue & Vite