Claude 3.5 Computer Use：AI 可以操作电脑了

发布时间：2025-03-15 08:00

标签：

Claude AI Agent Anthropic

最后编辑：2025-03-15 08:00

全文大约 0 字（读完需 1 分钟）

今天 Anthropic 正式开放了 Claude 的 Computer Use 功能。

这是一个里程碑：AI 终于能像人一样操作电脑了。

什么是 Computer Use

简单说，Claude 可以：

看到你的屏幕
移动鼠标
点击按钮
输入文字
执行完整的工作流

比如你说："帮我在 Excel 里做一个销售数据图表"，它会：

打开 Excel
输入数据
选择数据范围
插入图表
调整样式

全程自动完成。

实测效果

测试了几个场景：

网页操作

"帮我在 GitHub 上 star 这个仓库" - ✅ 成功

"帮我发一条微博" - ⚠️ 能打开网页，但中文输入有点问题

软件操作

"用 PS 给这张图加个滤镜" - ✅ 成功，虽然选的滤镜不是我最想要的

"在终端里运行 npm install" - ✅ 成功

复杂任务

"帮我整理下载文件夹，把图片、文档、视频分类" - ✅ 成功，花了两分钟

技术原理

视觉理解：通过截图理解当前屏幕内容
操作规划：把任务分解成一系列操作步骤
执行操作：调用系统 API 控制鼠标键盘
反馈循环：操作后再次截图，确认结果

每次操作都会确认，不会失控。

怎么用

目前有几种方式：

bash

# 使用官方 Docker 镜像
docker run -p 8080:8080 anthropic/computer-use

# 或者用 Python SDK
pip install anthropic
# 需要在允许的环境中运行

注意：出于安全考虑，建议在虚拟机或沙盒环境中使用。

局限性

速度慢：比人类操作慢很多，每步都要截图分析
容易出错：UI 变化、弹窗会让它困惑
安全风险：让 AI 控制电脑需要谨慎

对未来的影响

这是 AI Agent 的一大步。

以后可能真的会有"AI 员工"帮你处理重复性工作：填表格、整理文件、发邮件...

作为学生，学会给 AI 下达正确的指令，可能比自己动手更重要。

什么是 Computer Use ​

实测效果 ​

网页操作 ​

软件操作 ​

复杂任务 ​

技术原理 ​

怎么用 ​

局限性 ​

对未来的影响 ​