Llama 3.1 405B 开源：Meta 改变了游戏规则

发布时间：2024-07-24 08:00

标签：

最后编辑：2024-07-24 08:00

全文大约 0 字（读完需 1 分钟）

昨天 Meta 低调发布了 Llama 3.1，包括 8B、70B 和 405B 三个版本。

405B 是重点。这是目前最大的开源模型，性能在多个基准上接近甚至超越 GPT-4。

性能基准

官方给出的测试结果：

测试项	Llama 3.1 405B	GPT-4	Claude 3.5 Sonnet
MMLU	88.6	86.4	88.7
HumanEval	89.0	67.0	92.0
GSM8K	96.8	92.0	96.4

在代码生成和数学推理上表现亮眼。

开源模型能达到闭源顶级模型水平，意义重大：

405B 参数量太大，普通人跑不动。但可以用量化版本：

bash

# 使用 Ollama 跑 8B 版本
ollama run llama3.1:8b

# 或者用 70B 量化版（需要 48GB 显存）
ollama run llama3.1:70b-instruct-q4_0

8B 版本在 8GB 显存的笔记本上就能跑，效果已经很不错了。

我在 3060 显卡上跑了 8B 版本：

日常学习和练手完全够用了。

Llama 3.1 让"AI 民主化"这个口号更接近现实。

作为学生，我们现在可以免费用上接近顶级水平的 AI 模型。这在两年前不可想象。