Skip to content

Llama 3.1 405B 开源:Meta 改变了游戏规则

发布时间:2024-07-24 08:00
最后编辑:2024-07-24 08:00
全文大约 0 字(读完需 1 分钟)

昨天 Meta 低调发布了 Llama 3.1,包括 8B、70B 和 405B 三个版本。

405B 是重点。这是目前最大的开源模型,性能在多个基准上接近甚至超越 GPT-4。

性能基准

官方给出的测试结果:

测试项Llama 3.1 405BGPT-4Claude 3.5 Sonnet
MMLU88.686.488.7
HumanEval89.067.092.0
GSM8K96.892.096.4

在代码生成和数学推理上表现亮眼。

为什么这很重要

开源模型能达到闭源顶级模型水平,意义重大:

  1. 成本下降:自己部署不用付 API 费
  2. 数据安全:敏感数据不用传给第三方
  3. 可定制:能微调适应特定场景
  4. 竞争压力:OpenAI 和 Anthropic 必须加速迭代

怎么跑起来

405B 参数量太大,普通人跑不动。但可以用量化版本:

bash
# 使用 Ollama 跑 8B 版本
ollama run llama3.1:8b

# 或者用 70B 量化版(需要 48GB 显存)
ollama run llama3.1:70b-instruct-q4_0

8B 版本在 8GB 显存的笔记本上就能跑,效果已经很不错了。

本地测试感受

我在 3060 显卡上跑了 8B 版本:

  • 响应速度:约 20 tokens/秒,可接受
  • 中文能力:比 Llama 2 进步明显,基本能用
  • 代码能力:简单代码补全没问题

日常学习和练手完全够用了。

总结

Llama 3.1 让"AI 民主化"这个口号更接近现实。

作为学生,我们现在可以免费用上接近顶级水平的 AI 模型。这在两年前不可想象。

Built with ❤️ using VitePress v2 & Vue & Vite