Skip to content
通义千问 2.5 开源:阿里的开源大模型之路
阿里在开源大模型上一直挺积极,通义千问 2.5 继续了这个路线。
模型家族
Qwen 2.5 包括多个尺寸:
- 0.5B / 1.5B / 3B:手机端可跑
- 7B / 14B:消费级显卡可跑
- 32B / 72B:需要专业显卡
- Coder 系列:专门针对代码优化
- Math 系列:专门针对数学优化
全部 Apache 2.0 开源,商用友好。
性能表现
72B-Instruct 官方测试:
| 测试项 | Qwen 2.5 72B | Llama 3.1 70B | GPT-4o mini |
|---|---|---|---|
| MMLU | 86.1 | 83.6 | 82.0 |
| HumanEval | 86.6 | 80.5 | 87.2 |
| MATH | 83.1 | 68.0 | 70.2 |
| 中文理解 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ |
中文能力是强项,毕竟是国内团队做的。
本地部署
用 Ollama 最简单:
bash
# 跑 7B 版本(需要 8GB 显存)
ollama run qwen2.5:7b
# 跑 14B 版本(需要 16GB 显存)
ollama run qwen2.5:14b7B 版本在笔记本上跑得很流畅,日常问答足够。
特色功能
代码能力
Qwen2.5-Coder 是单独的代码模型,在 HumanEval 上得分 92.7%。
可以替代一部分 Copilot 的功能。
长上下文
支持 128K 上下文,把整个项目扔进去问问题没问题。
工具调用
支持 Function Calling,可以接入外部 API。
和其他国产模型对比
| 模型 | 开源 | 中文能力 | 代码能力 | 部署难度 |
|---|---|---|---|---|
| Qwen 2.5 | ✅ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 简单 |
| DeepSeek | ✅ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 中等 |
| 百川 | ✅ | ⭐⭐⭐⭐ | ⭐⭐⭐ | 简单 |
| ChatGLM | ✅ | ⭐⭐⭐⭐ | ⭐⭐⭐ | 简单 |
Qwen 和 DeepSeek 是目前国产开源的第一梯队。
总结
Qwen 2.5 是学习和实验的好选择:
- 开源免费
- 中文效果好
- 部署简单
- 社区活跃
对于想在本地跑 AI 模型的同学,强烈推荐试试。
