Skip to content

通义千问 2.5 开源:阿里的开源大模型之路

发布时间:2025-05-20 08:00
最后编辑:2025-05-20 08:00
全文大约 0 字(读完需 1 分钟)

阿里在开源大模型上一直挺积极,通义千问 2.5 继续了这个路线。

模型家族

Qwen 2.5 包括多个尺寸:

  • 0.5B / 1.5B / 3B:手机端可跑
  • 7B / 14B:消费级显卡可跑
  • 32B / 72B:需要专业显卡
  • Coder 系列:专门针对代码优化
  • Math 系列:专门针对数学优化

全部 Apache 2.0 开源,商用友好。

性能表现

72B-Instruct 官方测试:

测试项Qwen 2.5 72BLlama 3.1 70BGPT-4o mini
MMLU86.183.682.0
HumanEval86.680.587.2
MATH83.168.070.2
中文理解⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐

中文能力是强项,毕竟是国内团队做的。

本地部署

用 Ollama 最简单:

bash
# 跑 7B 版本(需要 8GB 显存)
ollama run qwen2.5:7b

# 跑 14B 版本(需要 16GB 显存)
ollama run qwen2.5:14b

7B 版本在笔记本上跑得很流畅,日常问答足够。

特色功能

代码能力

Qwen2.5-Coder 是单独的代码模型,在 HumanEval 上得分 92.7%。

可以替代一部分 Copilot 的功能。

长上下文

支持 128K 上下文,把整个项目扔进去问问题没问题。

工具调用

支持 Function Calling,可以接入外部 API。

和其他国产模型对比

模型开源中文能力代码能力部署难度
Qwen 2.5⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐简单
DeepSeek⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐中等
百川⭐⭐⭐⭐⭐⭐⭐简单
ChatGLM⭐⭐⭐⭐⭐⭐⭐简单

Qwen 和 DeepSeek 是目前国产开源的第一梯队。

总结

Qwen 2.5 是学习和实验的好选择:

  • 开源免费
  • 中文效果好
  • 部署简单
  • 社区活跃

对于想在本地跑 AI 模型的同学,强烈推荐试试。

Built with ❤️ using VitePress v2 & Vue & Vite