通义千问 2.5 开源：阿里的开源大模型之路

发布时间：2025-05-20 08:00

标签：

通义千问阿里巴巴开源AI

最后编辑：2025-05-20 08:00

全文大约 0 字（读完需 1 分钟）

阿里在开源大模型上一直挺积极，通义千问 2.5 继续了这个路线。

模型家族

Qwen 2.5 包括多个尺寸：

0.5B / 1.5B / 3B：手机端可跑
7B / 14B：消费级显卡可跑
32B / 72B：需要专业显卡
Coder 系列：专门针对代码优化
Math 系列：专门针对数学优化

全部 Apache 2.0 开源，商用友好。

性能表现

72B-Instruct 官方测试：

测试项	Qwen 2.5 72B	Llama 3.1 70B	GPT-4o mini
MMLU	86.1	83.6	82.0
HumanEval	86.6	80.5	87.2
MATH	83.1	68.0	70.2
中文理解	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐

中文能力是强项，毕竟是国内团队做的。

本地部署

用 Ollama 最简单：

bash

# 跑 7B 版本（需要 8GB 显存）
ollama run qwen2.5:7b

# 跑 14B 版本（需要 16GB 显存）
ollama run qwen2.5:14b

7B 版本在笔记本上跑得很流畅，日常问答足够。

特色功能

代码能力

Qwen2.5-Coder 是单独的代码模型，在 HumanEval 上得分 92.7%。

可以替代一部分 Copilot 的功能。

长上下文

支持 128K 上下文，把整个项目扔进去问问题没问题。

工具调用

支持 Function Calling，可以接入外部 API。

和其他国产模型对比

模型	开源	中文能力	代码能力	部署难度
Qwen 2.5	✅	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	简单
DeepSeek	✅	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	中等
百川	✅	⭐⭐⭐⭐	⭐⭐⭐	简单
ChatGLM	✅	⭐⭐⭐⭐	⭐⭐⭐	简单

Qwen 和 DeepSeek 是目前国产开源的第一梯队。

总结

Qwen 2.5 是学习和实验的好选择：

开源免费
中文效果好
部署简单
社区活跃

对于想在本地跑 AI 模型的同学，强烈推荐试试。

模型家族 ​

性能表现 ​

本地部署 ​

特色功能 ​

代码能力 ​

长上下文 ​

工具调用 ​

和其他国产模型对比 ​

总结 ​