大模型圈最新现状：一半在用DeepSeek，另一半在玩“颜文字”？

1,782 0 0

文章摘要

近期，大模型领域出现了两个引人注目的焦点：DeepSeek和阿里通义千问开源的Qwen系列模型。阿里在9月发布了Qwen2.5系列，包含从0.5B到72B参数的多个版本，覆盖多模态和多语言能力，迅速成为全球顶尖开源模型之一。Qwen团队以其独特的命名风格和高性能AI模型引发关注，如QVQ和QwQ，这些模型不仅在技术社区中流行，还在社交媒体和技术论坛上广受欢迎。

Qwen2.5-1.5B-Instruct模型的下载量占比高达26.6%，超过了其他明星开源模型，显示了其广泛的应用和高人气。Qwen2.5系列的成功，标志着中国公司开发的开源大模型在国际舞台上的影响力日益增强。QVQ-72B-Preview作为首个开源多模态推理模型，能够分析图像并进行推理，其性能在基准测试中超越了前身Qwen2-VL-72B-Instruct，达到了与OpenAI的o1和Google的Flash Thinking相近的准确水平。

QwQ-32B-Preview是Qwen团队发布的首个开源推理模型，专注于增强AI推理能力，其深度自省能力使其在多个评测中取得了优异成绩。Qwen2.5-Coder在编程基准测试中表现出色，与前沿模型相媲美，其开源性为AI社区带来了新的可能性。

Qwen2.5系列的全球化特点使其能够满足不同用户的需求，从资源受限设备到企业级应用。在日本，阿里云与东京大学初创企业Lightblue合作，提升了日语大型语言模型的准确性。Qwen在处理多种语言方面表现出色，即使是全球AI训练数据较少的“小语种”，也能应对。

中国AI开源势力的崛起为国内企业提供了更多选择和可能性，Qwen等模型的崛起证明了中国AI领域的实力和竞争力。CNBC指出，中国在LLM方面取得了显著进展，Qwen、DeepSeek等模型在某些方面已经超越了美国的竞争对手。中国公司正积极拥抱开源模式，推动AI技术的发展和应用，以促进创新并扩大全球影响力。Hugging Face的CEO Clem预测，中国将开始引领人工智能竞赛，这主要得益于其在开源人工智能竞赛中的领先地位。开放的心态和对工程实践的重视正在加速中国AI行业的发展，中国AI产业正以开源模型为代表向世界证明其全球竞争力。