大模型圈最新现状:一半在用DeepSeek,另一半在玩“颜文字”?

AIGC动态6天前发布 Si-Planet
170 0 0
大模型圈最新现状:一半在用DeepSeek,另一半在玩“颜文字”?

 

文章摘要


【关 键 词】 AI模型开源多模态多语言中国AI

近期,大模型领域出现了两个引人注目的焦点:DeepSeek和阿里通义千问开源的Qwen系列模型。阿里在9月发布了Qwen2.5系列,包含从0.5B到72B参数的多个版本,覆盖多模态多语言能力,迅速成为全球顶尖开源模型之一。Qwen团队以其独特的命名风格和高性能AI模型引发关注,如QVQ和QwQ,这些模型不仅在技术社区中流行,还在社交媒体和技术论坛上广受欢迎。

Qwen2.5-1.5B-Instruct模型的下载量占比高达26.6%,超过了其他明星开源模型,显示了其广泛的应用和高人气。Qwen2.5系列的成功,标志着中国公司开发的开源大模型在国际舞台上的影响力日益增强。QVQ-72B-Preview作为首个开源多模态推理模型,能够分析图像并进行推理,其性能在基准测试中超越了前身Qwen2-VL-72B-Instruct,达到了与OpenAI的o1和Google的Flash Thinking相近的准确水平。

QwQ-32B-Preview是Qwen团队发布的首个开源推理模型,专注于增强AI推理能力,其深度自省能力使其在多个评测中取得了优异成绩。Qwen2.5-Coder在编程基准测试中表现出色,与前沿模型相媲美,其开源性为AI社区带来了新的可能性。

Qwen2.5系列的全球化特点使其能够满足不同用户的需求,从资源受限设备到企业级应用。在日本,阿里云与东京大学初创企业Lightblue合作,提升了日语大型语言模型的准确性。Qwen在处理多种语言方面表现出色,即使是全球AI训练数据较少的“小语种”,也能应对。

中国AI开源势力的崛起为国内企业提供了更多选择和可能性,Qwen等模型的崛起证明了中国AI领域的实力和竞争力。CNBC指出,中国在LLM方面取得了显著进展,Qwen、DeepSeek等模型在某些方面已经超越了美国的竞争对手。中国公司正积极拥抱开源模式,推动AI技术的发展和应用,以促进创新并扩大全球影响力。Hugging Face的CEO Clem预测,中国将开始引领人工智能竞赛,这主要得益于其在开源人工智能竞赛中的领先地位。开放的心态和对工程实践的重视正在加速中国AI行业的发展,中国AI产业正以开源模型为代表向世界证明其全球竞争力。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2546字 | 11分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...