闭源赶超GPT-4 Turbo、开源击败Llama-3-70B，歪果仁：这中国大模型真香

AIGC动态2周前发布 almosthuman2014

71 0 0

闭源赶超GPT-4 Turbo、开源击败Llama-3-70B，歪果仁：这中国大模型真香

文章摘要

本文是关于阿里云通义千问大模型（Qwen）的一周年回顾和总结。文章首先提到，通义千问在闭源和开源领域都取得了显著成绩，引起了国内外开发者的关注。文章通过一系列数据和实例，展示了通义千问在人工智能领域的领先地位。

文章指出，通义千问在HuggingFace开源大模型排行榜上超越了Meta的Llama-3-70B模型，显示出其强大的性能。此外，通义千问的多语言能力也得到了认可，如在越南和韩国的MMLU基准测试中取得了优异成绩。

文章还提到了通义千问在医疗知识领域的应用潜力，以及其在不同参数量级上的表现。例如，Qwen1.5-72B模型在多个评测中表现突出，并在Chatbot Arena平台上多次进入全球Top 10。此外，Qwen1.5-72B还展现出了卓越的多语言能力。

文章强调了通义千问在开源领域的全尺寸覆盖，以及通过MoE（Mixture of Experts）等技术优化推理成本的努力。这使得通义千问在各种应用场景中都具有广泛的适用性。

最后，文章提到了阿里云最新发布的通义千问2.5模型，该模型在中文场景中超越了GPT-4 Turbo，成为地表最强中文大模型。这标志着国产大模型在核心竞技场的竞争力得到了显著提升。

总结来说，文章通过详细的数据和实例，展示了通义千问大模型在人工智能领域的领先地位，以及其在多语言处理、医疗知识应用和开源领域的卓越表现。同时，文章也展望了通义千问未来的发展潜力和应用前景。

原文和模型

【原文链接】 阅读原文 [ 5674字 | 23分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

Moonshot AI

月之暗面 (Moonshot AI) 创立于2023年3月，致力于寻求将能源转化为智能的最优解，通过产品与用户共创智能，2023年10月推出全球首个支持输入20万汉字的智能助手产品Kimi。创始团队核心成员参与了 Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发，多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。