谷歌掀桌子！开源Gemma：可商用，性能超过Llama 2！

AIGC动态2年前 (2024)发布 AIGCOPEN

1,998 0 0

作者信息

【原文作者】 AIGC开放社区
【作者简介】 专注AIGC领域的专业社区，关注微软OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！
【微信号】 AIGCOPEN

文章摘要

【关键词】 AIGC、Gemma、谷歌、大语言模型、开源

2月22日，谷歌宣布开源了大语言模型Gemma，该模型与谷歌最新发布的Gemini使用相同架构，提供20亿和70亿两种参数版本。Gemma在多个主流测试平台中表现出色，尤其是在数学、推理和代码能力方面，超越了Llama-2的70亿和130亿模型。Gemma的商用版本已经发布，可以在普通笔记本和台式机上运行，无需大量AI算力。

Gemma的性能之所以强大，归功于其与Gemini相同的技术架构。该架构基于Transformer编码器，采用多查询注意力机制处理长文本。谷歌还提供了开发者指南和其他工具，如Responsible Generative AI Toolkit，以确保Gemma的安全使用。

Gemma支持跨框架、工具和硬件的优化，包括Keras、PyTorch、JAX和Hugging Face Transformers，以及与NVIDIA GPU的合作优化。此外，Gemma已针对Google Cloud进行了优化，提供了广泛的MLOps工具集和推理优化功能。

在性能测试方面，Gemma在MMLU、BBH、GSM8K等测试平台上的表现优于同规模的Llama 2和Mistral模型，证明了其在小参数模型中的高性能。Gemma的开源和商用版本现已开放，为开发者和用户提供了更多的选择。