谷歌掀桌子!开源Gemma:可商用,性能超过Llama 2!

AIGC动态9个月前发布 AIGCOPEN
841 0 0

作者信息


【原文作者】 AIGC开放社区
【作者简介】 专注AIGC领域的专业社区,关注微软OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
【微 信 号】 AIGCOPEN

谷歌掀桌子!开源Gemma:可商用,性能超过Llama 2!
 

文章摘要


【关 键 词】 AIGCGemma谷歌大语言模型开源

2月22日,谷歌宣布开源了大语言模型Gemma,该模型与谷歌最新发布的Gemini使用相同架构,提供20亿和70亿两种参数版本。Gemma在多个主流测试平台中表现出色,尤其是在数学、推理和代码能力方面,超越了Llama-2的70亿和130亿模型。Gemma的商用版本已经发布,可以在普通笔记本和台式机上运行,无需大量AI算力。

Gemma的性能之所以强大,归功于其与Gemini相同的技术架构。该架构基于Transformer编码器,采用多查询注意力机制处理长文本。谷歌还提供了开发者指南和其他工具,如Responsible Generative AI Toolkit,以确保Gemma的安全使用。

Gemma支持跨框架、工具和硬件的优化,包括Keras、PyTorch、JAX和Hugging Face Transformers,以及与NVIDIA GPU的合作优化。此外,Gemma已针对Google Cloud进行了优化,提供了广泛的MLOps工具集和推理优化功能。

在性能测试方面,Gemma在MMLU、BBH、GSM8K等测试平台上的表现优于同规模的Llama 2和Mistral模型,证明了其在小参数模型中的高性能。Gemma的开源和商用版本现已开放,为开发者和用户提供了更多的选择。

原文信息


【原文链接】 阅读原文
【原文字数】 1026
【阅读时长】 4分钟

© 版权声明

相关文章

暂无评论

暂无评论...