标签:稀疏自编码器

谷歌开源Gemma Scope,更好解释大模型工作原理

随着多模态大模型的快速发展,其内部神经网络参数数量庞大,导致开发人员难以控制模型输出内容,容易出现“幻觉”现象。为了解决这一问题,稀疏自编码器(SAE)...

谷歌 Gemma 2 2B 发布火爆,小模型如何撑起大格局?

Google于8月1日推出了Gemma系列语言模型的更新,发布了2B参数版本的模型,这一版本在保持性能的同时实现了体积更小、更安全、更透明的特点。Gemma 2 2B版本通...