“数据规模”的搜索结果

大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘
本文探讨了大模型性能与训练数据规模、模型架构等设计要素之间的关系,即Scaling Law。研究者们主要关注了迁移学习中的Scaling Law,即...
用扩散模型生成网络参数,LeCun点赞尤洋团队新研究
摘要:新加坡国立大学、加州大学伯克利分校和Meta AI Research的研究团队发现了扩散模型的一个新应用方向:生成神经网络的模型参数。这...
如何看待谷歌开源大模型 Gemma:被迫入局、开源力度不够、2024 会有小模型黑马出现
Google 发布了全新的开源模型系列「Gemma」,这标志着 Google 在开源大模型领域的重磅回归。Gemma 模型相比 Gemini 更加轻量,提供了 2B...
RNN模型挑战Transformer霸权!1%成本性能比肩Mistral-7B,支持100+种语言全球最多
RWKV团队强调了多语言支持的重要性,他们的目标是构建一个包容性的AI,不仅服务于英语世界,而是为全球人口提供帮助。他们计划逐渐扩大...
1 2 3