标签:性能超越
用扩散模型生成网络参数,LeCun点赞尤洋团队新研究
摘要:新加坡国立大学、加州大学伯克利分校和Meta AI Research的研究团队发现了扩散模型的一个新应用方向:生成神经网络的模型参数。这一发现意味着可以使用...
全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,今夜重燃开源之战
摘要总结:谷歌发布了全球最强的开源大模型Gemma,性能超越了Llama 2 13B,标志着谷歌和OpenAI在AI领域的竞争达到了新的高度。Gemma模型有两种规模:2B和7B,...
清华系2B模型杀出,性能吊打LLaMA-13B,170万tokens仅需1块钱!
文章主要介绍了面壁智能与清华大学自然语言处理实验室共同开源的端侧语言大模型MiniCPM系列。MiniCPM-2B模型仅有24亿非词嵌入参数量,但在综合榜单上表现出色...
1
2