内存效率 | 学习AIGC

非Transformer架构新模型爆火，从第一性原理出发，MIT CSAIL衍生团队打造

MIT初创团队Liquid AI推出了一种新型架构模型LFM（Liquid Foundation Model），在性能上超越了同等规模的Transformer模型如Llama3.2。LFM模型包含1.3B和3B两...

AIGC动态

12个月前

MIT系初创公司Liquid AI推出了一种新型多模态非Transformer模型——液体基础模型LFM，该模型在基准测试中超越了现有的Transformer模型，成为新的SOTA（State of...

AIGC动态

12个月前

计算机科学家们提出了一种名为CVM的新算法，用以估算数据流中不同元素的数量。该算法利用随机性，仅需记忆少量条目，便能近似计算长列表中不同条目的总数。这...

AIGC动态

1年前 (2024)

摘要：本文报道了Meta FAIR的田渊栋及其团队最新研究成果，提出了一种名为GaLore的内存高效的LLM训练方法。该方法通过Gradient Low-Rank Projection实现了在...

AIGC动态

2年前 (2024)