“架构”的搜索结果

新智元报道了Meta、南加州大学（USC）、CMU和UCSD联合提出的革命性新架构Megalodon，旨在处理无限上下文，并在2万亿token训练任务中超越...

AIGC动态

6个月前

本文讨论了构建大规模AI/ML数据管道的方法，并探讨了如何选择适合的存储方案来优化各类AI/ML工作负载。文章中，来自Google和Toyota的专...

AIGC动态

6个月前

大模型应用的 10 种架构模式

在这篇文章中，作者曹洪伟深入探讨了大模型应用在人工智能领域的设计方法和架构模式。文章首先指出，在新兴技术如生成式AI领域，我们缺...

AIGC动态

6个月前

清华大学的研究团队开发了一种名为「太极」的AI光芯片，这是一种使用光而非电来处理数据的新型芯片。这项技术的亮点在于其高效的能源利...

AIGC动态

6个月前

这篇文章主要介绍了朱泽园和李远志最新研究的内容，标题为《语言模型物理学 Part 3.3：知识的 Scaling Laws》。他们通过海量实验总结了1...

AIGC动态

6个月前

谷歌最近更新了其Transformer架构，推出了一种名为Mixture-of-Depths（MoD）的新技术。这项技术通过动态分配大模型中的计算资源，跳过一...

AIGC动态

7个月前

昆仑万维近期宣布了其AI音乐生成大模型「天工SkyMusic」的开放邀测，这一模型基于公司的「天工3.0」超级大模型构建。这个模型的亮点在于...

AI-Agent

7个月前

新智元报道了英伟达新一代GPU——Blackwell架构的B100和B200的发布，这款新GPU在硬件规格上令人震撼，同时也引发了对其售价和成本的广泛讨...

AIGC动态

7个月前

在探讨LLM-based时代的应用开发时，我们必须打破传统思维的束缚，正如iphone在手机行业的颠覆性创新一样，AI时代可能会彻底改变我们使用...

AI-Agent

7个月前

AI研究实验室AI21最近开源了其基于SSM-Transformer混合架构的商业大模型——Jamba。这个模型在传统的Transformer架构上加入了结构化状态空...

AIGC动态

7个月前