标签:moonshot-v1-32k

ICLR 2024 | 连续学习不怕丢西瓜捡芝麻,神经形态方法保护旧知识

近年来,脉冲神经网络(SNN)和脑启发的神经形态计算因其低功耗特性而受到关注。神经形态计算模拟生物神经元的特性,如存内计算和事件驱动计算,以实现高效的...

一口气读完甄嬛传剧本、大部头医书:月之暗面200万字上下文Kimi开启内测

月之暗面(Moonshot AI)公司近期宣布了其Kimi智能助手在人工智能领域的重大突破,成功将AI模型支持的上下文长度提升至200万字,实现了所谓的“无损压缩”。这...

英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍

英伟达在2023年的GTC开发者大会上发布了一款名为Blackwell的新型GPU,标志着AI算力的显著提升。Blackwell平台的GPU采用多芯片封装(MCM)设计,集成了两个GPU...

现场直击GTC|最科幻发布会,性能翻30倍的恐怖Blackwell芯片,黄仁勋宣告“新工业革命”来了

在2024年3月18日的GTC上,英伟达创始人黄仁勋被认为正式成为新的乔布斯。在这场发布会中,黄仁勋在SAP中心的舞台上展示了英伟达的最新技术成果,让现场的许多...

可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」

。随着视觉生成领域的快速发展,在该领域取得了重大突破。然而,仅依赖文本来调节这些模型并不能满足多样化和复杂需求。因此,研究人员开始探索在T2I模型中引...

奥特曼专访自曝全新GPT-5细节:性能跃升超想象,算力足可达AGI!

,首次公开表示,将会有史诗级提升,任何低估其潜力的人和公司都将被碾压。他认为,未来AI将成为推动文明发展的核心动力。Altman在硅谷出席活动时表示,的性...

老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代

英伟达在GTC人工智能大会上发布了其最新一代性能巨兽——Blackwell B200 GPU和GB200超级芯片。这款芯片被命名为Blackwell,以纪念著名数学家David Blackwell对...

能炼10万亿参数模型!黄仁勋发布全新架构GPU,性能提升30倍,H100已成过去时

在GTC 2024发布会上,英伟达CEO黄仁勋宣布了一系列新产品,包括目前最强大的AI芯片Blackwell B200、NIM推理引擎、人形机器人平台Project GR00T和Omniverse的...

如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念

深度学习模型因其在从大量数据中学习潜在关系的能力而彻底改变了科学研究领域。然而,这些纯粹依赖数据驱动的模型存在局限性,如过度依赖数据、泛化能力受限...

马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载

马斯克旗下的大模型公司xAI宣布正式开源了3140亿参数的混合专家(MoE)模型「Grok-1」,这是目前参数量最大的开源大语言模型。Grok-1模型从头开始训练,没有...
1 10 11 12 13 14 37