AIGC动态

AIGC,AGI,人工智能

DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍

DeepSeek V3/R1等大模型在开源社区广泛应用的背景下,如何通过后训练技术实现低成本、高质量的私有模型定制成为行业焦点。Colossal-AI推出的开源大模型后训练...

Claude挣钱强于o1!OpenAI开源百万美元编码基准,检验大模型钞能力

OpenAI推出并开源了全新基准测试SWE-Lancer,旨在通过真实软件工程任务评估大模型的编码能力。该基准包含来自自由职业平台Upwork的1,488个任务,总价值达100...

发论文亲自上?创业十多年,DeepSeek梁文锋的“技术男”属性从没改变

DeepSeek团队近日发布新论文,提出名为Native Sparse Attention(NSA)的新型注意力机制。该机制通过动态分层稀疏策略,结合粗粒度标记压缩与细粒度标记选择...

奥特曼押注惨败,爆火Ai Pin已死!ChatGPT版iPhone终结,惠普1.16亿美元接盘

* * *曾被视为“ChatGPT版iPhone”的AI可穿戴设备Ai Pin,在经历短暂的市场热潮后宣告失败。其开发公司Humane近日被惠普以1.16亿美元收购,交易涵盖核心AI技术...

最大参数 300 亿!阶跃星辰与吉利联合开源两款多模态大模型

阶跃星辰与吉利汽车集团联合宣布,将Step系列多模态大模型向全球开发者开源。此次开源包含参数量达300亿的Step-Video-T2V视频生成模型,以及产品级开源语音交...

宇树机器人跳舞被疑AI合成,王兴兴发新视频自证,小红书:还是疑似AI合成

一段展示宇树G1人形机器人灵活舞姿的视频引发广泛讨论。该视频由宇树科技CEO王兴兴在小红书平台发布,视频中特意放置的镜子成为关键证据,旨在回应此前关于机...

DeepSeek满血微调秘籍开源!站在巨人肩膀打造私有模型,一手教程在此

Colossal-AI团队近期推出开源大模型后训练工具箱,为开发者提供低成本构建私有模型的解决方案。该工具箱支持对DeepSeek-V3/R1-671B等大模型进行全流程优化,...

Elon Musk用20万个GPU打造Grok 3,目标是100万GPU

伊隆·马斯克与xAI团队近日发布新一代AI聊天机器人Grok 3,宣称其具备“地球上最聪明AI”的能力。该模型在复杂物理、高等数学及编程任务中展现出显著优势,独立...

FOPLP来袭,CoWoS压力大增

人工智能的爆发性增长推动台积电CoWoS先进封装技术需求激增,2024年该技术贡献超70亿美元营收,预计2025年营收占比将提升至10%。台积电持续扩大CoWoS产能的同...

杨植麟和梁文锋,论文撞车了

在马斯克发布Grok3的同一天,DeepSeek与月之暗面分别发布论文,针对Transformer架构的核心注意力机制提出创新方案。DeepSeek的原生稀疏注意力(NSA)通过语义...
1 259 260 261 262 263 317