微软官宣All in智能体,SWE Agent首曝光!奥特曼预警2025编程巨变

2025年,软件工程领域将迎来重大变革,AI智能体的全面应用将成为这一变化的核心推动力。微软GitHub Copilot的全新升级展示了自主SWE智能体(项目代号Padawan...

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

大模型时代的到来使算力成为技术发展的核心驱动力,同时也带来了大规模、高弹性、低成本的算力需求挑战。为了应对这一趋势,清微智能推出了基于可重构计算架...

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

群组相对策略优化(GRPO)作为一种在线学习算法,通过使用训练过程中由模型自身生成的数据进行迭代改进,已因其高效性和易用性成为大型语言模型强化学习中的...

美国朝中国DeepSeek打了一记重拳|钛媒体AGI

DeepSeek作为中国开源AI公司,其迅速崛起在全球范围内引发了广泛的关注与讨论。美国企业界、学术界和政府机构已展开多方面的应对行动,试图在技术、政策和投...

台积电眼里的晶体管未来

半导体技术自20世纪中叶以来深刻改变了工业和社会,其发展历程以晶体管的发明为起点。点接触晶体管的发明与双极结型晶体管的发展开启了半导体时代,锗最初因...

“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑,上海交大本科生新“低成本推理”或成新宠!

斯坦福大学和华盛顿大学的研究人员开发了一个名为 s1 的人工智能推理模型,该模型以不到 50 美元的云计算成本成功训练而成,并在数学和编码能力测试中表现出...

国产万卡集群落地,为中国AI创新按下“加速键”

随着DeepSeek的出现,AI领域迎来了一场“效率革命”,通过优化模型架构和算法创新显著提升了性能并降低了成本。然而,这种效率提升并未减少算力需求,反而因应...

没了800美元关税豁免,TEMU和SHEIN给自己正名的时候到了

美国对中国商品加征关税的政策调整,特别是取消“最低限度”贸易豁免规则,对跨境电商平台如Temu和SHEIN带来了直接冲击。之前这些平台利用该规则,通过将价值低...

当DeepSeek改写AI叙事,突破“内存墙”的MRDIMM将是下一个爆点?

DeepSeek作为一款快速崛起的AI应用,正以其开源和低价策略颠覆全球AI行业生态。该应用在上线20天内日活跃用户突破2000万,并以ChatGPT 23%的日活量迅速占领市...

我问deepseek,为啥中科院干不出来一个deepseek?它说:专家们在讨论必要性,而他却抵押了房产开干

中科院未能推出类似DeepSeek的突破性人工智能产品,原因涉及科技创新体制、资源配置、激励机制等多方面因素。其问题可从目标定位、资源配置、人才激励、创新...
1 36 37 38 39 40 734