图像生成
图像,绘画
何恺明CVPR最新讲座PPT上线:走向端到端生成建模
今年的CVPR会议在美国田纳西州纳什维尔顺利闭幕,吸引了众多学术界人士参与。MIT副教授何恺明成为焦点,他的讲座全场爆满,并参与了多个重要活动,包括最佳论...
我在618主场,和3位顶尖技术博士聊了聊
618购物节作为一年一度的电商盛事,今年再次展现了其强大的市场影响力。随着技术的不断进步,消费者体验得到了显著提升,商品推荐更加精准,物流速度更快,智...
揭秘千卡 GPU 集群如何高效训练多模态大模型:vivo AI 团队实战经验分享|AICon
多模态大模型在智能客服、自动驾驶、AIGC等领域的应用需求不断增长,但其训练工程面临计算、存储、数据处理、分布式通信等多重挑战。特别是在千卡级GPU训练集...
松下发布多模态大模型,文本、图像、音频随意切换
随着大模型技术的快速发展,多模态数据处理逐渐成为研究热点。多模态生成任务通过整合文本、图像、音频等多种类型的数据,实现不同模态之间的相互转换与生成...
初赛报名截止倒计时!75万奖池+心动Offer,启元实验室重磅赛事等你来战!
随着人工智能技术的快速发展,智能化浪潮正在深刻改变各行各业,中国也迎来了人工智能加速应用的关键时期。为推动智能算法从理论创新走向实际落地,启元实验...
游戏教父 John Carmack:LLM 不是游戏的未来
John Carmack作为游戏开发领域的先驱,回顾了自己在Id Software、Armadillo Aerospace、Oculus和Keen Technologies的职业生涯,并分享了他对人工智能和强化学...
“多模态方法无法实现AGI”
生成式人工智能模型的成功让一些人相信人工通用智能(AGI)即将到来,但这些模型并未真正捕捉到人类智能的本质。它们之所以出现,主要是因为它们能够有效地扩...
CVPR现场直击|华人一作的最佳论文,火热的3D和世界模型以及“无处不在”的何恺明们
2025年CVPR会议在美国田纳西州纳什维尔举办,参会人数继续保持高位,会议性质从纯学术交流转向工业界与学术界互动、AI公司抢夺注意力和人才的行业大聚会。今...
LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代
Meta最新发布的V-JEPA 2世界模型标志着人工智能在理解物理世界方面迈出了重要一步。该模型由Meta首席AI科学家Yann LeCun亲自推广,旨在通过模拟人类对物理世...
AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题
豆包大模型1.6作为国内首款多模态SOTA模型,在火山引擎原动力大会上正式亮相。该模型支持256k上下文长度,具备深度思考能力,并首次实现GUI操作功能,形成'视...