大模型

LLM,VLM,模型

NTU S-Lab 团队探索可动 3D 新方向:结构、关节、纹理一次到位

南洋理工大学 S-Lab 团队提出的 ArtiLatent 框架实现了从单张图像生成具备精确几何结构、合理关节参数和自然外观纹理的可动三维模型。该研究通过统一的结构化...

全球最大云厂商,将「最牛马」的工作交给了 AI Agent

亚马逊云科技在2025年re:Invent大会上发布了一系列围绕AI Agent的重大更新,标志着其在Agent时代的云计算核心重构。这些更新分为两大方向:面向客户的Agent应...

豆包官宣手机助手:AI 还能带来哪些新体验?

字节跳动旗下豆包团队近期宣布推出豆包手机助手,标志着大模型技术向用户日常生活场景迈出关键一步。这一产品并非通过自研硬件实现,而是与中兴等手机厂商合...

夸克 AI 眼镜 S1 体验:超越 Meta 的决心,以及方法论

阿里巴巴旗下首款自研硬件夸克AI眼镜S1的发布,标志着互联网巨头正式进军智能穿戴领域。这款产品在双十一预售期间便成为销冠,其核心逻辑在于通过供应链「死...

原来这届中国AI年轻人,已经卷到业界都惊了

在小红书上,一场为期五个多月的广告算法大赛引发了技术爱好者们的热烈讨论和积极参与。这场由腾讯广告主办的竞赛以360万元奖金池为激励,聚焦于「全模态生成...

震撼全网!3位00后夺200万大奖,卷走鹅厂顶级Offer

历时四个月的腾讯广告算法大赛近日落下帷幕,这场汇聚全球30个国家、8400多名技术精英的「千团大战」最终由来自华中科技大学、北京大学和中国科学技术大学的...

借鉴人脑「海马体-皮层」机制,红熊AI重做了一个「记忆系统」

记忆正成为AI从即时回答工具迈向个性化超级助手的关键突破点。近期,Google Research发表的《Nested Learning: The Illusion of Deep Learning Architectures...

这一次,ChatBot 的容器变了

蚂蚁的灵光App通过创新的交互方式重新定义了AI助手的表现力。与传统的纯文本聊天框不同,灵光采用多模态呈现方式,将复杂信息以结构化、可视化的形式展现。在...

英伟达开源最新VLA,能否破局L4自动驾驶?

随着大模型深度融入汽车行业,行业竞争正从功能实现转向高阶智驾能力的比拼,而VLA(视觉语言行动模型)被视为下一代技术竞争的关键变量。英伟达近期宣布开源...

视觉思维链全新架构,加州大学让多模态大模型有了灵性,整体性能提升5.3%

加州大学伯克利分校团队提出了一种名为视觉思维链(CoVT)的全新架构,旨在解决多模态大模型在处理视觉信息时被迫将其翻译成文本的局限性。人类通过视觉信号...
1 2 3 762