大模型

LLM,VLM,模型

何恺明团队重磅新作:去掉VAE,无需Tokenizer,纯Transformer预测数据比预测噪声更高效

麻省理工学院何恺明团队发布了一项颠覆性研究,直指当前扩散生成模型的核心痛点。研究指出主流模型实际上并没有在做去噪工作,回归最原始的洁净数据预测才是...

Gemini 3 登场后,哈萨比斯要「改造」Google 全系产品

Google DeepMind CEO 德米斯·哈萨比斯在访谈中系统阐述了Gemini 3的技术突破与战略布局。作为Google未来架构的关键节点,这一代模型在推理能力、多模态处理、...

一文读懂:为什么Nano Banana Pro重新定义了AI图像生成标准

在Gemini 3的技术支持下,谷歌正式推出图像生成工具Nano Banana Pro,标志着AI图像生成领域的技术突破。该工具基于Gemini 3 Pro构建,通过增强的推理能力和实...

AI应用进入下半场:从模型的入口到真正的超级入口

AI应用的竞争已进入以用户需求为核心的下半场。近期,Google Gemini3、OpenAI GPT-5.1等模型更新均强调应用集成能力,阿里千问、蚂蚁灵光等产品则直接瞄准C端...

Nano Banana Pro最全解析,设计师和开发者都用得上,附官方提示指南

Nano Banana Pro作为新一代图像生成与编辑模型,标志着AI技术在视觉创作领域的重大突破。其核心突破在于将逻辑推理能力和真实世界知识注入像素生成过程,使模...

具身智能「全明星日」来袭!智源组局30+行业掌门人,激辩机器人终极命题

中国具身智能产业的核心议题与未来方向在智源具身2025 OpenDay活动中得到深入探讨。30余位行业领军人物围绕技术架构、数据获取路径、硬件瓶颈及商业化落地展...

Second Me 的数字身份,让我看到了 AI 时代真实社交的新可能

AI技术正从科幻概念加速融入现实生活,催生出全新的数字社交形态。Second Me作为个性化AI身份系统,通过持续学习用户的思维模式、记忆和表达方式,构建出高度...

别问树模型了!死磕结构化数据,清华团队把大模型表格理解推到极限

科幻作家刘慈欣在《超新星纪元》中描述的盐与味精消耗场景,生动揭示了现代社会运转对海量结构化数据的依赖。这些数据以精确的行列格式组织,支撑着工业化社...

振臂一挥,大半个具身机器人圈都来了!智源研究院:别藏了,谁贡献数据多,谁的大脑就更好用

2025智源具身智能Open Day引发行业震动,这场被称为“具身武林大会”的活动聚集了银河通用、智元、优必选等机器人领域头部企业的创始人。智源研究院以非营利机...

太炸裂了!全网实测Nano Banana Pro,网友:这模型里到底装了什么鬼东西!

谷歌最新发布的Nano Banana Pro(又名Gemini 3 Pro Image)文生图模型引发广泛关注。该模型整合了Gemini 3 Pro的多模态理解能力和谷歌搜索知识库,在图像生成...
1 2 3 748