AI大模型

LLM,VLM,模型,VLA

Claude Sonnet 5 上线一日差评刷屏:打不过千问和 Minimax,性价比全面翻车

Claude Sonnet 5 发布后在技术圈引发广泛争议并遭遇大量差评,起因是某 GitHub 个人私有题库在逻辑、数学及编程等硬核推理问题上,对其深度思考模式进行了专...

世界模型的新用途:不做选手,去当裁判

地瓜机器人发布世界模型Uranus,其定位并非具身智能的大脑,而是作为机器人开发的基础设施,旨在解决行业内在评测基准公信力不足以及仿真到真实场景存在差距...

一人公司创业,如何找对方法论、选准装备库?

AI技术显著降低了一人公司的启动与开发门槛,推动该群体数量增长并催生专门的服务生态。然而,生产力的提升并未自动解决产品方向判断与基础设施选型难题。对...

全球首个英伟达含量为0的万亿模型,成了海外开发者的抢手货

美团近期推出LongCat-2.0模型,该模型采用混合专家架构,总参数规模达到1.6万亿,原生支持100万超长上下文。这是首个在国产算力上实现从训练到推理全链路闭环...

Anthropic 公告里最刺眼的 3 个名字,有 1 家中国模型

近期,全球人工智能市场格局发生显著变化,中国大语言模型正加速从“廉价替代品”向“优质技术供给”转型,并在海外市场实现了重要突破。随着中国模型性价比与技...

SFT「不完全学习」之后,研究的下一个前沿在哪?ACL 2026 腾讯混元论文未来方向展望

大语言模型在监督微调过程中普遍存在不完全学习现象,即部分训练样本未能被模型有效掌握。针对这一现象,研究从未知根因、检测方法改进、归因框架深入、多根...

百度基础模型换将,这一次把牌交给年轻人

选择孙天祥的主要原因在于其具备完整的大模型实战经验与产业化视野。他在博士期间曾主导类ChatGPT开源大模型的研发,并在国际上提出模型即服务的相关概念,完...

李飞飞 、 英伟达 Jim Fan 、徐丹飞三巨头联合重磅论文,改写灵巧手触觉赛道

在具身智能领域,灵巧手技术的发展迎来关键突破。过去的行业探索往往试图将触觉信息直接融入现有视觉模型中,但这反而导致机器人执行任务时的表现显著下降。...

谷歌贴身对标字节:最新轻量版 Nano Banana 2 四秒出图,单张仅 0.034 美元,还能直出视频

谷歌正式推出Nano Banana 2 Lite文生图模型,以0.034美元的单图成本和4秒的极速生成能力,直接向字节跳动的Seedream 5.0 Lite发起挑战。该模型在几乎同价位的...

ICML 2026前瞻:投稿翻倍背后,机器学习正在换挡

第43届国际机器学习大会首次在韩国首尔举行,主题为机器学习在真实场景中的落地。本次大会接收论文6352篇,投稿量实现翻倍增长,接受率维持在26.6%,传递出会...
1 2 3 996