AI大模型
LLM,VLM,模型,VLA
谷歌发布Nano Banana 2 Lite,闪电般的速度,专为快速视觉探索而设计
谷歌最新发布了名为 Nano Banana 2 Lite 的图像模型,该模型专为创作者、企业及开发者打造,旨在实现更快速、更高效的图像生成与编辑,同时大幅降低创作成本...
伯克利系主任出走Anthropic:一个理论算法大牛背后,藏着Anthropic怎样的野心?
Anthropic近期在两周内密集招募了多位顶尖人才,包括加州大学伯克利分校计算机科学系主任Jelani Nelson、诺贝尔化学奖得主John Jumper以及多位核心研究员。这...
我找了两年的模型,终于出现了。
近期发布的 MaineCoon 模型展现了实时音视频交互的强大能力,为多领域的创新应用提供了基础支撑。该模型不仅适用于实时互动教学,还广泛拓展了虚拟陪伴、语言...
记一个我被Claude Fable 5震撼的瞬间。
近期限时回归的Claude Fable 5为订阅会员提供了七天的免费体验机会,作者利用这段时间使用该模型全面优化其个人运营的资讯网站的搜索引擎优化与生成式引擎优...
Claude Sonnet 5 上线一日差评刷屏:打不过千问和 Minimax,性价比全面翻车
Claude Sonnet 5 发布后在技术圈引发广泛争议并遭遇大量差评,起因是某 GitHub 个人私有题库在逻辑、数学及编程等硬核推理问题上,对其深度思考模式进行了专...
世界模型的新用途:不做选手,去当裁判
地瓜机器人发布世界模型Uranus,其定位并非具身智能的大脑,而是作为机器人开发的基础设施,旨在解决行业内在评测基准公信力不足以及仿真到真实场景存在差距...
一人公司创业,如何找对方法论、选准装备库?
AI技术显著降低了一人公司的启动与开发门槛,推动该群体数量增长并催生专门的服务生态。然而,生产力的提升并未自动解决产品方向判断与基础设施选型难题。对...
全球首个英伟达含量为0的万亿模型,成了海外开发者的抢手货
美团近期推出LongCat-2.0模型,该模型采用混合专家架构,总参数规模达到1.6万亿,原生支持100万超长上下文。这是首个在国产算力上实现从训练到推理全链路闭环...
Anthropic 公告里最刺眼的 3 个名字,有 1 家中国模型
近期,全球人工智能市场格局发生显著变化,中国大语言模型正加速从“廉价替代品”向“优质技术供给”转型,并在海外市场实现了重要突破。随着中国模型性价比与技...
SFT「不完全学习」之后,研究的下一个前沿在哪?ACL 2026 腾讯混元论文未来方向展望
大语言模型在监督微调过程中普遍存在不完全学习现象,即部分训练样本未能被模型有效掌握。针对这一现象,研究从未知根因、检测方法改进、归因框架深入、多根...


