大模型

LLM,VLM,模型

挖掘「缝合」的潜力:CapaBench 揭示 LLM 智能体中各个模块的作用

CapaBench框架通过模块化设计和合作博弈论中的Shapley值方法,系统性评估大型语言模型代理中不同功能模块的贡献度。该框架将代理系统解构为规划、推理、行动...

全球顶级AI大咖空降上海,千亿资本百万年薪引爆人才争夺战!机器人上街遛狗

2025全球开发者先锋大会(GDC)在上海举办,聚焦人工智能技术革新与产业融合。大会以「模塑全球 无限可能」为主题,吸引了全球顶尖开发者社区、企业及投资机...

孙正义患DeepSeek焦虑症?首谈5000亿星际之门,每年算力暴增1000倍

软银集团创始人孙正义在Future Investment大会上首次披露了5000亿美元「星际之门」项目的战略布局,强调该项目将通过每年1000倍的算力提升推动人工智能跨越式...

3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?

波士顿动力的Spot机器狗通过强化学习技术实现了运动性能的显著突破。最新研究显示,Spot的奔跑速度从出厂时的1.6米/秒提升至18.7千米/时,接近小型犬20千米/...

月之暗面Kimi的技术一点都不落后。

月之暗面团队于2023年5月启动MoBA框架研发,旨在提升大语言模型处理长文本的效率与兼容性。该框架结合稀疏注意力与分布式训练技术,支持上下文长度扩展至10M...

AI写代码新姿势:一个截图,代替千行代码

商汤科技在GDC全球开发者先锋大会上发布了办公小浣熊2.0和代码小浣熊2.0的升级版本,并推出开源框架LazyLLM及万象应用开发平台。办公小浣熊2.0通过融合多模态...

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

阶跃星辰与清华大学联合发布的Open Reasoner Zero(ORZ)模型在强化学习训练方法上取得突破性进展。该研究采用极简主义方法,仅使用带有GAE的原版PPO算法和基...

10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文反驳涌现

荷兰开发者Raz采用轻量级强化学习算法Reinforce-Lite,以低于10美元的成本在3B参数规模的模型上复现了DeepSeek的'顿悟时刻'。该方法通过简化传统强化学习的复...

YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

YOLOv12通过引入创新的注意力机制和结构优化,显著提升了实时目标检测的性能与效率。该模型由纽约州立大学布法罗分校和中国科学院大学的研究团队联合开发,旨...

谷歌AI掌门人Jeff Dean对话Transformer作者:AI提速300%,1000万倍工程师要来了

谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer在访谈中揭示了AI技术发展的关键趋势与未来挑战。低精度计算技术的突破使模型推理速度提升三倍,从TPU...
1 6 7 8 9 10 500