大模型
LLM,VLM,模型
孙正义患DeepSeek焦虑症?首谈5000亿星际之门,每年算力暴增1000倍
软银集团创始人孙正义在Future Investment大会上首次披露了5000亿美元「星际之门」项目的战略布局,强调该项目将通过每年1000倍的算力提升推动人工智能跨越式...
3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?
波士顿动力的Spot机器狗通过强化学习技术实现了运动性能的显著突破。最新研究显示,Spot的奔跑速度从出厂时的1.6米/秒提升至18.7千米/时,接近小型犬20千米/...
月之暗面Kimi的技术一点都不落后。
月之暗面团队于2023年5月启动MoBA框架研发,旨在提升大语言模型处理长文本的效率与兼容性。该框架结合稀疏注意力与分布式训练技术,支持上下文长度扩展至10M...
AI写代码新姿势:一个截图,代替千行代码
商汤科技在GDC全球开发者先锋大会上发布了办公小浣熊2.0和代码小浣熊2.0的升级版本,并推出开源框架LazyLLM及万象应用开发平台。办公小浣熊2.0通过融合多模态...
1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法
阶跃星辰与清华大学联合发布的Open Reasoner Zero(ORZ)模型在强化学习训练方法上取得突破性进展。该研究采用极简主义方法,仅使用带有GAE的原版PPO算法和基...
10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文反驳涌现
荷兰开发者Raz采用轻量级强化学习算法Reinforce-Lite,以低于10美元的成本在3B参数规模的模型上复现了DeepSeek的'顿悟时刻'。该方法通过简化传统强化学习的复...
YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世
YOLOv12通过引入创新的注意力机制和结构优化,显著提升了实时目标检测的性能与效率。该模型由纽约州立大学布法罗分校和中国科学院大学的研究团队联合开发,旨...
谷歌AI掌门人Jeff Dean对话Transformer作者:AI提速300%,1000万倍工程师要来了
谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer在访谈中揭示了AI技术发展的关键趋势与未来挑战。低精度计算技术的突破使模型推理速度提升三倍,从TPU...
干完几星期家务,1X新款人形机器人亮相,和冰箱一样安静
挪威机器人公司1X近期发布了新一代家用机器人Neo Gamma,作为Neo Beta的迭代产品,其设计目标聚焦于家庭环境测试。该机器人具备煮咖啡、洗衣、吸尘等家务能力...
DeepSeek终结了上一场AI流量战,腾讯为元宝开启了另一场
腾讯近期通过旗下产品'元宝'在AI应用领域发起新一轮竞争。元宝借助'满血版DeepSeek'的营销口号,在微信、B站、知乎等平台展开大规模广告投放,甚至包揽百度'd...




