大模型

LLM,VLM,模型

腾讯混元最新开源:440M翻译模型手机离线就能用,翻译质量超谷歌

随着跨境办公与本地化阅读的日益频繁,传统依赖云端接口的翻译工具在弱网、断网及高隐私要求场景中表现出明显的体验断层。腾讯混元团队针对智能手机的内存瓶...

苹果官方App误打包了Claude.md,这么大的公司也Vibe Coding啊?

苹果官方技术支持应用在推送更新时,意外将项目配置说明文件打包至生产环境。该事件直接证实企业内部正在使用人工智能编程工具构建核心业务应用。文件内容揭...

一口气来了三款王炸!魔法原子硅谷首发具身智能“全家桶”

在精密操作与机体协同层面,MagicHand H01灵巧手集成多个主动自由度与高密度触觉反馈阵列,不仅能实现牛顿级微调与亚毫米级精准控制,更在安全交互上引入接触...

有人只用API就猜出了GPT、Claude、Gemini的参数量?社区吵翻了

研究人员提出「不可压缩知识探针」评测框架,尝试仅通过黑盒接口调用,逆向估算大语言模型的参数规模。该方法基于核心假设,即模型的逻辑推理能力可通过训练...

他用AI办了个音乐节,主题:别读博

科研工作者因意外骨折被迫中止实验室工作,在此期间利用AI技术创作了“不读博音乐节”音乐改编系列。该系列聚焦研究生群体面临的实验受挫、论文拒稿、延期毕业...

北大开源统一世界模型框架:多类合成推理任务一套搞定

在架构设计上,系统以Pipeline模块为核心调度中枢,统筹管理单轮推理与多轮交互流程。底层采用模型抽象规范,配合Operator模块完成多模态原始信号的校验与标...

撕开Claude Code真相:让它好用的98.4%,是工程不是AI

当前人工智能编程工作流正经历从依赖人工提示词反复调优向构建系统化工程基础设施的根本性转变。头部研发团队已率先将代码开发任务转化为标准化流水线,其核...

预埋L3硬件、配「满血」版华为乾崑,启境GT7能让年轻人买单吗?

广汽集团与华为乾崑深度联合打造的新品牌启境正式亮相,首款车型启境GT7定位于30万级猎装车,旨在打破传统制造与供应链的边界,实现软硬件的原生融合。项目采...

强化学习的进化:从PPO到MaxRL,LLM推理训练的算法演进史

强化学习已成为大语言模型后训练阶段的核心技术,尤其在推动模型推理能力跃升方面发挥着关键作用。算法演进经历了从以近端策略优化为主导到多分支并行创新的...

视频生成从”能生成”到”能卖钱”,差的是什么?

为弥合技术与市场的鸿沟,前沿研发机构已将产品规划重心转移至真实应用场景。在广告投放领域,引入参考生视频机制可实现商品外观、材质细节及复杂运镜的高保...
1 2 3 913