大模型

LLM,VLM,模型

有人只用API就猜出了GPT、Claude、Gemini的参数量?社区吵翻了

研究人员提出「不可压缩知识探针」评测框架,尝试仅通过黑盒接口调用,逆向估算大语言模型的参数规模。该方法基于核心假设,即模型的逻辑推理能力可通过训练...

他用AI办了个音乐节,主题:别读博

科研工作者因意外骨折被迫中止实验室工作,在此期间利用AI技术创作了“不读博音乐节”音乐改编系列。该系列聚焦研究生群体面临的实验受挫、论文拒稿、延期毕业...

北大开源统一世界模型框架:多类合成推理任务一套搞定

在架构设计上,系统以Pipeline模块为核心调度中枢,统筹管理单轮推理与多轮交互流程。底层采用模型抽象规范,配合Operator模块完成多模态原始信号的校验与标...

撕开Claude Code真相:让它好用的98.4%,是工程不是AI

当前人工智能编程工作流正经历从依赖人工提示词反复调优向构建系统化工程基础设施的根本性转变。头部研发团队已率先将代码开发任务转化为标准化流水线,其核...

预埋L3硬件、配「满血」版华为乾崑,启境GT7能让年轻人买单吗?

广汽集团与华为乾崑深度联合打造的新品牌启境正式亮相,首款车型启境GT7定位于30万级猎装车,旨在打破传统制造与供应链的边界,实现软硬件的原生融合。项目采...

强化学习的进化:从PPO到MaxRL,LLM推理训练的算法演进史

强化学习已成为大语言模型后训练阶段的核心技术,尤其在推动模型推理能力跃升方面发挥着关键作用。算法演进经历了从以近端策略优化为主导到多分支并行创新的...

视频生成从”能生成”到”能卖钱”,差的是什么?

为弥合技术与市场的鸿沟,前沿研发机构已将产品规划重心转移至真实应用场景。在广告投放领域,引入参考生视频机制可实现商品外观、材质细节及复杂运镜的高保...

DeepSeek首次有了视觉能力,技术论文却被它连夜删掉了

近期,深度求索在开启视觉能力灰度测试后,迅速发布并随后撤回了相关技术论述,其核心在于提出了视觉基元推理框架。传统大模型常依赖自然语言处理图像信息,...

存储芯片成为印钞机

全球人工智能基础设施的建设需求正推动存储芯片行业进入深度繁荣期。三星、SK海力士与美光科技三大厂商在最新财季录得创纪录的利润规模,半导体业务成为拉动...

实测纳逗 Pro:能做专业影视级内容的智能平台长啥样

当前人工智能视频技术已跨越早期功能验证阶段,全面进入追求画面质感、叙事逻辑与商业可用性深度融合的专业化发展新周期。行业竞争焦点逐步转向能否将生成式...
1 2 3 913