大模型
LLM,VLM,模型
JanusVLN:双重隐式记忆解耦语义与空间,开创视觉语言导航记忆新范式
JanusVLN框架通过双重隐式神经记忆机制,实现了视觉语言导航(VLN)中语义与空间信息的有效解耦。传统VLN方法依赖显式记忆存储历史观测数据,面临空间信息损...
杨植麟带 Kimi 团队深夜回应:关于 K2 Thinking 爆火后的一切
月之暗面发布的Kimi K2 Thinking模型以其“模型即Agent”的设计理念引发行业震动。该模型通过创新的KDA(Kimi Delta Attention)注意力机制,有效解决了MoE模型...
APP 上线 40 天后,Sora 核心团队分享了他们对于 AI 社交的关键思考
Sora APP在短短5天内实现了100万次下载,速度甚至超过了ChatGPT的早期表现。更引人注目的是,其近200万周活跃用户中,70%参与了内容创作,这一数据远超传统互...
三年三次「破局」,江原科技如何打通国产AI芯片全链路?
在AI芯片领域长期被国际巨头垄断的背景下,江原科技通过自主研发实现了国产AI芯片的重大突破。2022年10月美国出口管制令发布后,李瑛带领团队创立江原科技,...
刚刚,豆包编程模型来了,我们用四个关卡考了考它!
AI编程助手正经历从代码补全工具向具备自主规划能力的Agentic Coder演进。2025年,行业分化为IDE增强和任务委托两条技术路线,前者以GitHub Copilot为代表提...
打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点
3D Gaussian Splatting (3DGS)是一种基于各向异性3D高斯体构建场景表示的新视角合成技术,能够通过带位姿的图像训练快速渲染未见视角,在渲染速度和图像质量...
从“给答案”到“教动脑”:这届小学生被AI教会主动思考
当前教育领域正迎来AI技术带来的深刻变革,各类智能学习产品正从单一工具向拟人化教学系统演进。AI教育产品的核心矛盾已从“效率提升”转向“思维培养”,传统快...
大模型开发者必读!拆解世界级AI模型的诞生,Hugging Face把4年模型训练经验写成了一本开源指南
Hugging Face发布的《The Smol Training Playbook》手册,由12位顶尖工程师团队撰写,系统总结了构建世界级大语言模型的核心方法论。手册开篇便颠覆性地指出...
模型性能提升近50%,成本削减83%!约翰·霍普金斯大学发布专业领域提示优化框架
约翰·霍普金斯大学提出的EGO-Prompt框架通过进化图优化技术,显著提升了小型语言模型在专业领域任务中的性能,同时大幅降低推理成本。该框架的核心创新在于将...
对话九识智能孔旗:九识不焦虑丨L4十人谈
九识智能作为无人物流车领域的明星公司,自2021年成立以来已完成四轮融资,总额超5亿美元。然而,今年7月媒体爆出京东以侵犯知识产权为由对九识进行报案处理...





