大模型

LLM,VLM,模型

北大林宙辰团队论文:从数据中自适应学习时序预测损失丨ICLR 2026

多步时间序列预测任务中,预测性能随步长增加而退化是普遍现象。气象、金融和电力负荷预测等领域均存在短期预测准确但中长期误差显著放大的问题。误差积累、...

创新Transformer!面壁基于稀疏-线性混合架构SALA训练9B模型,端侧跑通百万上下文

面壁智能发布了行业首个大规模训练的稀疏-线性注意力混合架构SALA及其文本模型MiniCPM-SALA,该模型通过创新架构设计显著提升了长文本处理能力和推理效率。传...

决定了:过年攻略全都不过脑子,让AI去想

科技圈在春节前夕迎来AI大模型的密集发布潮,包括kimi 2.5、Step 3.5 Flash以及即将面世的DeepSeek V4等多款产品。厂商们通过发红包、机器人上春晚等方式营造...

9B端侧开源模型跑通百万上下文,面壁全新稀疏-线性混合注意力架构SALA立功了!

Claude Opus 4.6的发布标志着大模型进入百万级上下文时代,该模型展现出跨文档法律分析和多轮Agent规划等能力。面壁智能随后推出创新的线性与稀疏混合注意力...

马斯克xAI再失联合创始人,12人创始团队已有6人离场

马斯克联合创办的AI公司xAI近期经历了显著的人才流失,创始团队12人中已有6人离职,其中5人是在过去一年内离开的。最新离职的是联合创始人Jimmy Ba,他负责过...

半年狂揽 5 亿美金,硅谷大佬疯抢的「睡眠黑科技」,正被中国智驾老兵拆解

睡眠科技赛道正从被动记录迈向主动干预,智能床垫等产品通过AI和传感器技术重新定义睡眠体验。海外巨头Eight Sleep凭借智能床垫半年营收突破3亿美元,国内初...

智谱开源OCR!测完我把手机里的扫描软件都卸了……

GLM-OCR开源模型在OCR领域展现出显著的技术突破与应用潜力。该模型虽仅0.9B参数,却在OmniDocBench V1.5榜单上达到SOTA水平,性能超越Gemini-3-Pro和GPT5.2等...

谷歌Chrome深夜爆更,Agent不用「装」人了!前端最后防线崩了?

谷歌Chrome团队近日发布了WebMCP(Web模型上下文协议),这一技术标志着AI与网页交互方式的重大变革。WebMCP允许AI智能体绕过传统的人类用户界面,直接与网站...

马斯克都忍不住转发的 AI 应用,是怎么做出来的?

当世界变得 Playable:互动内容平台的创新探索涌跃智能推出的Loopit产品,代表了AI时代内容形态的一次重要变革。其核心理念在于将传统被动消费的内容转化为可...

千问发布最新图像模型 Qwen-Image-2.0,支持 1K token 超长文字输入和 2K 高分辨率

阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0,该模型在AI Arena文生图评测中以1029分位列第三,仅次于谷歌Nano Banana Pro和GPT Image1.5。Qwen...
1 2 3 830