大模型
LLM,VLM,模型
硅谷今夜集体失眠!互联网女皇340页AI报告猛料刷屏,大佬熬夜头秃
互联网女皇Mary Meeker发布的《AI趋势报告2025》引发了广泛关注,报告长达340页,深入探讨了人工智能领域的变革与趋势。AI驱动的变革已经全面且不可逆转,既...
商汤官宣联合创始人徐冰将卸任执行董事、董事会秘书职务
商汤集团在端午节前夕发布公告,宣布其联合创始人徐冰将卸任执行董事及董事会秘书职务,专注于推动公司战略性新兴业务的发展,特别是AI芯片业务。徐冰的卸任...
微软再放LLM量化大招!原生4bit量化,成本暴减,性能几乎0损失
微软亚研院的研究团队近期发布了原生1bit精度的大模型BitNet b1.58 2B4T的升级版本——BitNet v2。这一新版本在性能几乎无损失的情况下,显著降低了内存占用和...
SFT在帮倒忙?新研究:直接进行强化学习,模型多模态推理上限更高
随着OpenAI的o1/o3和Deepseek-R1等具备强大推理能力的大语言模型相继问世,学界普遍采用「监督微调 + 强化学习」的两阶段训练范式。这种范式在纯文本领域取得...
2个月,20亿美元估值、硅谷7500万美元投资,Manus给中国AI创业者指了条什么路?
Manus作为一家源自中国的创业公司,近期在AI领域引发了广泛关注。尽管在国内曾面临质疑和批评,但其在海外尤其是硅谷的评价却截然不同,获得了OpenAI、微软、...
Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造
研究团队提出两种专为推理“量身定制”的注意力机制——Grouped-Tied Attention(GTA)和Grouped Latent Attention(GLA),旨在优化大语言模型的推理效率和硬件...
北大校友造通用AI Agent,可执行1000个操作,无邀请码立即上手试用
北大校友推出的Fairies智能体,号称“最强通用Agent”,能够执行包括深度研究、代码生成、发邮件等在内的1000个操作。用户无需邀请码,只需下载APP即可在Mac和W...
在AI这事上,腾讯终于干了一件很“野”的事
城市并非只有人类当家作主,众多野生动植物同样栖居于此。中国有1500多种鸟类,像北京就有530种,还有40多种兽类、90多种鱼类、数千种昆虫等。比如北京城区能...
斯坦福意外用AI生成超强CUDA内核,性能比人类专家优化得还要好!翻倍碾压原生PyTorch,华人主创
斯坦福团队意外发现AI生成的内核性能超越人类专家优化成果,展现出AI在内核生成领域的巨大潜力。AI生成内核性能卓越:由AI优化的内核在常见深度学习操作上表...
陶哲轩转发!DeepMind开源「AI数学证明标准习题集」
DeepMind最新开源形式化数学猜想库,该库由陶哲轩转发,具有重要意义。猜想库收录了经典的形式化表述的数学猜想集合,如解析数论中的四个朗道问题,还提供代...