大模型
LLM,VLM,模型
昇腾+鲲鹏联手上大招!华为爆改MoE训练,吞吐再飙升20%,内存省70%
华为在MoE(Mixture of Experts)训练系统领域取得了显著的技术突破,提出了全新的算子和内存优化方案,显著提升了训练效率和内存利用率。MoE作为一种独特的...
天塌了,Claude 全面断供Windsurf!CEO喊冤控诉也挡不住开发者退订,祸起OpenAI收购?
Windsurf CEO Varun Mohan 近日公开表示,Anthropic 在不到五天的通知时间内切断了 Windsurf 对 Claude 3.x 系列模型的直接访问权限,包括 Claude 3.5 Sonnet...
单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2
智源研究院与上海交通大学等机构联合发布了新一代超长视频理解模型Video-XL-2,该模型在长视频理解领域取得了显著进展。长视频理解是多模态大模型的关键能力...
WWDC25 前瞻:iOS 19 跳至 26,iPad 全面“Mac 化”
Apple 将在 2025 年 6 月 10 日至 14 日举行年度全球开发者大会(WWDC25),此次大会预计将带来自 2013 年 iOS 7 发布以来最重大的变革。首先,苹果将改变其...
马斯克的xAI以1130亿美元估值,出售3亿美元股权
马斯克旗下的大模型平台xAI正以1130亿美元的估值出售3亿美元股权,尽管具体细节尚未完全披露,但该公司已与潜在投资者就私募配售事宜展开磋商。若此次融资成...
具身智能的「Z 世代」,来了
具身智能领域正迎来一批年轻的研究者,他们以独特的视角和创新的思维推动着这一前沿技术的发展。谭恒楷、吴铭东和王乾旭三位年轻人分别代表了具身智能研究中...
AI 编程终结的不是代码,而是作为「容器」的软件
2005年YouTube的「上传」按钮开启了内容创作的民主化时代,而如今,AI通过「描述」这一动词,正在彻底改变软件的认知与生产方式。知名硅谷投资人Chris Paik在...
招生信息 | 英国莱斯特大学举雅琨老师招收博士生了!
举雅琨博士自2024年起任职于英国莱斯特大学计算机与数学科学学院,担任助理教授。他长期致力于计算机视觉与图像处理领域的研究,尤其在三维重建、光度立体、...
单卡也能跑万帧!智源发布Video-XL-2,速度、效果、长度全拉满
智源研究院近日发布了新一代超长视频理解模型Video-XL-2,该模型在长视频理解任务中表现出色,显著提升了多模态大模型对长视频内容的理解能力。Video-XL-2在M...
训练MoE足足提速70%!华为只用了3招
MoE(混合专家)模型在扩展模型能力方面具有显著优势,但其训练过程中面临效率不足和资源分配不均的挑战。华为通过构建Adaptive Pipe & EDPB优化方案,解决了...