标签:开源
性能大涨!阿里开源新版Qwen3模型,霸榜文本表征
阿里巴巴近日开源了两款基于Qwen3基础模型的新模型——Qwen3-Embedding和Qwen3-Reranker,专为文本表征、检索与排序任务设计。这两款模型在多语言文本理解方面...
Anthropic“断供”Windsurf,硅谷也玩“二选一”
Windsurf作为一款广受欢迎的AI编程工具,近期因Anthropic决定切断对其Claude 3.x系列模型的直接供应而陷入困境。这一决定对依赖Claude模型进行编程的开发者产...
对话图灵奖得主Jack Dongarra:DeepSeek很伟大;今天的美国不够重视科学
Jack Dongarra作为2021年图灵奖得主,在高性能计算(HPC)领域做出了开创性贡献,其开发的数值算法和软件库对现代计算科学产生了深远影响。他的工作主要集中...
对话图灵奖得主Jack Dongarra:DeepSeek很伟大;今天的美国不够尊重科学
Jack Dongarra是2021年图灵奖得主,他的研究对高性能计算(HPC)领域产生了深远影响,尤其是在数值算法和软件库的开发方面。他的工作为科学计算提供了基础工...
智元机器人发布并开源首个机器人动作序列驱动的世界模型
智元机器人近日发布了具身智能领域的两项重要突破:全球首个基于机器人动作序列驱动的具身世界模型 EVAC(EnerVerse-AC),以及具身世界模型评测基准 EWMBenc...
巧妙!一个传统技术让国产视觉基础模型直接上大分
格灵深瞳最新发布的视觉基础模型Glint-MVT在多个领域展现了显著的技术突破。该模型通过引入间隔Softmax损失函数,显著提升了泛化能力,并在26个分类测试集中...
图灵奖四巨擘共话AI未来,「双星交汇」引爆年度盛会!
2025年智源大会将于6月6日至7日在北京举行,作为人工智能领域的顶级学术峰会,大会汇聚了四位图灵奖得主以及来自全球顶尖科研院所和企业的专家学者,共同探讨...
纯蒸馏模型 SOTA 出现!直接 SFT 成本直降 50 倍,数据已全部开源
a-m-team 最近发布了一篇名为“Not All Correct Answers Are Equal: Why Your Distillation Source Matters”的论文,探讨了在推理模型训练中蒸馏数据源的重要...
多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满
智源研究院联合多所高校发布了三款向量模型,分别是BGE-Code-v1、BGE-VL-v1.5和BGE-VL-Screenshot。这些模型在代码及多模态检索领域取得了显著成果,并在多个...
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!
混合专家模型(MoE)因其能够将不同任务分配给擅长处理的专家网络而备受关注,但专家网络的负载均衡问题成为影响系统推理性能的关键因素。某些专家网络被频繁...