标签:开源

通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API

阿里通义实验室最近开源了ZeroSearch,这是一个无需与真实搜索引擎交互的强化学习框架,旨在提升大模型的检索和推理能力。传统的强化学习方法依赖于真实搜索...

卡内基梅隆大学开源LegoGPT,用AI设计乐高模型

卡内基梅隆大学近期开源了LegoGPT,这是一种能够根据文本提示生成物理乐高模型的创新方法。LegoGPT的推出填补了从自由形式文本提示直接生成乐高设计的空白,...

Databricks的10亿美元大手笔收购

Databricks宣布以约10亿美元收购开源数据库创业公司Neon,这一交易引发了广泛关注。Neon成立于2021年,专注于打造基于PostgreSQL的无服务器云数据库平台,类...

OpenAI放了一个重磅大招,AI医疗已经提上日程。

OpenAI 今天正式发布了全新的开源健康基准 HealthBench,旨在评估大模型在真实医疗场景中的表现。HealthBench 由 262 名医生共同开发,涵盖 5000 个多轮医疗...

国产大模型「五强争霸」,决战AGI!

中国基础大模型市场近年来经历了显著变革,形成了以字节、阿里、阶跃星辰、智谱和DeepSeek为代表的“基模五强”格局。这五家企业凭借雄厚的资金、高密度的人才...

拉 DeepSeek 和通义“组队”斗 OpenAI?小扎首届 AI 大会变“大型商战现场”,和微软 CEO 疯狂互曝!

Meta在首届AI开发者大会LlamaCon上宣布推出面向消费者的独立Meta AI聊天机器人应用程序,并与ChatGPT展开竞争。该应用基于Llama模型构建,集成了图像生成和编...

字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式

字节跳动首次开源了其代码模型Seed-Coder,该模型规模为8B,超越了Qwen3,并在多个基准测试中取得了领先地位。Seed-Coder通过自身生成和筛选高质量训练数据,...

微软开源新版ph4:媲美DeepSeek-R1,参数暴降48倍

微软近期在官网开源了三个新版Phi-4小参数模型,分别是Reasoning、Min-Reasoning和Reasoning-plus。这些模型的最大亮点之一是算力消耗极低,能够在消费级硬件...

让 PostgreSQL 更契合Agent、氛围编程!成立四年、微软投资,这家开源数据库公司终10亿美元卖身Databricks

Databricks 正在与开源数据库引擎开发初创公司 Neon 进行收购谈判,交易金额预计约为 10 亿美元,但可能因员工保留激励方案而超过这一数值。Neon 是一家基于 ...

全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍

DeepSeek-R1模型在H100 GPU上的性能优化取得了显著进展,短短4个月内性能提升了26倍,吞吐量接近DeepSeek官方数据。这一突破得益于SGLang、英伟达等机构的联...
1 5 6 7 8 9 29