标签:开源

Cohere 发布多语言 Command A 模型:仅需两张 GPU 即可服务全球企业

加拿大AI初创公司Cohere发布了其最新生成式AI模型Command A,专为企业应用场景设计。该模型由transformer论文作者之一Aidan Gomez与多伦多大学校友Ivan Zhang...

亚马逊开源5级通用AI Agent:自动查询航班、天气,超4000颗星

亚马逊云(AWS)近期开源了名为Multi-Agent Orchestrator的5级通用AI Agent框架,旨在通过多层级AI Agent处理复杂任务,并确保交互过程中的上下文一致性和连...

视频可以精准控制了!一句话给熊戴眼镜的那种,扩散模型立功,浙大悉尼科技大学出品 | ICLR 2025

随着视频生成技术的快速发展,视频编辑作为其中的一个重要方向,逐渐成为研究热点。然而,传统的视频编辑方法通常局限于风格转换或单一目标的编辑,难以满足...

李开复:超大模型预训练逐渐寡头化,国内将收敛至 DeepSeek、阿里、字节三家

在彭博社的专访中,零一万物 CEO 李开复博士深入探讨了中国大模型行业的发展现状与未来趋势。他指出,DeepSeek 的爆红出圈为中国大模型行业完成了实质意义上...

01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员

字节跳动与清华大学AIR联合实验室SIA Lab近期推出了一种名为DAPO的强化学习(RL)算法,该算法在AIME 2024基准测试中表现优异,超越了DeepSeek的GRPO算法。DA...

英伟达开源通用机器人大模型—GR00T N1

全球AI领导者英伟达在“GTC 2025”开发者大会上宣布开源人形机器人通用大模型GR00T N1,该模型能够处理多模态数据,包括语言、图像和视频,适用于家务、工厂等...

比DeepSeek、o1高3倍!首创无服务器强化微调,只需十几个数据点,

知名大模型训练与开发平台Predibase发布了首个端到端强化微调平台(RFT),这一平台通过奖励函数和自定义函数实现持续强化学习,无需依赖大量标注数据。与传...

多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代

昆仑万维近期发布了Skywork R1V系列模型,这一多模态思维链推理模型在视觉推理和通用推理能力上达到了SOTA级别,成为国内首家开源多模态思维链推理模型的企业...

单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香

法国AI创企Mistral AI最近开源了一款名为Mistral Small 3.1的多模态小模型,该模型在多个基准测试中表现优异,超越了Gemma 3和GPT-4o Mini等同类模型。Mistra...

全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开

昆仑万维近日发布了全球首个开源的多模态推理大模型Skywork R1V(简称R1V),该模型拥有38B参数,性能直逼DeepSeek-R1,并在多项基准测试中取得了领先的成绩...
1 2 3 14