图像生成
图像,绘画
Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强
澳大利亚国立大学的研究团队提出了一种全新的图像生成模型ARINAR,该模型在生成质量和速度上均取得了显著提升。ARINAR全称为双层自回归逐特征生成模型,其核...
英伟达团队发布最新具身模型 Cosmos-Reason1,在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型
英伟达团队在GTC大会上发布了新的物理世界大模型Cosmos-Reason1,该模型专注于提升AI系统与物理世界交互的推理能力。作为Cosmos系列的一部分,Cosmos-Reason1...
对话周光:自动驾驶实现AGI,RoadAGI比L5更快 | GTC 2025
在英伟达GTC 2025大会上,元戎启行CEO周光提出了RoadAGI的概念,这是一种通过自动驾驶实现垂直领域通用人工智能(AGI)的新路径。与传统的Robotaxi不同,Road...
被谷歌点名感谢!杭州六小龙开源黑科技,让机器人瞬间「悟透」3D世界
群核科技近期开源了空间理解模型SpatialLM,该模型通过视频理解物理世界的几何关系,并将其转化为机器能读懂的指令,相当于教会机器用人类直觉感知世界。Spat...
英伟达开源通用机器人大模型—GR00T N1
全球AI领导者英伟达在“GTC 2025”开发者大会上宣布开源人形机器人通用大模型GR00T N1,该模型能够处理多模态数据,包括语言、图像和视频,适用于家务、工厂等...
Wiz:320亿美元、谷歌史上最大收购,团队两次创业成功的背后故事
谷歌宣布以320亿美元收购网络安全公司Wiz,这是谷歌有史以来最大的一笔收购。此前,谷歌曾提出230亿美元的报价,但被Wiz拒绝。此次交易还包括32亿美元的分手...
英伟达全力发展AI Agent!开源专属大模型,最强AI工厂
在2025年全球技术大会(GTC 2025)上,英伟达展示了其在人工智能(AI)领域的最新进展,尤其是AI Agent技术的发展。大会首日,英伟达宣布与甲骨文(Oracle)...
多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代
昆仑万维近期发布了Skywork R1V系列模型,这一多模态思维链推理模型在视觉推理和通用推理能力上达到了SOTA级别,成为国内首家开源多模态思维链推理模型的企业...
单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香
法国AI创企Mistral AI最近开源了一款名为Mistral Small 3.1的多模态小模型,该模型在多个基准测试中表现优异,超越了Gemma 3和GPT-4o Mini等同类模型。Mistra...
全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开
昆仑万维近日发布了全球首个开源的多模态推理大模型Skywork R1V(简称R1V),该模型拥有38B参数,性能直逼DeepSeek-R1,并在多项基准测试中取得了领先的成绩...