图像生成

图像,绘画

清华、北大,上海交大等发布人机协同训练框架,让机器人零样本学会新技能

机器人学习领域取得突破性进展,通过人机协同训练框架MotionTrans实现了从人类演示到机器人执行的直接技能转移。该框架的核心创新在于建立了一个高效的翻译系...

彻底开源,刚我把自己的 AI 短片全部公开了

团队首次公开AI短片创作全过程,并宣布开源其制作方法。这一决定源于对创作流程复杂性的认知,以及小公司快速决策的优势。团队使用的核心工具是TapNow,一个...

邱锡鹏团队新作:让机器人学会「察言观色」

复旦大学、上海创智学院及新加坡国立大学研究团队近期发布的RoboOmni框架,突破了传统视觉-语言-动作(VLA)模型的局限,通过全模态整合实现了机器人对隐含意...

中英双语、29项第一、像素级理解:360 FG-CLIP2登顶全球最强图文跨模态模型

当前AI生成的视觉内容虽然炫酷,但在细节理解和空间关系处理上仍存在明显缺陷。例如,要求生成「穿红外套的猫站在蓝色跑车左边」或搜索「引擎盖有鸟粪的特斯...

美团开源全模态,比肩顶级闭源模型,开源新SOTA

美团LongCat团队发布了5600亿参数的开源全模态模型LongCat-Flash-Omni,该模型能够实现毫秒级的实时音频-视觉交互。其核心是一个端到端的全模态架构,能够接...

已近2000亿美元注入,彭博社盘点2026年值得关注的24家AI初创公司

风投领域正经历前所未有的资本涌入人工智能初创企业,截至2025年10月已有近2000亿美元投入该领域。这一现象标志着AI产业进入全新发展阶段,全球范围内涌现出...

实测全新 SkyReels :AI 创作,终于连成了一体

生成式AI技术虽快速发展,但视频创作仍面临高门槛问题。当前流程涉及脚本撰写、画面生成、配音剪辑等多个环节,依赖不同软件工具,导致普通创作者需承担较高...

ICIG 2025:共话图像发展新坐标

第十三届国际图象图形学学术会议(ICIG 2025)于2025年10月31日至11月2日在徐州成功举办。会议由中国图象图形学学会主办,中国矿业大学承办,南京理工大学协...

刚刚,AI视频的天花板被掀翻!测完SkyReels后飘了:我亦有成为专业导演的潜质

昆仑万维近日推出全新升级的AI视频创作平台SkyReels,标志着多模态内容生成技术进入新阶段。该平台通过'模型+平台'双轨模式,集成图像、音频、视频、数字人等...

更少的token生成更好的图!香港大学联合阶跃星辰等让AI绘画真正理解了再画

香港大学与阶跃星辰的研究团队开发了一种名为VFMTok的新方法,通过利用预训练的视觉基础模型(如DINOv2)作为高效的视觉分词器,显著提升了图像生成的速度和...
1 2 3 149