图像生成

图像,绘画

Claude版龙虾VS OpenClaw,Anthropic又站在了OpenAI的反面

Anthropic于3月24日发布Claude Pro与Claude Max订阅用户专属的电脑原生操控功能,标志着其在AI智能体领域从框架嫁接转向深度体系化整合。与OpenClaw广泛传播...

代号“峨眉”!安谋科技自研VPU IP攀上新巅峰

安谋科技(中国)有限公司近期在上海举办技术发布会《玲珑·视界》,正式推出面向AI应用的新一代VPU IP产品“玲珑”V560/V760,代号“峨眉”,并已实现首批客户授...

开源音视频同步SOTA基座:极简的单流架构,2秒出片

daVinci-MagiHuman是由上海创智学院(SII)生成式人工智能研究实验室(GAIR)与Sand.ai联合发布的开源音视频生成基础模型,旨在解决当前开源生态中生成质量、...

西湖大学王东林团队论文:机器人需要“通古今,知未来”丨CVPR 2026

该研究提出HiF-VLA——一种以运动信息为核心建模时间的视觉-语言-动作模型,旨在解决机器人在长序列任务中因缺乏时间理解能力而导致的动作重复、决策中断等核心...

浙大团队破解多模态模型「盲目自信」:先校准置信度,再分配算力丨CVPR’26

本文研究聚焦于多模态大模型在视觉推理中普遍存在“盲目自信”现象,即当输入图像严重退化时,模型准确率大幅下降,而置信度却几乎不变。该现象被定义为“感知钝...

画质革命还是AI整容?DLSS 5引爆全网争议,老黄亲自下场论战

DLSS 5作为英伟达在GTC上发布的最新AI图像重建与超分辨率技术,被定位为自2018年实时光线追踪以来最重大的图形突破,其核心目标是将好莱坞级影视特效(VFX)...

登顶全球权威榜单!浙大创业团队百卡打造开源实时世界模型,视频秒变可交互4D世界

在2024年全球科技界对“世界模型”的激烈角逐中,中国初创企业影溯(InSpatio)发布开源模型InSpatio-World,并在权威榜单WorldScore-Dynamic中力压主流AI巨头...

学会“吃一堑长一智”,性能飙升11%!XSKILL让AI积累经验和技能

人类从经验与技能双重维度持续进化,XSKILL据此设计双流学习机制,使AI具备类人记忆与策略复用能力。技能以Markdown文档形式存储于技能库,提供任务级工作流...

龙虾也能当导演了!LibTV解锁全自动拍片,一句话从剧本干到成片

LibTV作为LiblibAI推出的首款AI视频产品,标志着AI内容创作进入“人+Agent”双视角协同的新阶段。该平台以一块无限画布为核心,整合文本、图片、视频、音频与脚...

改造 100 多年的影视行业,需要的不止是好模型

LibTV 作为一款新型 AI 视频创作平台,核心突破在于将技术能力与影视工业流程深度整合,而非仅聚焦于单镜头生成质量。其底层集成 Lib Nano Pro、Kling 3.0 等...
1 2 3 169