图像生成

Wan2.2-Animate又火了，5分钟让抠脚大汉秒变高冷女神。

阿里开源模型Wan2.2 Animate近期因生成高精度换脸视频引发广泛关注。该技术通过结合静态人物图像与动态参考视频，能精准复刻表情和动作，甚至支持声音替换，...

AIGC动态

2个月前

中科院自动化所、清华大学与GigaAI联合发布了视觉-语言-行动（VLA）模型的R1推理版本，该模型通过引入思维链机制和强化学习策略，显著提升了机器人在复杂环境...

AIGC动态

2个月前

北京智源人工智能研究院发布了其多模态系列模型的最新力作——悟界・Emu3.5，被定义为“多模态世界大模型”。这一模型通过在超过10万亿的多模态Token上进行端到端...

AIGC动态

2个月前

国内首个利用世界模型生成数据实现真机泛化的端到端VLA具身基础模型GigaBrain-0正式发布。该模型由极佳视界与湖北人形机器人创新中心联合开发，标志着通用机...

AIGC动态

2个月前

美团LongCat团队发布了LongCat-Video基础视频生成模型，该模型拥有136亿参数，能在数分钟内生成720p、30帧每秒的高质量视频。模型在文本转视频、图像转视频和...

AIGC动态

2个月前

人工智能技术正在以前后端协同的方式重塑视觉芯片的发展路径。前端通过AI ISP实现画质增强，后端则依靠NPU执行高阶智能分析任务，画质与算力已成为衡量视觉芯...

AIGC动态

2个月前

过去十年，半导体生产依赖荷兰ASML公司生产的庞大光刻机，这些机器在价值250亿美元的无菌工厂内将图案蚀刻到硅晶片上，对智能手机和人工智能芯片至关重要。然...

AIGC动态

2个月前

在AI训练领域，存储系统性能对计算效率的影响常被低估，但最新MLPerf Storage v2.0测试表明，存储瓶颈会显著限制GPU利用率。该基准测试通过三类典型负载模拟...

AIGC动态

2个月前

《大学生登山失踪事件》是一款以网页解谜为核心玩法的独立游戏，其独特之处在于完全由非技术背景的创作者银河电灯借助AI工具独立完成。游戏通过模拟饭店官网...

AIGC动态

2个月前

英伟达研究团队推出的OmniVinci全模态理解大语言模型，通过创新的架构设计和数据策略，仅用六分之一训练数据便在关键基准测试中超越现有顶尖模型19.05分。该...

AIGC动态

2个月前