图像生成

图像,绘画

Runway推出全新超现实AI视频模型Gen-3 Alpha,可生成10秒长视频

Runway公司发布了其最新的AI视频生成模型Gen-3 Alpha,该模型能够根据文本描述和静态图像生成视频内容。与前代模型相比,Gen-3在生成速度、图像质量以及视频...

NVM IP:驾驭先进节点设计的存储利器

当前半导体行业正经历着摩尔定律逐渐逼近极限的挑战,芯片制造业已跨足3纳米节点,正向2纳米迈进。随之而来的是集成度、功耗和性能的极致追求,在此背景下,...

霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,复旦百度等出品|GitHub揽星1k+

Hallo是一种基于分层音频驱动视觉合成模块的开源项目,由复旦大学、百度、苏黎世联邦理工学院和南京大学的研究人员共同完成。该项目的主要贡献是提出了一种分...

GPT-4系列模型,在文档理解中的多维度评测

Snowflake的研究人员对OpenAI的GPT-4系列模型进行了深入研究,评估了其在文本生成、图像理解、文档摘要等方面的能力。通过在DocVQA、InfographicsVQA、SlideV...

谢赛宁对话Sora 负责人:AI 视觉的基础是对压缩图像的学习

在这次深入的讨论中,Aditya Ramesh,OpenAI Sora及DALL·E团队的负责人,以及纽约大学助理教授谢赛宁,共同探讨了人工智能领域中语言和视觉模型的融合及其对...

奥特曼和老黄动手了……Luma干的

Luma AI推出的Dream Machine被誉为“下一代”文生视频工具,发布后引起了广泛关注。然而,实际效果却大大不如预期,导致网友们纷纷吐槽。Dream Machine原本宣传...

AI画连环画角色更一致了!人物之间的复杂互动也能处理|中山大学&联想团队出品

AutoStudio是一种多智能体协同框架,由中山大学和联想团队联合提出,旨在提高AI在多轮交互式图像生成中的性能。该框架无需训练,通过三个基于大型语言模型的...

智源大会最全记录:最重要的AI公司们展开的一场集体辩论

在AI春晚上,众多业界领袖和专家就人工智能领域的多个关键议题展开了深入讨论,涉及大模型的发展趋势、开源与闭源的争议、价格战的影响,以及人工智能通用性...

又一届「AI春晚」拉开序幕!智源大模型集体爆发了

2024年智源大会展示了人工智能领域的最新进展和成就,特别是大模型技术在多个行业的应用。会议聚集了众多AI专家,包括Llama、Sora等大模型的开发者,以及百度...

AI视频新霸主全网翻车,Ilya奥特曼老黄打起来了!动画出现诡异狗头网友笑疯

最新发布的Stable Diffusion 3和Luma AI的视频生成模型Dream Machine引起了广泛关注。这两个模型以独特的方式处理图像和视频,其中Dream Machine特别受到网友...
1 85 86 87 88 89 139