图像生成

图像,绘画

“谷歌版Sora”被嘲画质好糊,但在世界模拟器上又前进了一步

谷歌DeepMind团队推出了一个名为Genie的交互式虚拟世界生成模型,它拥有110亿参数。Genie的特点是能够从单张图像出发,生成可交互的2D虚拟世界,而且这个虚拟...

从 Sora 出发,视频生成模型会如何改变电子游戏开发范式,以及泛娱乐内容形态?

这篇文章由AutoGame创始人张昊阳撰写,探讨了OpenAI最新推出的文生视频模型Sora如何改变电子游戏的开发和制作流程。文章首先介绍了Sora模型的能力,它能够从...

字节等待一鸣惊人

近日,字节跳动正式发布了文生图模型SDXL-Lightning,采用了新的渐进式对抗蒸馏技术,显著提高了图像生成的速度和质量,将计算时间和成本降至十分之一。此外...

与Sora一样能生成视频、图像,还能一次解读100万数据!

本文介绍了加州大学伯克利分校研究人员开源的大世界模型(LWM),这是一种多模态自回归模型,具备文本、音频、图像和视频的生成与理解能力。LWM能够一次性精...

12家创业公司+4家大厂全景图:谁会成为中国版Sora?

摘要:随着ChatGPT的火爆,AI领域迎来了新的发展机遇。Sora的出现预示着AI视频领域可能迎来新一轮的竞争。DiT论文作者谢赛宁强调人才、数据和算力的重要性。...

Sora无法替代人类!亚马逊工程师断言:实际工作冲突不可能靠AI解决

摘要:亚马逊工程师Cameron Gould对OpenAI新发布的视频AI工具Sora进行了分析。他认为,尽管生成式AI在创意内容生成方面表现出色,但它并不会导致人类失业。Go...

Mamba正式被ICLR拒收!“年度最佳技术原理解读”却火了

Mamba,这个被寄予厚望的Transformer挑战者,尽管在学术界引起了广泛关注,但最终还是被ICLR会议拒绝。尽管如此,Mamba的热度并未受到影响,一篇关于它的最新...

Sora时代,我们该如何关注新应用?一切尽在中国AIGC产业峰会

2024年中国AIGC产业峰会 即将在北京举行,主题为“你好,新应用”,旨在探讨生成式AI的最新发展和应用。大模型技术正向多模态发展,从文本扩展到图像、语音、视...

谷歌的AI要是实在不行,就回炉重做吧

文章主要讨论了谷歌在人工智能领域的最新发展和挑战。作者认为,尽管谷歌在AI领域取得了一定的进展,但在某些方面仍存在一些问题。首先,谷歌推出了新的开源...

国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收

摘要:OpenAI Sora的发布标志着视频生成领域的重大突破。Sora基于Diffusion Transformer架构,与主流的2D Stable Diffusion方法不同。这项工作由中国人民大学...
1 60 61 62 63 64 74