图像生成

图像,绘画

谷歌的AI要是实在不行,就回炉重做吧

文章主要讨论了谷歌在人工智能领域的最新发展和挑战。作者认为,尽管谷歌在AI领域取得了一定的进展,但在某些方面仍存在一些问题。首先,谷歌推出了新的开源...

国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收

摘要:OpenAI Sora的发布标志着视频生成领域的重大突破。Sora基于Diffusion Transformer架构,与主流的2D Stable Diffusion方法不同。这项工作由中国人民大学...

谷歌Gemini生图功能紧急关闭,口碑一夜塌房,Yann LeCun:我早就知道

谷歌的Gemini AI系统在推出后不久就遭遇了问题。这个被谷歌称为“最大、最有能力和最通用”的AI系统,旨在提供对“最强模型系列”的访问,但在人物图像生成方面出...

刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界

摘要:谷歌DeepMind发布了一种名为Genie的生成式交互环境(Generative Interactive Environments),这是一个拥有110亿参数的基础世界模型,能够通过单张图像...

解读OpenAI Sora文生视频技术原理

OpenAI发布的Sora视频生成模型在AI领域引起了巨大轰动,被视为继ChatGPT之后又一次重要的技术突破。本文详细总结了Sora的关键技术和潜在应用,并与Google的Lu...

国内公司有望做出Sora吗?这支清华系大模型团队给出了希望

Sora 视频生成技术引发关注OpenAI 发布的 Sora 视频生成技术引起了业界的广泛关注。Sora 能够生成长达 1 分钟的流畅、逼真视频,这一技术突破让研究者担心国...

就是“快”!字节跳动发布文生图开放模型,迅速冲上Hugging Face Spaces 热榜

字节跳动智能创作团队介绍了他们最新的文生图模型SDXL-Lightning,该模型在速度和质量上实现了突破,并已向社区开放。SDXL-Lightning通过渐进式对抗蒸馏技术...

深度 | 万模大战,杀出一匹黑马

文章总结:本文主要介绍了近期在多模态大模型领域的最新进展,包括LLaVA-NeXT、SPHINX-X、MobileVLM和CogCoM等多个模型。这些模型在性能、训练成本、多模态理...

Sora爆火!人工智能将如何改变世界?

摘要:近期,人工智能技术的发展引起了广泛关注。美国OpenAI发布了首个视频生成模型“Sora”,能够根据文本指令生成60秒短视频。此外,谷歌公司的“巴德”(现更...

傅盛说AGI和Sora没有大关联,谷歌发布大模型Gemma,​Stable Diffusion 3.0发布 | 一周看点

魅族宣布将停止传统智能手机新项目的开发,全力投入AI领域,计划年内发布首款AI硬件。纽约大学助理教授谢赛宁否认与Sora发明有关,强调人才、数据和算力的重...
1 75 76 77 78 79 88