图像生成
图像,绘画
谷歌的AI要是实在不行,就回炉重做吧
文章主要讨论了谷歌在人工智能领域的最新发展和挑战。作者认为,尽管谷歌在AI领域取得了一定的进展,但在某些方面仍存在一些问题。首先,谷歌推出了新的开源...
国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收
摘要:OpenAI Sora的发布标志着视频生成领域的重大突破。Sora基于Diffusion Transformer架构,与主流的2D Stable Diffusion方法不同。这项工作由中国人民大学...
谷歌Gemini生图功能紧急关闭,口碑一夜塌房,Yann LeCun:我早就知道
谷歌的Gemini AI系统在推出后不久就遭遇了问题。这个被谷歌称为“最大、最有能力和最通用”的AI系统,旨在提供对“最强模型系列”的访问,但在人物图像生成方面出...
刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界
摘要:谷歌DeepMind发布了一种名为Genie的生成式交互环境(Generative Interactive Environments),这是一个拥有110亿参数的基础世界模型,能够通过单张图像...
解读OpenAI Sora文生视频技术原理
OpenAI发布的Sora视频生成模型在AI领域引起了巨大轰动,被视为继ChatGPT之后又一次重要的技术突破。本文详细总结了Sora的关键技术和潜在应用,并与Google的Lu...
国内公司有望做出Sora吗?这支清华系大模型团队给出了希望
Sora 视频生成技术引发关注OpenAI 发布的 Sora 视频生成技术引起了业界的广泛关注。Sora 能够生成长达 1 分钟的流畅、逼真视频,这一技术突破让研究者担心国...
就是“快”!字节跳动发布文生图开放模型,迅速冲上Hugging Face Spaces 热榜
字节跳动智能创作团队介绍了他们最新的文生图模型SDXL-Lightning,该模型在速度和质量上实现了突破,并已向社区开放。SDXL-Lightning通过渐进式对抗蒸馏技术...
深度 | 万模大战,杀出一匹黑马
文章总结:本文主要介绍了近期在多模态大模型领域的最新进展,包括LLaVA-NeXT、SPHINX-X、MobileVLM和CogCoM等多个模型。这些模型在性能、训练成本、多模态理...
Sora爆火!人工智能将如何改变世界?
摘要:近期,人工智能技术的发展引起了广泛关注。美国OpenAI发布了首个视频生成模型“Sora”,能够根据文本指令生成60秒短视频。此外,谷歌公司的“巴德”(现更...
傅盛说AGI和Sora没有大关联,谷歌发布大模型Gemma,Stable Diffusion 3.0发布 | 一周看点
魅族宣布将停止传统智能手机新项目的开发,全力投入AI领域,计划年内发布首款AI硬件。纽约大学助理教授谢赛宁否认与Sora发明有关,强调人才、数据和算力的重...