图像生成
图像,绘画
ChatGPT每年电费2亿?! 日耗电量≈1.7万个家庭, 网友:挺值!
步骤2: 内容摘要本文主要讨论了ChatGPT等人工智能模型的高能耗问题。根据相关研究估算,ChatGPT每天消耗的电量相当于1.7万个美国家庭的日耗电量,约50万度电。...
基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了
华为诺亚方舟实验室的研究团队提出了一种新的训练方法,名为由弱到强式训练(weak-to-strong training),旨在解决个人研究者在开发顶级文生图(T2I)模型时...
我是跪着看完的:最接近SORA的开源模型来了!训练你自己的SORA模型!
文章介绍了一个名为Latte的开源模型,该模型采用了与SORA相同的Vision Transformer结构。文章首先讨论了Vision Transformer的优势,指出其能够更好地处理视频...
谷歌具身智能新研究:比RT-2优秀的RT-H来了
谷歌DeepMind的RT系列机器人在具身智能研究中取得了显著进展。RT-2是全球首个控制机器人的视觉-语言-动作(VLA)模型,能够通过对话识别图像并执行任务。现在...
免费AI“神器”系列第七弹:华为首个AI图像生成模型论文公布;克隆数字分身应用近期爆红|钛媒体AGI
本文介绍了近期生成式人工智能(AIGC)领域涌现的多款创新应用,包括华为的AI图像生成模型PixArt-Σ、音乐生成模型Chat Musician、数字人平台D-ID推出的AI数字...
AI教程|我替你淘了10个超好用的 AI 智能体
这篇文章是一篇关于智谱清言智能体的体验分享,作者在之前的文章中分享了对Kimi Chat的体验,得到了读者的认可。文章中提到,除了ChatGPT,国内也有很多优秀...
华为盘古大模型领航AI时代,这些概念股有望一飞冲天!
华为盘古大模型:采用深度学习技术,具备强大的智能化能力,在自然语言处理、图像识别和语音合成等领域表现出色,引领着新一轮科技革命。概念股全景扫描:涉...
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
机器之心专栏机器之心编辑部近期报道了Meta开源的LLaMA架构在大型语言模型(LLM)中的成功应用,以及最新研究成果VisionLLaMA的进展。VisionLLaMA是一种旨在实...
Midjourney封禁Stability AI:恶意爬取数据,致服务器瘫痪24小时
在最近的报道中,AI 图像生成公司 Midjourney 和 Stability AI 之间发生了一起引人注目的事件。据爆料者透露,Midjourney 的服务器在上周六凌晨遭受了来自 St...
中科院等万字详解:最前沿图像扩散模型综述
中科院联合Adobe和苹果公司的研究人员发布了一篇关于图像编辑中扩散模型的重磅综述。这篇综述全文长达26页,包含1.5万余词,涵盖了297篇文献,全面研究了图像...