图像生成

图像,绘画

我是跪着看完的:最接近SORA的开源模型来了!训练你自己的SORA模型!

文章介绍了一个名为Latte的开源模型,该模型采用了与SORA相同的Vision Transformer结构。文章首先讨论了Vision Transformer的优势,指出其能够更好地处理视频...

谷歌具身智能新研究:比RT-2优秀的RT-H来了

谷歌DeepMind的RT系列机器人在具身智能研究中取得了显著进展。RT-2是全球首个控制机器人的视觉-语言-动作(VLA)模型,能够通过对话识别图像并执行任务。现在...

免费AI“神器”系列第七弹:华为首个AI图像生成模型论文公布;克隆数字分身应用近期爆红|钛媒体AGI

本文介绍了近期生成式人工智能(AIGC)领域涌现的多款创新应用,包括华为的AI图像生成模型PixArt-Σ、音乐生成模型Chat Musician、数字人平台D-ID推出的AI数字...

AI教程|我替你淘了10个超好用的 AI 智能体

这篇文章是一篇关于智谱清言智能体的体验分享,作者在之前的文章中分享了对Kimi Chat的体验,得到了读者的认可。文章中提到,除了ChatGPT,国内也有很多优秀...

华为盘古大模型领航AI时代,这些概念股有望一飞冲天!

华为盘古大模型:采用深度学习技术,具备强大的智能化能力,在自然语言处理、图像识别和语音合成等领域表现出色,引领着新一轮科技革命。概念股全景扫描:涉...

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

机器之心专栏机器之心编辑部近期报道了Meta开源的LLaMA架构在大型语言模型(LLM)中的成功应用,以及最新研究成果VisionLLaMA的进展。VisionLLaMA是一种旨在实...

Midjourney封禁Stability AI:恶意爬取数据,致服务器瘫痪24小时

在最近的报道中,AI 图像生成公司 Midjourney 和 Stability AI 之间发生了一起引人注目的事件。据爆料者透露,Midjourney 的服务器在上周六凌晨遭受了来自 St...

中科院等万字详解:最前沿图像扩散模型综述

中科院联合Adobe和苹果公司的研究人员发布了一篇关于图像编辑中扩散模型的重磅综述。这篇综述全文长达26页,包含1.5万余词,涵盖了297篇文献,全面研究了图像...

你花钱想消除的 AI 水印,其实也是虚假内容的克星

近几个月来,深度伪造(deepfakes)或人工智能生成内容的新闻报道层出不穷,涉及多个知名人物,如泰勒·斯威夫特、汤姆·汉克斯和美国总统乔·拜登。这些内容的...

这五位女性,正在改变 AI 行业

在这篇文章中,我们探讨了女性在人工智能(AI)领域的重要贡献及其面临的挑战。文章通过介绍五位杰出的女性AI研究者和创业者,揭示了女性在推动科技前沿的同...
1 77 78 79 80 81 99