图像生成
图像,绘画
Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了
Stable Diffusion 3,经过一年多的酝酿,终于发布了,带来了三大能力的提升。首先是文字渲染能力,能够精确地呈现各种文字效果,如黑板上的粉笔字、路牌的霓...
为什么号称模拟世界的Sora,处理不好一些简单的物理规律?
本文讨论了AIGC领域的专业社区,特别是关注微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。文章以Sora视频生成模型为例,探讨了...
Sora出圈,背后DiT也火了!作者NYU谢赛宁官宣全新升级版SiT
新智元报道了扩散Transformer(DiT)的升级版——可扩展插值Transformer(SiT)。SiT在质量、处理速度和使用灵活性方面都有显著提升。OpenAI的视频生成模型Sora...
免费 AI “神器”系列第四弹:字节跳动发布视频界“神笔马良”,谷歌Gemini竞争对手爆火|钛媒体AGI
1. 视频界“神笔马良”——字节Boximator模型字节跳动开发的Boximator模型,通过文本描述精准控制视频中人物或物体的动作。用户输入动作描述,Boximator生成对应...
追赶OpenAI的Sora:Meta开源V-JEPA,让AI学会认识世界!
Meta公司基于Yann LeCun提出的JEPA(联合嵌入预测架构)模型,开发了非生成视频模型V-JEPA。该模型旨在通过观察和自我思考、总结,使AI模型能够学习并模拟世...
英伟达推出免训练,可生成连贯图片的文生图模型
摘要总结:本文介绍了由英伟达和特拉维夫大学研究人员开发的ConsiStory模型,这是一个免训练一致性连贯文生图模型,旨在解决当前文生图模型在生成连贯图像方...
OpenAI 模型家族更新:GPT-4 训练数据至 2023 年 12 月
OpenAI发布新模型和API更新OpenAI宣布了GPT-3.5-turbo、GPT-4以及GPT-4-turbo-preview等新模型版本,用户可以通过发送请求并查看响应对象来验证使用的模型。O...
OpenAI 一线员工比国内还“卷”!深度揭秘 Sora 关键技术:时空补丁如何变成OpenAI 的新“魔法”
OpenAI的Sora模型通过时空补丁的创新使用,实现了将静态图像转化为动态、逼真视频的能力。Sora结合了Diffusion和Transformer架构,创建了Diffusion Transform...
每秒500token的“网红”芯片Groq让人惊叹,但人们开始担心它的可用性
[功能切片/深度学习/并行性/分布式全局内存/Dragonfly网络][可用性/模型微调/内容长度/硬件成本/运营成本][硅基时代/技术发展/定制产品/通用产品]Groq公司的...
Midjourney创始人:版权问题暂时无解,AI生图不是要取代艺术家
### 新智元报道摘要#### Midjourney创始人David Holz谈AI对创意工作的影响背景:Midjourney,一家AI图像生成平台,因其在艺术创作领域的应用而受到关注。然而...