视频生成
视频,video
Stable Diffusion 3 发布:模型与 Sora 同架构、解决文字乱码、更好理解物理世界
Stable Diffusion 3.0发布,采用DiT架构,图像质量大幅提升Stability AI发布了Stable Diffusion 3.0,该版本采用了与Sora相同的DiT架构,显著提升了画面质量...
与Sora同架构的Stable Diffusion 3.0 震撼发布!4 秒视频生成却翻车,网友:还是等 Sora 吧!
Stability AI 发布了最新的图像生成 AI 模型 Stable Diffusion 3.0,这款模型在文字渲染能力、多主题生成和超高画质方面取得了显著进步。首席执行官 Mostaque...
Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了
Stable Diffusion 3,经过一年多的酝酿,终于发布了,带来了三大能力的提升。首先是文字渲染能力,能够精确地呈现各种文字效果,如黑板上的粉笔字、路牌的霓...
Sora爆火超100小时:美国狂“卷”芯片算力,国内卖 AI 课“捞金”割韭菜|钛媒体AGI
美国OpenAI公司发布的AI视频生成模型Sora引起了全球关注,人们对其逼真的视频生成能力感到惊叹。国内AI行业对此产生了三种声音:担忧中美AI差距、关注AI算力...
为什么号称模拟世界的Sora,处理不好一些简单的物理规律?
本文讨论了AIGC领域的专业社区,特别是关注微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。文章以Sora视频生成模型为例,探讨了...
Sora出圈,背后DiT也火了!作者NYU谢赛宁官宣全新升级版SiT
新智元报道了扩散Transformer(DiT)的升级版——可扩展插值Transformer(SiT)。SiT在质量、处理速度和使用灵活性方面都有显著提升。OpenAI的视频生成模型Sora...
谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即
摘要总结:谷歌Research Lead蒋路,负责VideoPoet项目,已确认加入TikTok,继续在视频生成AI领域工作。蒋路在谷歌期间,带领团队推出了与Sora技术路线相似的...
免费 AI “神器”系列第四弹:字节跳动发布视频界“神笔马良”,谷歌Gemini竞争对手爆火|钛媒体AGI
1. 视频界“神笔马良”——字节Boximator模型字节跳动开发的Boximator模型,通过文本描述精准控制视频中人物或物体的动作。用户输入动作描述,Boximator生成对应...
追赶OpenAI的Sora:Meta开源V-JEPA,让AI学会认识世界!
Meta公司基于Yann LeCun提出的JEPA(联合嵌入预测架构)模型,开发了非生成视频模型V-JEPA。该模型旨在通过观察和自我思考、总结,使AI模型能够学习并模拟世...
不只是100万上下文,谷歌Gemini 1.5超强功能展示
AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,特别是谷歌发布的Gemini 1.5模型。尽管在发布当天遭遇...