图像生成

图像,绘画

ECCV 2024揭榜,录用率或创新低!2395篇论文中选,网友晒出成绩单

欧洲计算机视觉国际会议(ECCV)2024年的录用结果已公布,共有2395篇论文被录用。据网友估算,今年的总提交量约为12600篇,使得录用率仅为18%,相较于CVPR 20...

黄仁勋最新对话:我们不想当行业领导者,英伟达要做前人没做过的事|钛媒体AGI

英伟达的特色是走没人做过的路,做没人会做的事。英伟达希望帮助未来的每一辆汽车都尽可能地自动驾驶,以提高安全性,但不想成为汽车公司。同时,英伟达也不...

中关村开启仿生机器人大战?撸猫弹跳各显神通,两院院士坐镇

2024年中关村仿生机器人大赛正式启动,旨在推动具身智能领域的发展。海淀区发布《关于打造全国具身智能创新高地的三年行动方案(2024-2026年)》,聚焦具身大...

人刚毕业,颠覆整个AI界:扒一扒Sora两带头人博士论文

2024年标志着生成式AI技术的飞跃,其中OpenAI的Sora模型在视频生成领域取得了突破性进展,引发了业界的广泛关注。Sora的开发团队由一群敬业的工程师组成,其...

速来!潞晨Open-Sora羊毛可薅,10元轻松上手视频生成

潞晨科技的Open-Sora模型作为全球首个开源类Sora模型,以其在多种视频类型上的优异表现和低成本易用性受到关注。最新开源的1.2版本能够生成最长16秒的720p高...

从零开始,用英伟达T4、A10训练小型文生视频模型,几小时搞定

文本生成视频模型是2024年AI领域的热门趋势之一,继大语言模型之后备受关注。本文作者Fareed Khan介绍了如何构建一个小型的文本生成视频模型,从理解理论概念...

英伟达布局AI视频,Sora风头快被抢完了

Luma AI推出了名为Dream Machine的最新文生视频模型,吸引了大量用户的关注和使用。该模型的最新功能“关键帧控制”允许用户上传首尾两张图像,并通过简单的文...

Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

张天宇在其研究中提出了一种名为视觉字幕恢复(Visual Caption Restoration, VCR)的新任务,旨在探究视觉语言模型(Vision-Language Models, VLM)的推理能...

旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包

旷视科技近期推出了一款名为MegActor的开源AI人像视频生成框架,该框架允许用户通过输入一张静态肖像图片和一段视频,生成表情丰富、动作一致的AI人像视频。M...

耳朵没错,是声音太真了,字节豆包语音合成成果Seed-TTS技术揭秘

字节跳动豆包大模型团队近期发布了名为Seed-TTS的语音生成大模型,该模型在生成与真人相似度极高的语音方面取得了显著成果。Seed-TTS能够根据文本生成具有原...
1 82 83 84 85 86 139