图像生成
图像,绘画
CVPR现场直击|1.2万人涌入的AI顶会,华人主导的最佳论文,和彻底被“Sora”改造的CV
2024年的CVPR(计算机视觉模式识别会议)在美国西雅图召开,吸引了超过1.2万名来自全球的参与者,创下了参会人数的新高。这一年度盛会不仅展示了计算机视觉领...
1.2万人朝圣CVPR,华人学者夺最佳论文!Sora舵手火爆演讲成大型追星现场
2024年的CVPR会议在美国西雅图成功举行,成为历史上规模最大、参与人数最多的一届。会议吸引了超过1.2万人参加,共提交了11532篇论文,比去年增加了2000多篇...
超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文
计算机视觉领域的顶级会议CVPR 2024在美国西雅图成功举行,会议规模和参与人数均创历史新高,现场参会人数超过一万两千人。本次会议共接收了11532篇提交论文...
ChatGPT等模型疯狂训练,最快2026年消耗尽公开文本数据
Epochai发布了一份关于大语言模型(LLM)训练数据消耗的研究报告,指出目前全球公开的高质量文本训练数据集约为300万亿tokens。然而,随着像ChatGPT这样的模...
Runway 全新 Gen-3 视频生成模型获网友盛赞:比 Sora 更好
Runway公司以其广受欢迎的视频生成工具而闻名,最近发布了最新版本的Runway Gen-3。Gen-3 Alpha是Runway在全新基础设施上训练出的模型家族的首位成员,与前代...
还得是开源!潞晨Open-Sora技术路线公开,一键生成16秒720p视频,质量更高训练成本更低
潞晨Open-Sora是一个免费开源的高清视频生成工具,自3月份发布以来,受到了广泛关注。它能够生成720p的高清视频,包括人物肖像、科幻大片、动画以及具有流畅...
Runway推出全新超现实AI视频模型Gen-3 Alpha,可生成10秒长视频
Runway公司发布了其最新的AI视频生成模型Gen-3 Alpha,该模型能够根据文本描述和静态图像生成视频内容。与前代模型相比,Gen-3在生成速度、图像质量以及视频...
NVM IP:驾驭先进节点设计的存储利器
当前半导体行业正经历着摩尔定律逐渐逼近极限的挑战,芯片制造业已跨足3纳米节点,正向2纳米迈进。随之而来的是集成度、功耗和性能的极致追求,在此背景下,...
霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,复旦百度等出品|GitHub揽星1k+
Hallo是一种基于分层音频驱动视觉合成模块的开源项目,由复旦大学、百度、苏黎世联邦理工学院和南京大学的研究人员共同完成。该项目的主要贡献是提出了一种分...
GPT-4系列模型,在文档理解中的多维度评测
Snowflake的研究人员对OpenAI的GPT-4系列模型进行了深入研究,评估了其在文本生成、图像理解、文档摘要等方面的能力。通过在DocVQA、InfographicsVQA、SlideV...