“U-Net”的搜索结果

文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
Playground Research最近推出了一款名为PGv3的文本到图像模型,该模型在多个方面实现了技术突破。PGv3拥有240亿参数量,采用了深度融合...
对话VAST创始人宋亚宸:神学爱好者创业,做出被马斯克转发的3D大模型
VAST是一家成立于2023年3月的AI公司,专注于通用3D大模型的研发。公司的目标是打造一个大众级别的3D内容创作工具,并建立一个3D UGC内容...
神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊
在一项开创性的研究中,科学家们首次证明了神经网络能够创建自己的空间地图。这项研究由Heritage Medical研究所的计算生物学助理教授Mat...
与Sora同架构,高效、连贯文生视频模型
Snap Video是由Snap、特伦托大学、加州大学和布鲁诺凯斯勒基金会的研究人员联合推出的一款高效且具有连贯一致性的文本生成视频模型。该...
斯坦福、丰田最新研究,单视频合成多视角模型GCD
在AI视觉领域,重建复杂动态场景是一个极具挑战性的任务。尽管OpenAI的Sora模型能够生成长达一分钟的高质量视频,但其在没有多视角视频...
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
本文介绍了一款名为可灵的全新国产视频生成大模型,它是快手公司推出的产品级应用。可灵采用了类似Sora的技术路线,融合了多项自研技术...
GPT-3水平的Sora 就强大到不敢给普通人用?可我也不知道把它用在哪儿
2023年以来,多模态视频生成技术取得了显著的进展,其中OpenAI旗下视频生成模型Sora在2024年2月发布后迅速成为全球焦点。Sora在视频生成...
Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型
视频生成的挑战视频生成比图像合成更复杂,因为它需要在不同帧之间保持时间一致性,并且收集高质量的视频数据比收集图像数据更具挑战性...
文本直接生成多视角3D图像,Meta推出创新模型
该文章介绍了一个专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的平台。...
扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径
新智元最近报道了一项有趣的研究,一位博士研究人员利用「离散扩散」模型解决了图像表示迷宫中的最短路径问题。这项实验通过反复添加水...
1 2