图像生成

图像,绘画

GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式

  文章摘要 【关 键 词】 VAR、图像生成、自回归模型、扩散模型、Scaling Laws 机器之心最近发布了一篇关于新一代视觉生成范式「VAR: Visual Auto ...

剑指Sora!120秒超长AI视频模型免费开玩

近日,Picsart AI Research 团队联合发布了一款名为 StreamingT2V 的 AI 视频生成模型,该模型能够生成长达1200帧、时长为2分钟的视频,这在AI视频生成领域是...

OpenAI Sora核心作者:我们拥有的数据量足以实现AGI

  文章摘要 【关 键 词】 OpenAI、Sora、视频生成、AGI、技术细节 前不久,OpenAI CEO Sam Altman 的一句话引发了业界对电影和电子游戏未来的热议...

谷歌、OpenAI、Mistral 在24小时内打响科技界“三强争霸赛”

本周,谷歌、OpenAI和Mistral在人工智能领域展开了激烈的竞争。谷歌发布了Gemini 1.5 Pro的公开预览版,这是功能最强大的生成式AI模型之一,能够处理更大的上...

CVPR 2024丨文本或图像提示精准编辑 3D 场景,美图&信工所&北航&中大联合提出 3D 编辑方法 CustomNeRF

美图影像研究院(MT Lab)联合中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了一种名为CustomNeRF的3D场景编辑方法。这项技术允许使用文本...

谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora

在最近的谷歌Next大会上,谷歌发布了一系列重磅产品和服务,进一步加强了其在人工智能领域的竞争力。以下是会议的主要亮点:1. Imagen 2.0的升级:谷歌推出了...

面壁智能完成数亿元新融资,华为哈勃领投,北京AI产投基金跟投|钛媒体AGI

2024年,面壁智能宣布完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。2024年,面壁智...

OpenAI 重磅发布的GPT-4 Turbo with Vision,是编码的倒退

OpenAI 最近发布了最新的 GPT-4 Turbo with Vision 模型,该模型在 GPT-4 Turbo 系列的基础上新增了视觉理解能力,可以处理和分析多媒体输入信息。这一革新使...

超越GPT-4V,苹果多模态大模型上新!

苹果发布了最新的多模态大语言模型(MLLM)Ferret-UI,该模型在理解和与屏幕信息交互方面表现出卓越性能,超越了GPT-4V。Ferret-UI专为理解移动UI屏幕而设计...

苹果发布多模态模型 Ferret-UI,部分手机 UI 任务超越 GPT-4V

随着大模型的兴起,科技巨头和创业公司都在新一轮的技术竞赛中寻求优势。苹果公司,尽管长期处于行业领先地位,却在大模型领域显得稍有落后。然而,苹果最近...
1 52 53 54 55 56 88