图像生成

苹果大模型MM1杀入场：300亿参数、多模态、MoE架构，超半数作者是华人

苹果公司近期在生成式人工智能（GenAI）领域取得了显著进展，特别是在多模态大型语言模型（MLLM）的研究上。苹果CEO蒂姆·库克在2024年苹果股东大会上表示，公...

AIGC动态

10个月前

步骤2. 撰写详细摘要:AI技术的快速发展正在重塑各行各业,引发全球科技大厂的竞逐。字节跳动作为互联网'新贵',也在积极布局AI领域。其旗下视频剪辑工具CapCut(...

AIGC动态

10个月前

步骤2：Figure，一家明星机器人创业公司，最近发布了全新的机器人demo，这款机器人名为Figure 01，得到了OpenAI大模型的能力加持。Figure 01现在可以与人全面...

AIGC动态

10个月前

智东西报道了深度学习领域的一个重要讨论：视频生成器是否可以被视为世界模拟器。Meta首席科学家杨立昆分享了一篇探讨这一问题的万字博文，引发了业界的广泛...

AIGC动态

10个月前

新智元报道介绍了微软亚洲研究院推出的基于字节的Transformer模型bGPT，该模型能够处理不同类型的数据，生成文本、图像和音频，甚至模拟计算机行为。bGPT与传...

AIGC动态

10个月前

该文章介绍了一项名为Masked Diffusion Transformer V2的新技术，该技术在ImageNet基准测试中取得了1.58的FID分数，刷新了最新的SOTA。这项技术通过引入mask ...

AIGC动态

10个月前

北京生数科技有限公司近日完成数亿元新一轮融资，由启明创投领投，达泰资本、鸿福厚德、智谱AI等跟投。融资将用于多模态基础大模型的迭代研发、应用产品创新...

AIGC动态

10个月前

生数科技是一家清华系多模态大模型公司，最近完成了一轮数亿元的融资，由多家投资方领投。他们的研究成果包括文生图、文生3D模型、文生视频等领域。公司提出...

AIGC动态

10个月前

文章介绍了Midjourney发布的新功能——角色参照，让用户可以生成图像并使其保持与给定参照角色一致的特征。这个功能受到网友们的热烈欢迎，他们纷纷表示这是Mid...

AIGC动态

10个月前

摘要：生成式AI创业公司Midjourney近期遭遇了24小时的服务器宕机，导致用户图库中的图像无法正确显示。Midjourney认为此次宕机是由于“付费账户的类似僵尸网络...

AIGC动态

10个月前