图像生成

图像,绘画

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

苹果公司近期在生成式人工智能(GenAI)领域取得了显著进展,特别是在多模态大型语言模型(MLLM)的研究上。苹果CEO蒂姆·库克在2024年苹果股东大会上表示,公...

字节掉队AI时代?

步骤2. 撰写详细摘要:AI技术的快速发展正在重塑各行各业,引发全球科技大厂的竞逐。字节跳动作为互联网'新贵',也在积极布局AI领域。其旗下视频剪辑工具CapCut(...

能说会看会行动,OpenAI机器人,一出手就是王炸

步骤2:Figure,一家明星机器人创业公司,最近发布了全新的机器人demo,这款机器人名为Figure 01,得到了OpenAI大模型的能力加持。Figure 01现在可以与人全面...

哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?

智东西报道了深度学习领域的一个重要讨论:视频生成器是否可以被视为世界模拟器。Meta首席科学家杨立昆分享了一篇探讨这一问题的万字博文,引发了业界的广泛...

LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

新智元报道介绍了微软亚洲研究院推出的基于字节的Transformer模型bGPT,该模型能够处理不同类型的数据,生成文本、图像和音频,甚至模拟计算机行为。bGPT与传...

颜水成/程明明新作!Sora核心组件DiT训练提速10倍,Masked Diffusion Transformer V2开源

该文章介绍了一项名为Masked Diffusion Transformer V2的新技术,该技术在ImageNet基准测试中取得了1.58的FID分数,刷新了最新的SOTA。这项技术通过引入mask ...

对话生数科技CEO唐家渝:数亿元融资背后,中国 AI 视频技术何时超越Sora?|钛媒体AGI

北京生数科技有限公司近日完成数亿元新一轮融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI等跟投。融资将用于多模态基础大模型的迭代研发、应用产品创新...

清华系多模态大模型公司刚刚融了数亿元!放话“今年达到Sora效果”

生数科技是一家清华系多模态大模型公司,最近完成了一轮数亿元的融资,由多家投资方领投。他们的研究成果包括文生图、文生3D模型、文生视频等领域。公司提出...

Midjourney能让角色保持一致了!网友连夜实测:改变游戏规则

文章介绍了Midjourney发布的新功能——角色参照,让用户可以生成图像并使其保持与给定参照角色一致的特征。这个功能受到网友们的热烈欢迎,他们纷纷表示这是Mid...

Midjourney控诉Stability AI偷作品还搞崩了服务器!曝光后Stability AI CEO 紧急回应

摘要:生成式AI创业公司Midjourney近期遭遇了24小时的服务器宕机,导致用户图库中的图像无法正确显示。Midjourney认为此次宕机是由于“付费账户的类似僵尸网络...
1 75 76 77 78 79 99