图像生成

图像,绘画

AI电视,一夜爆发!

以下是根据文章内容撰写的详细、分段的摘要总结,其中重点词语和句子已使用HTML标签进行加粗显示:一、引言1. 从CES、MWC到AWE 2024,科技行业精彩不断。2. A...

Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒

OpenAI的首席技术官Mira Murati在最近的一次采访中透露了更多关于其新推出的文生视频工具Sora的细节。采访主要围绕以下几个方面展开:Sora的工作原理。作为一...

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

苹果公司近期在生成式人工智能(GenAI)领域取得了显著进展,特别是在多模态大型语言模型(MLLM)的研究上。苹果CEO蒂姆·库克在2024年苹果股东大会上表示,公...

字节掉队AI时代?

步骤2. 撰写详细摘要:AI技术的快速发展正在重塑各行各业,引发全球科技大厂的竞逐。字节跳动作为互联网'新贵',也在积极布局AI领域。其旗下视频剪辑工具CapCut(...

能说会看会行动,OpenAI机器人,一出手就是王炸

步骤2:Figure,一家明星机器人创业公司,最近发布了全新的机器人demo,这款机器人名为Figure 01,得到了OpenAI大模型的能力加持。Figure 01现在可以与人全面...

哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?

智东西报道了深度学习领域的一个重要讨论:视频生成器是否可以被视为世界模拟器。Meta首席科学家杨立昆分享了一篇探讨这一问题的万字博文,引发了业界的广泛...

LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!

新智元报道介绍了微软亚洲研究院推出的基于字节的Transformer模型bGPT,该模型能够处理不同类型的数据,生成文本、图像和音频,甚至模拟计算机行为。bGPT与传...

颜水成/程明明新作!Sora核心组件DiT训练提速10倍,Masked Diffusion Transformer V2开源

该文章介绍了一项名为Masked Diffusion Transformer V2的新技术,该技术在ImageNet基准测试中取得了1.58的FID分数,刷新了最新的SOTA。这项技术通过引入mask ...

对话生数科技CEO唐家渝:数亿元融资背后,中国 AI 视频技术何时超越Sora?|钛媒体AGI

北京生数科技有限公司近日完成数亿元新一轮融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI等跟投。融资将用于多模态基础大模型的迭代研发、应用产品创新...

清华系多模态大模型公司刚刚融了数亿元!放话“今年达到Sora效果”

生数科技是一家清华系多模态大模型公司,最近完成了一轮数亿元的融资,由多家投资方领投。他们的研究成果包括文生图、文生3D模型、文生视频等领域。公司提出...
1 64 65 66 67 68 88