标签:技术报告

谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍

谷歌发布了Gemini 1.5系列多模态大模型的技术报告,该系列模型代表了高计算效率的下一代技术。报告指出,Gemini 1.5能够处理数百万token的上下文,并具备强大...

Open-Sora 全面开源升级:支持 16s 视频生成和 720p 分辨率

国产视频生成模型Open-Sora在开源社区中进行了更新,现在支持长达16秒的视频生成,分辨率最高可达720p,并能处理任何宽高比的文本到图像、文本到视频、图像到...

Open-Sora全面开源升级:支持16s视频生成和720p分辨率

Open-Sora,一个开源社区项目,近期进行了一次重大更新。这次更新带来了一系列新功能和改进,使得Open-Sora在视频生成方面更加强大和灵活。以下是对Open-Sora...

Claude 3终于来了,最强大模型易主?不,网友亲测了才算数!

文章主要介绍了Anthropic公司发布的新一代AI大模型系列——Claude 3。这个系列包括三个模型,分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,它们在能...

解剖Sora:37页论文逆向工程推测技术细节,微软参与,华人团队出品

这篇研究综述由理海大学和微软研究院的华人团队发布,深入分析了Sora模型的技术细节、应用前景和局限性。Sora是一个基于扩散模型和Transformer架构的视频生成...

中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻

摘要:OpenAI研究员Jason Wei将Sora视频生成模型比作视频领域的GPT-2,预示着视频生成技术的新时代。Sora能够创作出具有艺术感和逼真度的短视频,尽管还不能...

Sora神图惊掉下巴,好莱坞导演急撤掉8亿美元摄影棚! Sora「内测」提前开放,影视失业潮将至

Sora第二波视频发布,展示了其稳定的一致性和模拟现实的逼真度,引发了广泛关注。这些视频不仅令人惊叹,还导致好莱坞导演Tyler Perry搁置了8亿美元的工作室...

全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,今夜重燃开源之战

摘要总结:谷歌发布了全球最强的开源大模型Gemma,性能超越了Llama 2 13B,标志着谷歌和OpenAI在AI领域的竞争达到了新的高度。Gemma模型有两种规模:2B和7B,...

OpenAI王炸模型引爆科技圈,我们第一时间深读了官方技术报告

在2月16日凌晨,OpenAI发布了文生视频大模型Sora,引起了科技圈的震惊和感叹。Sora具有多项强大功能,包括文本到视频生成能力、复杂场景和角色生成能力、语言...

真·降维打击,Sora与Runway、Pika的对比来了,震撼效果背后是物理引擎模拟现实世界

这篇报道主要介绍了OpenAI发布的首个文本生成视频模型Sora在视频生成领域的突破。Sora生成的高清、流畅视频引发了社区的热议,被认为在生成时长、连贯性等方...