Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

AIGC动态2年前 (2024)发布 almosthuman2014

2,655 0 0

模型信息

【模型公司】 Anthropic
【模型名称】 claude-3-opus-20240229
【摘要评分】 ★★★★★

文章摘要

OpenAI的首席技术官Mira Murati在最近的一次采访中透露了更多关于其新推出的文生视频工具Sora的细节。采访主要围绕以下几个方面展开:

Sora的工作原理。作为一种扩散模型,Sora通过随机噪声生成图像,并注重保持帧与帧之间的连续性和一致性,以营造逼真的现实感。不过目前Sora在某些细节上如出租车颜色变化、人物手指数量等方面还存在瑕疵,未来会着力提升其稳定性和可控性。

Sora的训练数据来源。当被问及Sora是否使用了YouTube、Facebook、Instagram等平台上的视频作为训练数据时,Murati没有正面回答,只是表示使用了”公开可获得的数据和许可数据”,引发了一些争议。不过她承认Shutterstock是其数据来源之一。

Sora的发布时间和成本。Murati透露Sora有望于今年推出,但可能要等几个月,具体取决于安全测试的进展。目前生成一段20秒720p的视频需要几分钟,成本较高,但他们正努力优化,希望最终能以类似DALL·E的成本提供服务。

Sora可能带来的影响。面对Sora可能给视频行业从业者带来的冲击,以及公众对于AI生成虚假视频的担忧,Murati表示他们正在研究区分AI视频的方案如加水印,并强调要在大规模部署前解决这些问题。她认为尽管在AI安全方面还有很多难题,但这条道路绝对值得一试。

总的来说,作为一项黑科技,Sora展现了AI在视频生成领域的巨大潜力,但同时也面临着诸多技术和伦理方面的挑战。未来OpenAI还需在数据来源合规性、生成视频的真实性辨别等方面投入更多努力。

原文信息

【原文链接】 阅读原文
【阅读预估】 3304 / 14分钟
【原文作者】 机器之心
【作者简介】 专业的人工智能媒体和产业服务平台

# AIGC动态 # 图像生成 # 大模型 # 视频生成 # Anthropic # claude-3-opus-20240229 # Sora # 公众人物 # 安全担忧 # 文生视频 # 机器之心 # 训练数据

文章版权归作者所有，未经允许请勿转载。

总结374篇相关工作，陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

机器之心

2,035

4万亿个晶体管，单机可训练比GPT4大10倍的模型，最快最大的芯片面世

机器之心

2,760

全球最强模型一夜易主？Anthropic声称新模型性能超越GPT-4接近人类，网友：坐等GPT-5即将发布｜钛媒体AGI

钛媒体AGI

2,338

威尔史密斯本尊整活Sora，网友：我分不清！我真的分不清啊

硅星人Pro

2,224

千元级AI 模盒，云天励飞率先打响大模型「平民化」之战

机器之心

2,670

Sora要把抖音们团灭了

admin

2,535

暂无评论

暂无评论...

Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

模型信息

文章摘要

原文信息

49152 个GPU！Meta最新算力集群曝光，扎克伯格：算力，算力，还是 Meta 的算力

能力对齐、长文本、Claude 3，这次聊聊大模型重点技术路径

相关文章

暂无评论

热门网址

热门文章

Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

模型信息

文章摘要

原文信息

49152 个GPU！Meta最新算力集群曝光，扎克伯格：算力，算力，还是 Meta 的算力

能力对齐、长文本、Claude 3，这次聊聊大模型重点技术路径

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章