视频生成
视频,video
Stable Diffusion 3更多隐藏功能曝光:文字可更改图片细节
文章主要介绍了Stable Diffusion 3的三大能力和效果展示。首先,Stable Diffusion 3的文字渲染水平得到了显著提高,能够实现各种复杂的文字效果。其次,该模...
免费 AI “神器”系列第五弹:斯坦福洗碗机器人爆火,字节版DALL·E模型登上开源榜单前三|钛媒体AGI
文章介绍了五款创新的人工智能(AI)应用,这些应用在生成式人工智能(AIGC)领域具有很高的价值。这五款应用分别是:1. 斯坦福AI“螃蟹”洗碗机器人技术——UMI...
小米 AI 的第一个「大招」,用在了影像能力上
文章标题:AI+影像,小米 14 Ultra 这次的目标是取代街拍相机文章摘要:1. 小米 14 Ultra 作为小米龙年第一场发布会的主角,其影像能力得到了重点关注。小米...
Sora到底懂不懂物理世界?一场头脑风暴正在AI圈大佬间展开
文章主要讨论了OpenAI发布的视频生成模型Sora是否能理解物理世界的问题。Sora能够将生成视频的长度拉长到60秒,并能理解Prompt中的要求,这让人们对其是否理...
Sora物理悖谬的几何解释
Sora作为一个视频生成模型,在龙年伊始引起了广泛关注。它声称能够模拟世界,但存在一些技术缺陷。本文从现代数学的角度,特别是整体微分几何领域,分析了Sor...
Sora | 大模型从读万卷书到行万里路
文章总结了OpenAI的最新视频生成模型Sora的主要特点和影响。以下是详细的摘要:1. Sora的特点: - 生成高质量且一致的视频,长度可达一分钟,远超当前最佳...
10000+摄像头连上别人家!网络故障导致中断重启,官方甩锅第三方缓存库
美国智能家居公司Wyze的摄像头监控平台出现系统故障,导致超过13000名用户能够看到别人家的画面。这一事件引起了广泛的关注和讨论。Wyze官方解释称,由于大量...
Gemini 1.5实测:我看Sora一眼假;还有更多惊艳功能
在AI领域,谷歌的Gemini 1.5版本在实测中表现出色,有望重新夺回被Sora抢占的风头。Gemini 1.5能够分析视频内容,判断其是否由AI生成,并指出具体的造假细节...
Karpathy新视频又火了:从头构建GPT Tokenizer
在技术领域,卡帕西离职OpenAI后,推出了新的教学视频,这次是关于构建GPT Tokenizer(分词器)的详细教程。视频时长2小时13分钟,内容丰富,涉及分词器的重...
中国AIGC应用全景图谱案例征集启动|量子位智库
2024年AI发展趋势与AIGC应用全景图谱在2024年,AI技术的发展正朝着多模态、视频生成和智能体Agent等新方向迈进。量子位智库即将发布一份名为《中国AIGC应用全...