视频生成

视频,video

谷歌版Sora来了,4K高清暴击OpenAI!视频生图新卷王,更理解物理世界

谷歌近期发布了Veo 2,一个先进的视频生成模型,其在理解现实世界物理和运动细节方面超越了Sora。Veo 2能够理解电影摄影语言,包括镜头类型和效果,并且支持...

Google全新发布AI视频Veo2、AI绘图Imagen3 – 何以凌越。

Google近期在人工智能领域取得了显著进展,发布了两个重要的AI模型:AI视频模型Veo 2和AI绘图模型Imagen 3的改进版。Veo 2以其先进的视频生成能力获得高度评...

ChatGPT搜索大更新!实时搜索、高级语音,AI搜索时代来了

OpenAI在技术分享直播中宣布了对ChatGPT搜索功能的多项更新。新增功能包括实时搜索,允许用户获取分钟级别的实时内容,如股票和新闻;高级语音模式,提供更自...

视频一键拆分PS层!DeepMind新模型效果碾压同级,物体、背景完美分离,还能脑补

DeepMind的研究人员开发了一种创新的视频分层方法,该方法能够在不假设背景静止或需要精确相机姿态的情况下,将视频分解成多个包含物体及其效果(如阴影和反...

Ilya错了,预训练没结束!LeCun等反击,「小模型时代」让奥特曼预言成真

Ilya Sutskever在NeurIPS 2024上提出“预训练结束了”的观点,引发了AI界的广泛讨论。他主张,由于数据资源的枯竭,预训练所需的大量数据即将耗尽,可能影响未...

企业大模型落地关键是什么?这家领先的大模型技术和应用公司给出答案

2024年12月12日,北京中关村科金技术有限公司主办的“2024大模型技术与应用创新论坛”在北京举行。论坛上,中关村科金总裁喻友平发布了“大模型时代的‘三级引擎...

豆包生成汉字,不是神秘的技术,而是好产品

近期,设计圈因一款名为豆包的AI设计工具而变得活跃,该工具能够生成带有工整中文字体的图片,包括四格漫画、产品海报和电影海报等。这一功能的出现,使得原...

3分钟用AI让照片开口说话,去造属于自己的梦吧。

文章介绍了一种利用AI技术实现的口型驱动技术,该技术能够使照片中的角色开口说话。作者通过使用“即梦”这个工具,展示了如何将一张照片和一段语音结合起来,...

网易云音乐也要做小红书?听歌这件事,越来越复杂了

网易云音乐近期的更新中引入了“笔记”板块,模仿了小红书的图文呈现方式,这一变化引起了用户的广泛讨论。尽管网易云音乐的笔记功能允许用户在图文或视频笔记...

Ilya Sutskever在NeurIPS炸裂宣判:预训练将结束,数据压榨到头了(全文+视频)

Ilya Sutskever,OpenAI的联合创始人和前首席科学家,在NeurIPS 2024会议上发表了演讲,提出了对人工智能发展的深刻见解。他预测,由于可用的新数据接近枯竭...
1 2 3 4 5 133