视频生成

视频,video

重磅!ChatGPT解锁高级视频对话、屏幕共享,实时交互时代

OpenAI在技术直播中发布了ChatGPT的高级实时视频对话和屏幕共享功能,这些功能将极大地促进教育、旅游等需要实时讲解的领域。用户可以实时与ChatGPT交流,打...

OpenAI全量上线4o视频通话 – 我们等了7个月。

OpenAI的直播活动在第6天迎来了备受期待的实时视频通话功能,这一功能自公布以来已经延迟了7个月。直播中介绍了三项主要内容:实时视频通话、实时理解屏幕和...

ChatGPT版Her能视频通话和共享屏幕了,附赠一个限时圣诞老人

OpenAI的ChatGPT推出了高级语音模式的新功能,其中包括视频对话和实时屏幕共享,以及节日特别活动“圣诞老人”音色。用户现在可以通过点击对话框中的高级语音模...

OpenAI版Her登场,GPT能实时视频通话了!德扑AI之父:比 o1“更受宠”的模式降临

OpenAI最近推出了高级语音模式的新功能,包括实时视频通话、屏幕共享和图像上传,这些功能将在未来几天内向所有Team用户以及大多数ChatGPT Plus和Pro用户推出...

谷歌发布Geimini2.0,开启Agent新时代

谷歌近期发布了其最新的AI模型Gemini2.0,标志着公司在AI领域的重大进步。Gemini2.0是首个实现原生多模态输入输出的模型,性能全面升级,速度是前代1.5 Pro的...

Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务

苹果公司的研究团队最近发布了一项关于视频生成大模型的新研究,名为STIV(Scalable Text and Image Conditioned Video Generation)。这项研究提出了一个具...

OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1

谷歌DeepMind宣布了新一代原生多模态模型Gemini 2.0 Flash的正式发布,标志着智能体时代的进一步发展。Gemini 2.0 Flash在性能上超越了前代1.5 Pro,速度提升...

Gemini 2.0发布了,可惜的是关注的人很少

谷歌近日宣布推出其人工智能大模型系列的最新作品——Gemini 2.0,其中Gemini 2.0 Flash实验版本率先亮相。这款模型能够生成文本、图像和语音,并处理多种格式...

Sora终于来了,但多模态AI呼唤实用主义

OpenAI发布的视频生成模型Sora Turbo在实测中未能超越市场上现有视频模型,存在视频时长、生成效果一致性、指令遵循等方面的不足。Sora项目被比作视频版GPT-1...

Gemini 2.0来了:一个要做所有AI agent底座的超级模型

OpenAI在发布会的第五天宣布了ChatGPT与Apple设备的集成升级,用户可以在Apple设备上无需ChatGPT账号即可启用Apple Intelligence扩展,享受Siri的复杂任务转...
1 3 4 5 6 7 133