视频生成
视频,video
重磅!ChatGPT解锁高级视频对话、屏幕共享,实时交互时代
OpenAI在技术直播中发布了ChatGPT的高级实时视频对话和屏幕共享功能,这些功能将极大地促进教育、旅游等需要实时讲解的领域。用户可以实时与ChatGPT交流,打...
OpenAI全量上线4o视频通话 – 我们等了7个月。
OpenAI的直播活动在第6天迎来了备受期待的实时视频通话功能,这一功能自公布以来已经延迟了7个月。直播中介绍了三项主要内容:实时视频通话、实时理解屏幕和...
ChatGPT版Her能视频通话和共享屏幕了,附赠一个限时圣诞老人
OpenAI的ChatGPT推出了高级语音模式的新功能,其中包括视频对话和实时屏幕共享,以及节日特别活动“圣诞老人”音色。用户现在可以通过点击对话框中的高级语音模...
OpenAI版Her登场,GPT能实时视频通话了!德扑AI之父:比 o1“更受宠”的模式降临
OpenAI最近推出了高级语音模式的新功能,包括实时视频通话、屏幕共享和图像上传,这些功能将在未来几天内向所有Team用户以及大多数ChatGPT Plus和Pro用户推出...
谷歌发布Geimini2.0,开启Agent新时代
谷歌近期发布了其最新的AI模型Gemini2.0,标志着公司在AI领域的重大进步。Gemini2.0是首个实现原生多模态输入输出的模型,性能全面升级,速度是前代1.5 Pro的...
Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务
苹果公司的研究团队最近发布了一项关于视频生成大模型的新研究,名为STIV(Scalable Text and Image Conditioned Video Generation)。这项研究提出了一个具...
OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1
谷歌DeepMind宣布了新一代原生多模态模型Gemini 2.0 Flash的正式发布,标志着智能体时代的进一步发展。Gemini 2.0 Flash在性能上超越了前代1.5 Pro,速度提升...
Gemini 2.0发布了,可惜的是关注的人很少
谷歌近日宣布推出其人工智能大模型系列的最新作品——Gemini 2.0,其中Gemini 2.0 Flash实验版本率先亮相。这款模型能够生成文本、图像和语音,并处理多种格式...
Sora终于来了,但多模态AI呼唤实用主义
OpenAI发布的视频生成模型Sora Turbo在实测中未能超越市场上现有视频模型,存在视频时长、生成效果一致性、指令遵循等方面的不足。Sora项目被比作视频版GPT-1...
Gemini 2.0来了:一个要做所有AI agent底座的超级模型
OpenAI在发布会的第五天宣布了ChatGPT与Apple设备的集成升级,用户可以在Apple设备上无需ChatGPT账号即可启用Apple Intelligence扩展,享受Siri的复杂任务转...