视频生成
视频,video
谷歌发布Geimini2.0,开启Agent新时代
谷歌近期发布了其最新的AI模型Gemini2.0,标志着公司在AI领域的重大进步。Gemini2.0是首个实现原生多模态输入输出的模型,性能全面升级,速度是前代1.5 Pro的...
Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务
苹果公司的研究团队最近发布了一项关于视频生成大模型的新研究,名为STIV(Scalable Text and Image Conditioned Video Generation)。这项研究提出了一个具...
OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1
谷歌DeepMind宣布了新一代原生多模态模型Gemini 2.0 Flash的正式发布,标志着智能体时代的进一步发展。Gemini 2.0 Flash在性能上超越了前代1.5 Pro,速度提升...
Gemini 2.0发布了,可惜的是关注的人很少
谷歌近日宣布推出其人工智能大模型系列的最新作品——Gemini 2.0,其中Gemini 2.0 Flash实验版本率先亮相。这款模型能够生成文本、图像和语音,并处理多种格式...
Sora终于来了,但多模态AI呼唤实用主义
OpenAI发布的视频生成模型Sora Turbo在实测中未能超越市场上现有视频模型,存在视频时长、生成效果一致性、指令遵循等方面的不足。Sora项目被比作视频版GPT-1...
Gemini 2.0来了:一个要做所有AI agent底座的超级模型
OpenAI在发布会的第五天宣布了ChatGPT与Apple设备的集成升级,用户可以在Apple设备上无需ChatGPT账号即可启用Apple Intelligence扩展,享受Siri的复杂任务转...
AI 取代低技能工作?别慌,这些领域仍是人类主场|独家对话 OpenAI 前研究员和中关村科金总裁
在近期的讨论中,大模型技术的应用落地成为了人工智能领域的关键话题。中关村科金总裁喻友平和OpenAI前杰出研究员Kenneth Stanley共同探讨了大模型在实际应用...
谷歌深夜祭出Gemini 2.0 “硬刚”OpenAI,还让开发者免费试用!Agent时代最强模型登场了?
谷歌在与OpenAI的竞争中发布了Gemini 2.0系列人工智能模型的首个版本,名为Gemini 2.0 Flash。这个模型提供聊天版本供全球用户使用,并有一个实验版供开发人...
WebRTC创建者加入了OpenAI,他如何思考语音AI的未来?
WebRTC的联合创始人Justin Uberti,同时也是Fixie.ai的联合创始人兼CTO,宣布加入OpenAI领导实时AI项目。Uberti在Google时期参与创建并领导了WebRTC项目,并...
Gemini 2.0发布!主打Agent+多模态,性能超1.5 Pro、可直接生成音频、图片
谷歌发布了Gemini 2.0 Flash,标志着原生多模态输入输出模型时代的到来。这款模型在性能上与1.5 Pro型号相当,但成本效益、性能效率和速度均有所提升。Gemini...