图像生成

OpenAI版Her登场，GPT能实时视频通话了！德扑AI之父：比 o1“更受宠”的模式降临

OpenAI最近推出了高级语音模式的新功能，包括实时视频通话、屏幕共享和图像上传，这些功能将在未来几天内向所有Team用户以及大多数ChatGPT Plus和Pro用户推出...

AIGC动态

9个月前

谷歌近期发布了其最新的AI模型Gemini2.0，标志着公司在AI领域的重大进步。Gemini2.0是首个实现原生多模态输入输出的模型，性能全面升级，速度是前代1.5 Pro的...

AI-Agent

9个月前

苹果公司的研究团队最近发布了一项关于视频生成大模型的新研究，名为STIV（Scalable Text and Image Conditioned Video Generation）。这项研究提出了一个具...

AIGC动态

9个月前

谷歌DeepMind宣布了新一代原生多模态模型Gemini 2.0 Flash的正式发布，标志着智能体时代的进一步发展。Gemini 2.0 Flash在性能上超越了前代1.5 Pro，速度提升...

AIGC动态

9个月前

谷歌近日宣布推出其人工智能大模型系列的最新作品——Gemini 2.0，其中Gemini 2.0 Flash实验版本率先亮相。这款模型能够生成文本、图像和语音，并处理多种格式...

AIGC动态

9个月前

OpenAI在发布会的第五天宣布了ChatGPT与Apple设备的集成升级，用户可以在Apple设备上无需ChatGPT账号即可启用Apple Intelligence扩展，享受Siri的复杂任务转...

AI-Agent

9个月前

2024年年末，AI领域迎来了一系列重要更新。Google发布了新模型Gemini 2.0，专注于Agent功能，即AI的感知环境、执行任务和独立决策能力。Google此次发布包括四...

AI-Agent

9个月前

在近期的讨论中，大模型技术的应用落地成为了人工智能领域的关键话题。中关村科金总裁喻友平和OpenAI前杰出研究员Kenneth Stanley共同探讨了大模型在实际应用...

AIGC动态

9个月前

谷歌在与OpenAI的竞争中发布了Gemini 2.0系列人工智能模型的首个版本，名为Gemini 2.0 Flash。这个模型提供聊天版本供全球用户使用，并有一个实验版供开发人...

AI-Agent

9个月前

谷歌发布了Gemini 2.0 Flash，标志着原生多模态输入输出模型时代的到来。这款模型在性能上与1.5 Pro型号相当，但成本效益、性能效率和速度均有所提升。Gemini...

AI-Agent

9个月前