图像生成

刚刚，o4-mini发布！OpenAI史上最强、最智能模型

OpenAI在技术直播中发布了其最新的多模态模型o4-mini和满血版o3，这两款模型能够同时处理文本、图像和音频，并具备调用外部工具的能力。这一创新使得模型能够...

AIGC动态

8个月前

OpenAI最新发布的满血版o3和o4-mini模型在多个领域展现了卓越的性能，尤其是在视觉推理和工具调用方面实现了重大突破。o3模型首次将图像推理融入思维链，能够...

AIGC动态

8个月前

字节跳动近日发布了全球首个由AI生成的25秒视频，这一成果由Seaweed-7B模型完成。该模型参数量仅为70亿，但在核心任务上的表现超越了参数量为其两倍的主流模...

AIGC动态

8个月前

《自然》杂志通过分析五个数据库（Web of Science、Scopus、OpenAlex、Dimensions、Google Scholar）的数据，发布了21世纪被引用次数最多的论文Top 25排名。...

AIGC动态

8个月前

PhysGen3D 是由清华大学、伊利诺伊大学香槟分校和哥伦比亚大学的研究团队提出的一个创新框架，旨在从单张静态图像中构建可交互的物理3D世界。该框架通过整合...

AIGC动态

8个月前

可灵 AI 于 4 月 15 日在北京中关村国际创新中心举行了「灵感成真」2.0 模型发布会，正式面向全球发布了可灵 2.0 视频生成模型和可图 2.0 图像生成模型。自去...

AIGC动态

8个月前

谷歌DeepMind最新发布的Veo 2视频生成技术已整合至GeminiApp应用中，全面开放使用。Veo 2能够生成最高8秒的720P电影级视频，在运镜、文本语义还原、物理模拟...

AIGC动态

8个月前

大模型的出现显著提升了3D场景生成的效率，但生成包含时间和空间维度的4D城市场景仍然面临巨大挑战。4D城市生成不仅需要处理结构复杂、视觉多样化的物体，如...

AIGC动态

8个月前

可灵 AI 正式发布了可灵 2.0 视频生成模型和可图 2.0 图像生成模型，标志着其在视觉生成技术领域的重大突破。可灵 2.0 被描述为“世界上最强大的视觉生成模型”...

AIGC动态

8个月前

国内最大的MCP中文社区正式上线，标志着AI开发门槛的进一步降低。魔搭ModelScope推出的「MCP广场」汇集了近1500款MCP服务，覆盖搜索、地图、支付、开发者工具...

AIGC动态

8个月前