图像生成

图像,绘画

中山大学王广润:大模型的微调只是对空间建模的微调 | GAIR 2025

王广润博士在GAIR 2025大会的演讲聚焦于基础模型与物理世界建模的前沿探索。他指出,真实世界的动态性和复杂性要求AI不仅具备感知能力,还需理解物理规律并预...

火山引擎的「火」,是怎么点起来的

火山引擎作为字节跳动在AI时代的重要技术输出平台,其核心战略定位已明确为「AI云原生」,通过内外双循环验证技术价值。过去两年,云服务行业普遍转向以AI能...

刚刚,谷歌祭出迄今最前沿模型 Gemini 3 Flash!编程能力上反超 Gemini 3 Pro,且更快更便宜

谷歌发布了其迄今为止最快的AI模型Gemini 3 Flash,该模型专为速度设计,旨在帮助用户更快地学习、构建和规划。Gemini 3 Flash在博士级别的推理和知识基准测...

12月,我们推荐这 7 款 AI 新品

在极客公园创新大会上,7款前沿AI产品通过线下发布会形式亮相,展现了AI技术在不同领域的创新应用。这些产品均诞生于近一个月内,涵盖硬件、笔记工具、营销服...

硬刚Sora2,万相2.6轻松定制角色、控制分镜,普通人也能当导演

2025年标志着视频生成技术进入全新范式,以阿里万相2.6为代表的模型实现了从单点突破到系统级创新的跨越。该模型首次在国内实现声画一致性角色定制,通过多模...

GPT Image 1.5发布,网友:低配版Nano Banana Pro

OpenAI于12月16日正式推出ChatGPT Images的重大更新,核心变化包括全新的图像生成与编辑体验,以及面向开发者的API模型GPT Image 1.5。此次升级聚焦三大能力...

实测GPT Image 1.5,拼尽全力还是没能打败Banana。

OpenAI近期发布了GPT Image 1.5图像生成模型,与Google的Banana Pro展开直接竞争。通过对多组测试案例的对比分析,发现两者在信息准确性、真实质感、精准编辑...

西湖大学修宇亮:数字人重建,慢慢都会变成基础模型的微调任务 | GAIR 2025

在第八届GAIR全球人工智能与机器人大会上,西湖大学助理教授修宇亮分享了远兮实验室在高精度数字人重建领域的三项突破性进展。UP2You技术将传统数字人建模时...

QQ音乐你变了,竟能免费在AI PC上原创一首《大东北》

QQ音乐近期推出了一项创新的AI作曲功能,用户可以通过简单的操作在本地生成原创歌曲。该功能目前仅在配备AI PC的设备上免费提供,利用本地大模型进行推理,显...

港中文 MMlab×美团新研究:仅用一个模型,应对多种视觉推理任务

香港中文大学多媒体实验室与美团联合研究团队提出了一种名为OneThinker的统一多模态推理模型,旨在解决当前单一任务或单一模态方法面临的瓶颈问题。现实世界...
1 2 3 159