图像生成

中国首次！高文院士获得 IEEE 社会基础设施创新奖

中国工程院院士高文因其在高性能人工智能计算基础设施和高效视频编码领域的杰出贡献，荣获2025年度IEEE社会基础设施创新奖，成为首位获此殊荣的中国科学家。...

AIGC动态

8个月前

近期，字节跳动在2024冬季火山引擎FORCE原动力大会上推出了豆包大模型家族的新成员——豆包・视觉理解模型，该模型具备强大的视觉理解能力，能够处理复杂视觉问...

AI-Agent

8个月前

2024年中国大模型领域的竞争格局因阶跃星辰完成数亿美元B轮融资而发生变化。此次融资由国资、战略和财务投资人参与，核心投资方包括上海国有资本投资有限公司...

AIGC动态

8个月前

在商品视觉呈现领域，AI技术的应用正逐渐改变传统的商品图制作流程，提升效率和创意。AI商品图工具通过简化设计流程，确保视觉效果与品牌风格的融合，助力企...

AIGC动态

8个月前

梵蒂冈与Iconem和微软合作，利用40万张照片和人工智能技术，在不到一个月的时间内完成了对圣彼得大教堂的3D复刻，创建了这座拥有400多年历史的地标的数字双胞...

AIGC动态

8个月前

人工智能（AI）的发展在过去十年中取得了爆炸性的进展，这主要归功于神经网络规模的扩大和对大量数据的训练。然而，随着对数据的需求不断增长，AI研究人员正...

AIGC动态

8个月前

多模态大模型（MLLM）在视觉理解领域取得了显著进展，其中视觉指令调整方法因其数据和计算效率而被广泛应用。Meta和纽约大学的合作论文探讨了大型语言模型（L...

AIGC动态

8个月前

智源研究院于2024年12月19日发布了下半年大模型综合评测结果，涉及100余个开源和商业闭源模型，覆盖文本、语音、图像和视频等多个领域。此次评测在5月的基础...

AIGC动态

8个月前

谷歌在其“Gemini 2.0 Flash Thinking”模型上取得了新进展，该模型以其卓越的推理能力而受到关注，能够通过“明确地展示自己的思维”来解决复杂问题，其水平与物...

AIGC动态

8个月前

豆包最新发布的“豆包·视觉理解模型”展示了其在图像识别和代码生成方面的强大能力。该模型能够识别APP截图，并迅速生成相应的代码，包括菜单栏、播放列表框架...

AI-Agent

8个月前