图像生成
图像,绘画
新豆包模型让郭德纲喊出发疯文学:(这班)不上了!不上了!不上了!!!
火山引擎近期对豆包语音大模型进行了重大升级,推出了豆包语音合成模型2.0和豆包声音复刻模型2.0。此次升级的核心目标是让AI语音从“像人”走向“懂人”,通过深...
Adobe 新研究:不用再「喂」训练数据,VLM 靠和自己玩游戏变聪明
视觉语言模型(VLM)面临数据稀缺和人类知识天花板两大核心挑战。当前训练方法高度依赖人工标注数据和强化学习奖励设计,导致多模态标注成本高昂,且模型能力...
大模型追逐星辰大海,GPT和Gemini国际天文奥赛夺金
大型语言模型在国际天文学和天体物理学奥林匹克竞赛(IOAA)中展现出接近或超越人类金牌选手的卓越表现。最新研究以2022-2025年IOAA试题为基准,系统评估了GP...
ICLR 2026惊现SAM 3,分割一切的下一步:让模型理解「概念」
Meta的研究团队可能推出了「Segment Anything」系列的最新版本SAM 3,相关匿名论文已提交至ICLR 2026。该论文提出了「可提示概念分割」(PCS)任务,通过文本...
今天,好像见证了属于SD时代的消亡。
国内著名模型开源社区liblib宣布升级至2.0版本,标志着以Stable Diffusion为代表的开源AI绘画时代迎来重大转折。公告中提及'开源生态遇冷'与'新用户找不到方...
告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星
中国科学院计算技术研究所的研究团队在NeurIPS 2025发表论文《SpaceServe: Spatial Multiplexing of Complementary Encoders and Decoders for Multimodal LL...
首家AIOS落地来自vivo:个人化智能复刻人类思维,手机还能这样用
vivo在2025年开发者大会上展示了其端侧AI技术的重大突破,标志着AI手机从概念走向实用化。通过推出蓝心3B端侧多模态推理大模型,vivo构建了一套轻量化且高效...
当Sora2遇上国产 Vidu Q2,国产参考生真的更香了!一手亲测
近期AI视频生成领域迎来重要进展,Vidu Q2参考生视频功能与Sora 2展开多维度技术对比。测试聚焦三大核心维度:一致性保持、物理规律遵循和运镜能力。在一致性...
Sora 和 AI 视频的爆炸性红利
团队在一次长达两个半小时的周会上重点讨论了OpenAI最新发布的社交类AI视频应用Sora及其第二代模型Sora 2。会议气氛异常兴奋,与会者深入探讨了这项技术带来...
vivo 的 AI 破局之道:给每个用户发一个「专属」大模型
2025年vivo开发者大会的核心焦点是「2025蓝心智能战略」的全面升级,这一战略旨在通过AI技术的深度整合与创新,打造更贴近用户需求的个人化智能体验。OriginO...