图像生成

图像,绘画

智谱开源AI绘图CogView4,曾经的开源之光回来了。

近日,智谱与清华团队正式开源了AI绘图模型CogView4,成为首个支持中英文字直接生成的开源图像生成模型。该模型基于6B参数规模,支持最高2048像素分辨率的图...

微软提出AutoGen Studio,用低代码方式开发智能体

微软开发的AutoGen Studio平台致力于解决非专业开发者构建复杂AI智能体的技术门槛问题。该平台基于开源的AutoGen框架,结合可视化拖拽与低代码技术,实现了智...

超越人类!DeepMind强化学习新突破:AI在「我的世界」中封神!

DeepMind研究团队通过改进基于Transformer世界模型的强化学习技术,在Craftax-classic游戏中实现了AI智能体对人类的超越。该智能体仅需100万步环境交互即可获...

360AI推出DiT架构下”省钱版”ControlNet, 参数量骤减85%性能达到SOTA!

360人工智能研究院提出新型可控生成框架RelaCtrl,通过优化控制信号集成方式和引入轻量化模块设计,有效解决了现有Diffusion Transformer方法存在的参数冗余...

当AI遇上心理学:如何让AI的眼神更像人?|AAAI 2025

高瓴人工智能学院宋睿华团队与跨学科研究者合作开发的EyEar技术,成功实现了对人类视听同步场景下注视轨迹的预测。该模型通过结合物理启发的动力系统和多模态...

字节视频生成新突破!Phantom搞定多人物/主体一致性

字节智能创作团队推出的Phantom视频生成模型,在解决多主体一致性难题上取得突破性进展。该模型通过精准捕捉人物、物品、动物及虚拟角色的关键特征,实现多主...

Nature独家爆料:全球机构撤稿率大排行,医学领域成重灾区

* * *Nature杂志首次对2014年至2024年全球机构撤稿率进行分析显示,医学领域成为撤稿重灾区,约60%的高撤稿率机构为医院或医学院。研究数据来自三家私营研究...

Karpathy更新AI科普视频,网友:原本周末打算结个婚,改看视频了

Andrej Karpathy发布了一部时长2小时18分钟的教学视频,系统性地解析大型语言模型(LLM)的实践应用方法。该视频以普通用户为对象,聚焦如何通过LLM提升工作...

GPT-4.5 发布!OpenAI 史上最大最贵也可能是最慢那个,全网都在骂大街啦

OpenAI发布了GPT-4.5模型,目前以“研究预览”形式面向Pro订阅用户(每月200美元)和API开发者开放。该模型被官方称为“迄今知识最丰富的模型”,但明确强调其并...

被Github 上的Stable Diffusion 坑惨了?失业、欠帐、恐慌,工程师怒喷:AI软件毁了我!

前迪士尼工程师Matthew Van Andel因下载一款AI图像生成器而陷入一场由恶意软件引发的噩梦。他原本以为这是GitHub上的一个有用工具,却未料到它携带了恶意软件...
1 2 3 4 5 110