图像生成

图像,绘画

当AI遇上心理学:如何让AI的眼神更像人?|AAAI 2025

高瓴人工智能学院宋睿华团队与跨学科研究者合作开发的EyEar技术,成功实现了对人类视听同步场景下注视轨迹的预测。该模型通过结合物理启发的动力系统和多模态...

字节视频生成新突破!Phantom搞定多人物/主体一致性

字节智能创作团队推出的Phantom视频生成模型,在解决多主体一致性难题上取得突破性进展。该模型通过精准捕捉人物、物品、动物及虚拟角色的关键特征,实现多主...

Nature独家爆料:全球机构撤稿率大排行,医学领域成重灾区

* * *Nature杂志首次对2014年至2024年全球机构撤稿率进行分析显示,医学领域成为撤稿重灾区,约60%的高撤稿率机构为医院或医学院。研究数据来自三家私营研究...

Karpathy更新AI科普视频,网友:原本周末打算结个婚,改看视频了

Andrej Karpathy发布了一部时长2小时18分钟的教学视频,系统性地解析大型语言模型(LLM)的实践应用方法。该视频以普通用户为对象,聚焦如何通过LLM提升工作...

GPT-4.5 发布!OpenAI 史上最大最贵也可能是最慢那个,全网都在骂大街啦

OpenAI发布了GPT-4.5模型,目前以“研究预览”形式面向Pro订阅用户(每月200美元)和API开发者开放。该模型被官方称为“迄今知识最丰富的模型”,但明确强调其并...

被Github 上的Stable Diffusion 坑惨了?失业、欠帐、恐慌,工程师怒喷:AI软件毁了我!

前迪士尼工程师Matthew Van Andel因下载一款AI图像生成器而陷入一场由恶意软件引发的噩梦。他原本以为这是GitHub上的一个有用工具,却未料到它携带了恶意软件...

OpenAI Deep Research专访:Agent 的未来是端到端、强化学习微调

OpenAI Deep Research 和 Grok Deep Search 展示了人工智能在复杂任务处理上的重大突破。推理模型经过强化学习端到端训练后,处理复杂任务的能力有了质的飞跃...

熬夜看完 GPT 4.5 的发布,没有特别多惊喜。

OpenAI最新发布的GPT-4.5模型(代号Orion)成为其迄今为止计算资源和数据规模最大的AI系统,训练过程延续了无监督预训练技术路径。尽管模型参数量级显著提升...

微软首个多模态Phi-4问世,56亿参数秒杀GPT-4o!LoRA华人大佬带队

微软发布Phi-4系列两款新型模型——Phi-4-multimodal和Phi-4-mini,标志着小型语言模型(SLM)领域的重大突破。Phi-4-multimodal作为微软首个多模态模型,集成...

微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B

微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员,标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...
1 12 13 14 15 16 121