图像生成
图像,绘画
试了试 ChatGPT的图片生成功能,我佩服的无话可说
今天凌晨,ChatGPT正式发布了基于GPT-4o模型的原生图像生成功能,标志着其在图片处理能力方面的一次重要升级。这一功能的推出,不仅展示了OpenAI在多模态推理...
AI-Native游戏应该如何落地?看看这12款游戏是怎么做的
近年来,AI技术在游戏领域的应用逐渐增多,涵盖了派对游戏、恋爱模拟、剧情互动等多个品类,为传统玩法注入了新的活力。通过对11款AI驱动游戏的体验,发现开...
推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1
在基于物理世界的真实场景中进行视觉问答时,现有的AI模型往往无法识别出参考选项中没有最佳答案的情况。例如,当问题要求预测车辆接下来的行动时,预设选项...
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
阿里通义千问Qwen发布了最新视觉语言模型Qwen2.5-VL-32B-Instruct,进一步扩展了其开源家族的产品线。该模型在尺寸和性能之间取得了平衡,能够在本地运行,并...
爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合 | ICLR 2025
块离散去噪扩散语言模型(BD3-LMs)结合了自回归模型和扩散模型的优势,解决了现有扩散模型在生成长度受限、推理效率低和生成质量低等方面的问题。通过块状扩...
AI就是所有人疯狂竞争,最后Google赢得比赛的游戏?
2016年,Google CEO桑达尔·皮查伊宣布公司将转向“AI优先”的战略,标志着Google对人工智能领域的深度押注。2017年,Google研究人员发表了开创性论文《Attentio...
ElevenLabs举办了一场全球黑客松,这些AI Voice产品得奖了
ElevenLabs举办的全球Hackathon活动吸引了来自世界各地的数百名开发者,共同打造了超过300个AI Agent。活动展示了语音AI技术的广泛应用,涵盖了从通信协议到...
Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强
澳大利亚国立大学的研究团队提出了一种全新的图像生成模型ARINAR,该模型在生成质量和速度上均取得了显著提升。ARINAR全称为双层自回归逐特征生成模型,其核...
英伟达团队发布最新具身模型 Cosmos-Reason1,在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型
英伟达团队在GTC大会上发布了新的物理世界大模型Cosmos-Reason1,该模型专注于提升AI系统与物理世界交互的推理能力。作为Cosmos系列的一部分,Cosmos-Reason1...
对话周光:自动驾驶实现AGI,RoadAGI比L5更快 | GTC 2025
在英伟达GTC 2025大会上,元戎启行CEO周光提出了RoadAGI的概念,这是一种通过自动驾驶实现垂直领域通用人工智能(AGI)的新路径。与传统的Robotaxi不同,Road...