图像生成
图像,绘画
凌晨“激战”!谷歌亮相新模型,OpenAI 紧急甩出 GPT-4o 动动嘴就能 P 图,网友:又要感谢 DeepSeek 了
OpenAI 近期发布了 GPT-4o 图像生成技术,该技术被直接集成到 ChatGPT 中,标志着图像生成功能成为其原生能力。这一新功能允许用户通过自然语言指令生成图像...
Manus,我不等你了!我已经用秒哒手搓应用了
近年来,编程技能被视为数字时代的必备能力,然而,全球仍有98%的人被挡在编程大门之外。尽管编程学习热潮兴起,但现实是,许多人难以真正掌握这一技能。百度...
原旷视技术天才成立的具身智能公司「原力灵机」获 2 亿元天使轮融资
具身智能领域迎来新玩家,原力灵机近日完成了2亿元的天使轮融资,投资方包括君联资本、九坤创投和启明创投。该公司的核心创始团队均来自中国知名人工智能公司...
刚刚,OpenAI发布新文生图模型,免费、逼真到难以分辨
OpenAI在技术直播中发布了GPT-4和Sora的重大更新,重点介绍了全新的文生图模型。该模型不仅支持文本生成图像,还具备自定义操作、连续发问、风格转换、图像PP...
突破14nm工艺检测壁垒:天准科技TB2000明场纳米图形晶圆缺陷检测装备开启国产缺陷检测新纪元
苏州天准科技股份有限公司旗下矽行半导体公司研发的明场纳米图形晶圆缺陷检测装备TB2000已正式通过厂内验证,并计划在SEMICON 2025展会天准展台正式发布。这...
试了试 ChatGPT的图片生成功能,我佩服的无话可说
今天凌晨,ChatGPT正式发布了基于GPT-4o模型的原生图像生成功能,标志着其在图片处理能力方面的一次重要升级。这一功能的推出,不仅展示了OpenAI在多模态推理...
AI-Native游戏应该如何落地?看看这12款游戏是怎么做的
近年来,AI技术在游戏领域的应用逐渐增多,涵盖了派对游戏、恋爱模拟、剧情互动等多个品类,为传统玩法注入了新的活力。通过对11款AI驱动游戏的体验,发现开...
推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1
在基于物理世界的真实场景中进行视觉问答时,现有的AI模型往往无法识别出参考选项中没有最佳答案的情况。例如,当问题要求预测车辆接下来的行动时,预设选项...
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
阿里通义千问Qwen发布了最新视觉语言模型Qwen2.5-VL-32B-Instruct,进一步扩展了其开源家族的产品线。该模型在尺寸和性能之间取得了平衡,能够在本地运行,并...
爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合 | ICLR 2025
块离散去噪扩散语言模型(BD3-LMs)结合了自回归模型和扩散模型的优势,解决了现有扩散模型在生成长度受限、推理效率低和生成质量低等方面的问题。通过块状扩...