图像生成

图像,绘画

谷歌Gemini火力全开!实测:原生图像生成新升级确实强

谷歌Gemini原生图像生成功能在最新升级中展现了显著的技术进步,尤其在图像质量、文本渲染和生成速度方面表现突出。此次升级的核心亮点在于图像生成的质量提...

原来,AI也有「搜商」高低的差别?

五一假期期间,许多人通过社交媒体体验到了旅游的拥堵和规划难题,这反映出在信息爆炸的时代,如何高效获取和利用信息成为一大挑战。传统的搜索引擎虽然提供...

富士 GFX100RF 上手:能塞进口袋的中画幅,仅需 34900

富士最新推出的GFX100RF相机,凭借其复古设计和便携性,试图重新定义中画幅相机的使用场景。这款相机将1.02亿像素的中画幅传感器装入紧凑机身,重量仅为735克...

字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%

字节跳动最近开源了一种新的图像编辑方法,名为SuperEdit,该方法在性能上比当前最先进的图像编辑方法提高了9.19%,同时仅使用了1/30的训练数据和1/13的模型...

一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二

基于文本指令的图像编辑任务一直是图像生成和编辑领域的热点,近年来随着Gemini、GPT-4o等商业大模型的推出,这一领域的技术水平不断提升。然而,传统方法通...

微软将大量AI功能、智能体集成在Windows11,全民AI时代来了

微软在最新发布的Windows 11中,全面集成了AI技术,为用户带来了多项创新功能。首先,智能体(Agent)功能通过自然语言交互,简化了系统设置和操作流程,用户...

o3一张图锁定地球表面坐标,AI看图猜地点战胜人类大师,奥特曼:这是我的「直升机」时刻

ChatGPT通过一组公开的prompt,展示了其在看图猜地点任务中的惊人能力。在一系列测试中,ChatGPT不仅能够根据图像中的细节推断出大致的地理位置,甚至在某些...

专访刘世奇 – 他用AI设计丑拖鞋,一年卖了3000万。

刘世奇,一位97年出生的内蒙古年轻人,凭借对AI技术的深刻理解和应用,在电商和外贸领域取得了显著成就。他的故事始于一次偶然的机会,通过参加跨境电商博览...

细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025

港科广团队提出的MultiGO创新方案,通过分层建模思路,成功解决了从单张图像生成高保真3D人体模型的行业难题。该方法将人体分解为不同精度层级,从基础体型到...

沉浸式翻译团队新品:BabelDOC PDF,无损翻译 PDF,免费用户可用

沉浸式翻译团队最近开源了其PDF翻译工具——BabelDOC PDF,该工具在很大程度上解决了PDF机翻中常见的排版乱码、串行等问题,能够直接输出对版的精准PDF。BabelD...
1 5 6 7 8 9 129