图像生成

一个LoRA实现GPT-4o级图像编辑！浙大哈佛新模型冲上Hugging Face榜二

基于文本指令的图像编辑任务一直是图像生成和编辑领域的热点，近年来随着Gemini、GPT-4o等商业大模型的推出，这一领域的技术水平不断提升。然而，传统方法通...

AIGC动态

2个月前

微软在最新发布的Windows 11中，全面集成了AI技术，为用户带来了多项创新功能。首先，智能体（Agent）功能通过自然语言交互，简化了系统设置和操作流程，用户...

AI-Agent

2个月前

ChatGPT通过一组公开的prompt，展示了其在看图猜地点任务中的惊人能力。在一系列测试中，ChatGPT不仅能够根据图像中的细节推断出大致的地理位置，甚至在某些...

AIGC动态

2个月前

刘世奇，一位97年出生的内蒙古年轻人，凭借对AI技术的深刻理解和应用，在电商和外贸领域取得了显著成就。他的故事始于一次偶然的机会，通过参加跨境电商博览...

AIGC动态

2个月前

港科广团队提出的MultiGO创新方案，通过分层建模思路，成功解决了从单张图像生成高保真3D人体模型的行业难题。该方法将人体分解为不同精度层级，从基础体型到...

AIGC动态

2个月前

沉浸式翻译团队最近开源了其PDF翻译工具——BabelDOC PDF，该工具在很大程度上解决了PDF机翻中常见的排版乱码、串行等问题，能够直接输出对版的精准PDF。BabelD...

AIGC动态

2个月前

OpenAI近期发布了o3和o4-mini两个新模型，标志着其在推理和多模态能力上的重大突破。o3模型凭借其全面的推理能力、丰富的工具使用方式以及全新的多模态CoT（C...

AI-Agent

2个月前

全球AI大模型的发展正迅速进入“多模态时代”，这一趋势不仅体现在技术进展上，也反映在应用和落地的需求中。多模态技术已成为AI领域的关键能力，尤其是在智能...

AI-Agent

2个月前

夸克近期推出的「拍照问夸克」功能，标志着AI多模态入口的进一步升级。通过将相机作为与AI交互的核心工具，夸克AI相机不仅简化了用户的操作流程，还提供了更...

AI-Agent

3个月前

OpenAI的o3模型展示了通过照片识别地理位置的强大能力，引发了广泛的关注和讨论。Django Web框架的创始人Simon Wilson通过实验发现，o3能够通过Python代码和...

AIGC动态

3个月前