图像识别 | 学习AIGC

新年大礼！阿里刚开源视觉 AI Agent模型—Qwen2.5-VL

阿里巴巴最新发布了视觉多模态模型Qwen2.5-VL，该模型在图像、文本、视频的理解与识别能力上显著增强，并且具备直接作为视觉Agent自动化操作电脑和手机的独特...

AI-Agent

8个月前

“造假”齐白石的《虾》，被国产AI一眼识破！

商汤科技最新发布的日日新融合大模型交互版（SenseNova-5o，简称“新5o”）以其多模态能力显著提升了与AI交互的质量。该模型能在2秒内响应，具有逼真的语气助词...

AIGC动态

8个月前

豆包升级了“眼睛”，看APP截图就能写代码了！超低价让多模态AI普惠

豆包最新发布的“豆包·视觉理解模型”展示了其在图像识别和代码生成方面的强大能力。该模型能够识别APP截图，并迅速生成相应的代码，包括菜单栏、播放列表框架...

AI-Agent

9个月前

Kimi 数理化能跟 o1 掰手腕了？新模型 k1 有点儿强

月之暗面公司宣布推出新的视觉思考模型k1，标志着其在数理化能力上的显著提升，与OpenAI的o1模型相比毫不逊色。k1模型能够识别图片中的文字，并解读背后的科...

AIGC动态

9个月前

号称击败Claude 3.5 Sonnet，媲美GPT-4o，开源多模态模型Molmo挑战Scaling law

Ai2公司推出了一款名为Molmo的多模态人工智能模型，该模型在功能上类似于钢铁侠的智能助手“贾维斯”。Molmo能够通过一张照片识别自行车的颜色、品牌和二手售价...

AIGC动态

11个月前

OpenAI新模型o1大揭秘！官方在线大会来啦

OpenAI最近发布了o1模型，引起了科技界的广泛关注。为了解答公众的疑问，OpenAI举办了在线答疑会，以下是关键信息的总结：1. 模型命名：o1模型的命名意在表示...

AI-Agent

1年前 (2024)

腾讯元宝治好了我的信息焦虑症

本文通过一系列测试，对不同AI大模型的阅读、理解和总结能力进行了横向评估。作者马蕊蕾和林杰鑫在编辑林杰鑫的协助下，首先指出AI技术在多个行业的应用，以...

AIGC动态

1年前 (2024)

3000万美金，又一家视频生成初创公司获得融资

根据The Information的报道，一家名为Genmo的AI驱动视频生成初创公司即将从硅谷老牌风投机构NEA处筹集至少3000万美元的资金。Genmo旨在为电影制作人、制片人...

AIGC动态

2年前 (2024)

年轻人的AI新玩具：Vary-toy，1080Ti轻松驾驭的多模态大模型！

Vary-toy的核心目标是为视觉-语言模型提供更丰富的视觉词汇库，使其能够更准确地理解和描述复杂的视觉场景，提升了模型在文档OCR和对象检测等任务上的表现，...

AIGC动态

2年前 (2024)

标签：图像识别

新年大礼！阿里刚开源视觉 AI Agent模型—Qwen2.5-VL

“造假”齐白石的《虾》，被国产AI一眼识破！

豆包升级了“眼睛”，看APP截图就能写代码了！超低价让多模态AI普惠

Kimi 数理化能跟 o1 掰手腕了？新模型 k1 有点儿强

号称击败Claude 3.5 Sonnet，媲美GPT-4o，开源多模态模型Molmo挑战Scaling law

OpenAI新模型o1大揭秘！官方在线大会来啦

腾讯元宝治好了我的信息焦虑症

3000万美金，又一家视频生成初创公司获得融资

年轻人的AI新玩具：Vary-toy，1080Ti轻松驾驭的多模态大模型！

热门网址

标签：图像识别

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址