视觉理解 | 学习AIGC

刚刚，豆包1.5·深度思考模型上线，特供「视觉版本」，大模型多模态推理的时代真来了

近期，大模型领域迎来了一系列重要进展，尤其是豆包大模型家族的更新和火山引擎的创新发布。豆包大模型家族推出了「豆包 1.5・深度思考模型」，包含两个版本...

AI-Agent

3个月前

杭州领跑AI开源！阿里Qwen除夕开源视觉理解新旗舰，全系列3尺寸，7B模型超GPT-4o-mini

阿里巴巴集团旗下的通义Qwen发布了新的视觉理解模型Qwen2.5-VL，这是一个开源的视觉语言模型，包含3B、7B和72B三个版本。Qwen2.5-VL-72B-Instruct在多个领域...

AI-Agent

6个月前

豆包说要「普惠」，于是大模型处理图片按「厘」计价了

近期，字节跳动在2024冬季火山引擎FORCE原动力大会上推出了豆包大模型家族的新成员——豆包・视觉理解模型，该模型具备强大的视觉理解能力，能够处理复杂视觉问...

AI-Agent

7个月前

统一视觉理解与生成，MetaMorph模型问世，LeCun、谢赛宁、刘壮等参与

多模态大模型（MLLM）在视觉理解领域取得了显著进展，其中视觉指令调整方法因其数据和计算效率而被广泛应用。Meta和纽约大学的合作论文探讨了大型语言模型（L...

AIGC动态

7个月前

豆包升级了“眼睛”，看APP截图就能写代码了！超低价让多模态AI普惠

豆包最新发布的“豆包·视觉理解模型”展示了其在图像识别和代码生成方面的强大能力。该模型能够识别APP截图，并迅速生成相应的代码，包括菜单栏、播放列表框架...

AI-Agent

7个月前

一手实测豆包新发布的视觉理解大模型，他们真的卷起飞了。

在字节火山发布会现场，字节跳动展示了其AI技术的多项升级，包括语音、音乐、大语言模型、文生图和3D生成等。其中，豆包视觉理解模型因其出色的效果和价格优...

AIGC动态

7个月前

新SOTA来了：国产9B模型多项得分超4o-mini，中国出海电商已经用上了

阿里巴巴国际AI团队最近开源了一款名为Ovis1.6的多模态大模型，该模型在多模态领域的权威评测基准OpenCompass上取得了显著成绩，超越了其他主流开源模型，如Q...

AIGC动态

10个月前

标签：视觉理解

刚刚，豆包1.5·深度思考模型上线，特供「视觉版本」，大模型多模态推理的时代真来了

杭州领跑AI开源！阿里Qwen除夕开源视觉理解新旗舰，全系列3尺寸，7B模型超GPT-4o-mini

豆包说要「普惠」，于是大模型处理图片按「厘」计价了

统一视觉理解与生成，MetaMorph模型问世，LeCun、谢赛宁、刘壮等参与

豆包升级了“眼睛”，看APP截图就能写代码了！超低价让多模态AI普惠

一手实测豆包新发布的视觉理解大模型，他们真的卷起飞了。

新SOTA来了：国产9B模型多项得分超4o-mini，中国出海电商已经用上了

热门网址

标签：视觉理解

刚刚，豆包1.5·深度思考模型上线，特供「视觉版本」，大模型多模态推理的时代真来了

杭州领跑AI开源！阿里Qwen除夕开源视觉理解新旗舰，全系列3尺寸，7B模型超GPT-4o-mini

豆包说要「普惠」，于是大模型处理图片按「厘」计价了

统一视觉理解与生成，MetaMorph模型问世，LeCun、谢赛宁、刘壮等参与

豆包升级了“眼睛”，看APP截图就能写代码了！超低价让多模态AI普惠

一手实测豆包新发布的视觉理解大模型，他们真的卷起飞了。

新SOTA来了：国产9B模型多项得分超4o-mini，中国出海电商已经用上了

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址