标签:视觉理解

一手实测豆包新发布的视觉理解大模型,他们真的卷起飞了。

在字节火山发布会现场,字节跳动展示了其AI技术的多项升级,包括语音、音乐、大语言模型、文生图和3D生成等。其中,豆包视觉理解模型因其出色的效果和价格优...

新SOTA来了:国产9B模型多项得分超4o-mini,中国出海电商已经用上了

阿里巴巴国际AI团队最近开源了一款名为Ovis1.6的多模态大模型,该模型在多模态领域的权威评测基准OpenCompass上取得了显著成绩,超越了其他主流开源模型,如Q...