标签:图像识别

Kimi 数理化能跟 o1 掰手腕了?新模型 k1 有点儿强

月之暗面公司宣布推出新的视觉思考模型k1,标志着其在数理化能力上的显著提升,与OpenAI的o1模型相比毫不逊色。k1模型能够识别图片中的文字,并解读背后的科...

号称击败Claude 3.5 Sonnet,媲美GPT-4o,开源多模态模型Molmo挑战Scaling law

Ai2公司推出了一款名为Molmo的多模态人工智能模型,该模型在功能上类似于钢铁侠的智能助手“贾维斯”。Molmo能够通过一张照片识别自行车的颜色、品牌和二手售价...

OpenAI新模型o1大揭秘!官方在线大会来啦

OpenAI最近发布了o1模型,引起了科技界的广泛关注。为了解答公众的疑问,OpenAI举办了在线答疑会,以下是关键信息的总结:1. 模型命名:o1模型的命名意在表示...

腾讯元宝治好了我的信息焦虑症

本文通过一系列测试,对不同AI大模型的阅读、理解和总结能力进行了横向评估。作者马蕊蕾和林杰鑫在编辑林杰鑫的协助下,首先指出AI技术在多个行业的应用,以...

3000万美金,又一家视频生成初创公司获得融资

根据The Information的报道,一家名为Genmo的AI驱动视频生成初创公司即将从硅谷老牌风投机构NEA处筹集至少3000万美元的资金。Genmo旨在为电影制作人、制片人...

年轻人的AI新玩具:Vary-toy,1080Ti轻松驾驭的多模态大模型!

Vary-toy的核心目标是为视觉-语言模型提供更丰富的视觉词汇库,使其能够更准确地理解和描述复杂的视觉场景,提升了模型在文档OCR和对象检测等任务上的表现,...