“视觉推理”的搜索结果

Meta开源多模态模型——Llama 3.2
Meta公司最近发布了其首个多模态大语言模型(LLM)Llama-3.2,标志着Llama系列的重大升级。此次升级包括四个不同规模的模型,旨在满足不...
新一代人形机器人Figure 02登场,号称“地表最强AI硬件”,能对话会学习,无间断打工20小时
Figure AI公司推出了新一代人形机器人Figure 02,号称“地表最强AI硬件”,具有对话和学习能力,能在工厂环境中无间断工作20小时。Figure ...
奥特曼深夜发动价格战,GPT-4o mini暴跌99%!清华同济校友立功,GPT-3.5退役
OpenAI最近推出了GPT-4o mini,这是一款更小、性能更强、成本更低的人工智能模型。相较于GPT-3.5,GPT-4o mini在性能上有所提升,同时价...
OpenAI推出“小”模型GPT-4o Mini,成本骤降,开始跟各位卷性价比了
OpenAI最近推出了一款名为GPT-4o Mini的轻量级人工智能模型,旨在为预算有限的开发者提供经济实惠的选择。这款模型以其较低的成本和强大...
新王Claude 3.5实测:阿里数学竞赛题不给选项直接做对
Claude 3.5 Sonnet是Anthropic公司推出的一款新型大型语言模型,以其卓越的性能和快速、低成本的特点在全球范围内受到关注。在关键指标...
能精准解读X光片,开源视觉大模型Dragonfly
Together.ai最近开源了名为Dragonfly的大语言模型,该模型具有多分辨率视觉编码功能。Dragonfly设计了两个版本:Llama-3-8b-Dragonfly-v...
329篇图像、视频生成论文,今年CVPR最火的研究主题是这些
计算机视觉和模式识别会议(CVPR)2024年的录用结果显示,共有2719篇论文被接收,录用率为23.6%。当前计算机视觉领域的研究热点分布广泛...
奥特曼昨晚放话也要把大模型价格打下来!微软一夜革新生产力:Copilot 贯穿全场、小模型持续炸街
在微软Build开发者大会上,CEO萨蒂亚·纳德拉发布了一系列新品,重点在于人工智能技术的应用与开发。其中,Phi-3小模型家族尤为引人注目...
IEEE:GPU很好,但不是唯一
随着大语言模型的兴起,传统的看法认为GPU在AI应用中占据主导地位,但近期的趋势和实践表明,CPU在很多AI推理场景中展现出了其适用性和...
全球首个OpenAI机器人诞生!Figure 01碾压马斯克擎天柱,10亿机器人大军正式启动
Figure 01是一个由初创公司Figure和OpenAI合作开发的多模态人形机器人。它能够自主地与人类和环境进行交互,展现了惊人的视觉、语言理解...
1 2