大模型

LLM,VLM,模型

拾象科技万字详解MCP:Agentic AI中间层最优解,以及创业公司的三个机会

Anthropic推出的Model Context Protocol(MCP)在AI领域引发了广泛关注,尤其是在Agentic AI的中间层领域,MCP已经显著垄断了AI应用与工具之间的连接层。MCP...

微信聊天框内置元宝,超级 App 又一轮进化开始

微信近期在聊天界面内置了名为「元宝红包封面助手」的AI助手,该助手依托腾讯混元大模型,提供陪聊、答题、作图及定制红包封面等功能。这一举措标志着AI技术...

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

在基于物理世界的真实场景中进行视觉问答时,现有的AI模型往往无法识别出参考选项中没有最佳答案的情况。例如,当问题要求预测车辆接下来的行动时,预设选项...

Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍

创建和理解3D结构在科学研究中具有重要意义,它不仅承载了丰富的物理与化学信息,还为解构复杂系统、进行模拟预测和跨学科创新提供了重要工具。随着AI技术的...

“不用高级GPU”!蚂蚁用国产AI芯片狂降百万训练成本,模型性能还与DeepSeek相当

蚂蚁集团在人工智能领域取得了显著进展,通过使用国产芯片和优化技术,成功降低了人工智能模型的训练成本。具体而言,蚂蚁集团在训练“专家混合”(MoE)模型时...

32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强

阿里通义千问Qwen发布了最新视觉语言模型Qwen2.5-VL-32B-Instruct,进一步扩展了其开源家族的产品线。该模型在尺寸和性能之间取得了平衡,能够在本地运行,并...

DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了

DeepSeek V3-0324的发布虽然被官方称为“小版本升级”,但实际表现却远超预期。该版本在多个测试中展现出显著的能力提升,尤其是在复杂问题的处理上。例如,在4...

爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合 | ICLR 2025

块离散去噪扩散语言模型(BD3-LMs)结合了自回归模型和扩散模型的优势,解决了现有扩散模型在生成长度受限、推理效率低和生成质量低等方面的问题。通过块状扩...

AI就是所有人疯狂竞争,最后Google赢得比赛的游戏?

2016年,Google CEO桑达尔·皮查伊宣布公司将转向“AI优先”的战略,标志着Google对人工智能领域的深度押注。2017年,Google研究人员发表了开创性论文《Attentio...

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3-0324的发布标志着AI领域的一次重要升级。该模型拥有6850亿参数,虽然参数增幅不大,但在代码和数学推理能力上取得了显著提升。特别是在代码领域...
1 55 56 57 58 59 590