大模型
LLM,VLM,模型
深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙
DeepSeek-Prover-V2的发布标志着数学推理领域的一次重大突破。该模型通过递归+强化学习的训练方法,显著提升了其在形式化定理证明中的表现。DeepSeek-Prover-...
Windsurf团队关于Agent的认知,相当精彩
Agent 系统的核心概念可以简单理解为一个接受用户输入,并交替执行两种调用的系统:大语言模型(LLM)和工具。LLM 会根据用户输入、上下文信息以及对话内容,...
五一大瓜!英伟达强烈批评Anthropic,造谣中国走私AI芯片
Anthropic在近期发布的报告中指出,中国为获取最新AI芯片,采取了包括“假孕肚”和活龙虾运输在内的非常规手段。这一说法引发了广泛争议,尤其是来自英伟达的强...
DeepSeek开源Prover-V2强推理模型,网友:奥数从没这么简单过
DeepSeek团队在五一劳动节期间发布了DeepSeek-Prover-V2,这是一款专为数学AI编程语言Lean 4打造的开源大语言模型,专注于形式化定理证明。该模型在定理证明...
上海车展见证历史:从「西为中用」到「中为西用」,行业风向标携手Momenta
2025年上海车展见证了中国汽车工业的历史性转折,标志着从“技术输血”到“智能造血”的转变。上汽大众作为中国首家轿车合资车企,与智能辅助驾驶公司Momenta签署...
小米入局大模型赛道!开源MiMo-7B,性能超o1-mini
小米近日宣布进军大模型领域,并开源了一款名为MiMo-7B的模型。尽管MiMo-7B仅有70亿参数,但其在多个测试中表现优异,在数学AIME24/25中分别达到68.2分和55.4...
沉浸式翻译团队新品:BabelDOC PDF,无损翻译 PDF,免费用户可用
沉浸式翻译团队最近开源了其PDF翻译工具——BabelDOC PDF,该工具在很大程度上解决了PDF机翻中常见的排版乱码、串行等问题,能够直接输出对版的精准PDF。BabelD...
GruAI 张海龙:产品形态只是表象,Cursor 与 Devin 终有一战|AI 产品十人谈
自2022年12月ChatGPT问世以来,AI技术引发了广泛关注,但实际落地的产品却寥寥无几。AI编程(AI Coding)作为当前AI应用领域中最具商业化潜力的行业,吸引了...
o3解读:OpenAI发力tool use,Manus们会被模型取代吗?
OpenAI近期发布了o3和o4-mini两个新模型,标志着其在推理和多模态能力上的重大突破。o3模型凭借其全面的推理能力、丰富的工具使用方式以及全新的多模态CoT(C...
直播预告|仉尚航、王鹤、高阳、赵行、杨耀东探讨 VLA 技术的实践与突破
视觉-语言-动作(VLA)技术作为具身智能的核心,正在加速从实验室走向产业应用,预计到2025年,全球具身智能产业规模将突破百亿美元。VLA技术在机器人、自动...