标签:推理能力
OpenAI狂飙突进!仅12个例子就能打造专属AI专家,核心技术竟来自字节?
OpenAI在其“12天”活动的第二天发布了强化微调(Reinforcement Fine-Tuning)技术,并展示了ChatGPT Pro。这项技术允许企业用户通过极少的数据定制o1 mini模型...
第一个国产中文o1来了,直接数学竞赛题伺候!
昆仑万维的Skywork o1系列模型因其出色的推理能力而备受关注。该系列包括Skywork o1 Open、Skywork o1 Lite和Skywork o1 Preview三个细分模型,分别具备解决...
OpenAI怒斥Scaling撞墙论!o1已产生推理直觉潜力巨大
OpenAI高级研究副总裁Mark Chen在一次炉边谈话中反驳了关于Scaling Law(规模法则)撞墙的观点。他强调,OpenAI通过o系列和GPT系列模型,成功维持了模型的Sca...
震撼预警:满血版o1倒计时!奥特曼完整专访流出:o系列疯狂迭代,马上起飞
OpenAI即将推出的满血版o1模型在科技圈引起了广泛关注。该模型预计将具备函数调用、开发者消息、结构化输出和流式传输等能力,可能成为OpenAI历史上的重大突...
Transformer能否推理引争议,DeepMind连夜更新论文开源数据集:Transformer真的很强
DeepMind最近的研究在人工智能领域引起了广泛关注,他们训练了一个仅270M大小的Transformer模型,该模型在下棋任务中展现出了大师级的表现,且无需依赖搜索算...
我们能够让开源小模型变得比人类更聪明吗
本文由安全研究员Harish SG撰写,旨在探讨如何提升开源大语言模型(LLM)的推理能力,以期达到或超越闭源模型的性能。Harish SG是德克萨斯大学达拉斯分校网络...
苹果一篇论文得罪大模型圈?Transformer不会推理,只是高级模式匹配器!所有LLM都判死刑
苹果研究者的最新研究对大型语言模型(LLM)的推理能力提出了质疑。研究发现,无论是闭源的OpenAI GPT-4o和o1模型,还是开源的Llama、Phi、Gemma和Mistral等...
大模型步入「推理Scaling」时代,SambaNova如何挑战英伟达的霸主地位?
OpenAI发布的o1模型在AI领域引起了巨大震动,它不仅能够处理复杂问题,还具备出色的通用推理能力。o1模型无需专门训练即可在数学奥赛中获得金牌,并在博士级...
英伟达开源新王登基!70B刷爆SOTA,击败GPT-4o只服OpenAI o1
英伟达最近开源了一款名为Nemotron-70B的AI模型,该模型在多个基准测试中超越了包括GPT-4和Claude 3.5 Sonnet在内的140多个开闭源模型,仅次于OpenAI的o1模型...
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
OpenAI最近发布的o1模型在通用推理能力方面取得了显著进展,但在规划能力方面仍有待提升。亚利桑那州立大学(ASU)的研究团队通过PlanBench基准测试评估了当...