标签:推理能力

GPT 未竟的革命,由 o1 接棒:或是 LLM 研究最重要的发现

OpenAI近期推出了o1系列,标志着其在人工智能领域的又一次重大突破。o1系列在处理复杂推理任务方面表现出色,其在国际数学奥林匹克(IMO)资格考试中的正确解...

不发 GPT-5、直接上 GPT-6?曝 OpenAI 新模型代号 Orion,目标“杀死”幻觉

OpenAI 正在开发一个名为“草莓”的项目,该项目旨在推出一款超越 GPT-4 的大语言模型,代号为 Orion。草莓项目最早可能在今年秋季发布,将作为 ChatGPT 的一部...

阿里开源新模型:超GPT-4o,数学能力全球第一!

阿里巴巴集团开源了一款名为Qwen2-Math的最新数学模型,该模型包含1.5B、7B和72B三种参数规模的版本,旨在推动AIGC领域的专业社区发展。Qwen2-Math在多个数学...

GPT 新版本猜想:奥特曼草莓图引发推理热潮

OpenAI首席执行官Sam Altman在推特上发布了一张草莓图片,引发了AI界的广泛猜想。一些网友推测,图中的五颗草莓可能暗示着下一代GPT-5的情况。其中一颗未成熟...

两天内,Meta 和 Mistral 两款主流大模型打擂台!已经不仅卷性能了,谁更便宜就用谁?

法国AI初创公司Mistral发布了其旗舰级开源模型Mistral Large 2,拥有1230亿个参数,与Meta和OpenAI的最新模型在代码生成、数学和推理方面表现相当。Mistral L...

OpenAI 秘密武器曝光!Q* 推理能力大爆发,逼近 AGI L2 里程碑

OpenAI的AGI路线图最近引起了广泛关注,该路线图将人工智能的发展分为五个等级:L1的聊天机器人、L2的推理者、L3的智能体、L4的创新者和L5的组织者。OpenAI的...

OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级

OpenAI正在开发一个名为“草莓”的新模型,它是Q*模型的后继者。尽管“草莓”的工作机制在内部被严格保密,但据悉,它在超大规模数据集上完成了预训练,并采用了...

Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

张天宇在其研究中提出了一种名为视觉字幕恢复(Visual Caption Restoration, VCR)的新任务,旨在探究视觉语言模型(Vision-Language Models, VLM)的推理能...

GPT-4被证实具有「人类心智」登Nature!AI比人类更好察觉讽刺和暗示

经过Nature子刊《自然·人类行为》的研究,针对AI心智理论进行了深入测试和比较。研究采用多项心理测试,发现GPT-4在大部分测试项目上的表现明显优于人类,尤...

面壁智能低调开源大模型“理科状元”!LeetCode 周赛超越80%人类选手,推理性能超 Llama3-70B

面壁智能近期低调开源了一个名为Eurux-8x22B的大模型,该模型在复杂推理综合性能方面超越了Llama3-70B,成为新的开源大模型SOTA(State of the Art),并被誉...
1 2 3 4 5