逻辑推理 | 学习AIGC

征稿启事 | AAAI 2026“大语言模型中的深度逻辑推理”联合会议

AAAI 2026联合会议聚焦大语言模型中的深度逻辑推理问题。作为人工智能领域的顶级学术会议，第40届AAAI大会将于2026年1月在新加坡举行，其中为期两天的联合会...

AIGC动态

2个月前

实测美团 LongCat：快到极致，但是别说追平 DeepSeek

近期美团的 LongCat-Flash-Chat 模型频频刷屏，有说法称其已追平 DeepSeek-V3.1。AI 科技评论实测后发现，两款模型风格差异明显，也引出了模型在真实应用中速...

AIGC动态

3个月前

全球顶尖AI来考公，不会推理全翻车！致命缺陷曝光，被倒数5%人类碾压

卡内基梅隆大学（CMU）的研究团队针对公务员考试中的逻辑推理题，设计了一套名为VisualPuzzles的视觉推理基准测试，旨在评估多模态大模型的推理能力。该测试...

AIGC动态

8个月前

一手实测文心X1/4.5：又强又全面！歪果网友疯求英文版

百度在文心一言两周年之际，推出了两款新模型——文心大模型4.5和文心大模型X1，并宣布免费向用户开放。这一消息迅速在海外社交媒体上引发热议，尤其是关于是否...

AIGC动态

9个月前

实测Claude 3.7：3200行代码一口气输出，物理规律手拿把掐，弱智吧已失守

Claude 3.7 Sonnet的最新发布引发广泛关注，其核心突破集中在编程能力与复杂任务处理效率的显著提升。测试显示，该模型仅需单个样本即可生成超过3200行代码，...

AIGC动态

10个月前

LLM推理暴涨，数学逻辑开挂！ DeepSeek等华人团队新大招，Ai2大牛狂点赞

DeepSeek团队提出的CODEI/O方法通过代码输入/输出预测任务，显著提升了大型语言模型在多种推理任务中的表现。该方法将原始代码文件转换为可执行函数，并构建...

AIGC动态

10个月前

DeepSeek登顶中美App Store，精妙的深度思考+联网模式让用户“沦陷”了

自2025年1月20日发布以来，DeepSeek R1在全球AI领域引起了巨大轰动。这款AI产品不仅在社交媒体上引发广泛讨论，甚至被硅谷程序员视为学习对象，其影响力可见...

AIGC动态

11个月前

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

近期，昆仑万维推出了国内首款具备中文逻辑推理能力的大模型——天工大模型4.0 o1版（Skywork o1），标志着公司在大模型及相关应用领域的又一重大进展。Skywork...

AIGC动态

1年前 (2024)

陶哲轩联手60多位数学家出题，世界顶尖模型通过率仅2%！专家级数学基准，让AI再苦战数年

Epoch AI联合六十余位全球数学家推出了全新的数学基准FrontierMath，旨在评估AI系统的高级推理能力。该基准包含数百个原创且极具挑战性的数学问题，覆盖从奥...

AIGC动态

1年前 (2024)

OpenAI开启推理算力新Scaling Law，AI PC和CPU的机会来了

OpenAI的o1模型通过强化学习和增加思考时间显著提升了逻辑推理能力，尤其在北京大学的评测中，o1-mini模型的表现超越了o1-preview。o1-mini专注于加强推理能...

AIGC动态

1年前 (2024)

标签：逻辑推理

征稿启事 | AAAI 2026“大语言模型中的深度逻辑推理”联合会议

实测美团 LongCat：快到极致，但是别说追平 DeepSeek

全球顶尖AI来考公，不会推理全翻车！致命缺陷曝光，被倒数5%人类碾压

一手实测文心X1/4.5：又强又全面！歪果网友疯求英文版

实测Claude 3.7：3200行代码一口气输出，物理规律手拿把掐，弱智吧已失守

LLM推理暴涨，数学逻辑开挂！ DeepSeek等华人团队新大招，Ai2大牛狂点赞

DeepSeek登顶中美App Store，精妙的深度思考+联网模式让用户“沦陷”了

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

陶哲轩联手60多位数学家出题，世界顶尖模型通过率仅2%！专家级数学基准，让AI再苦战数年

OpenAI开启推理算力新Scaling Law，AI PC和CPU的机会来了

热门网址

标签：逻辑推理

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址