标签:数学

Copilot上大分,仅数天,陶哲轩的估计验证工具卷到2.0!刚刚又发数学形式化证明视频

菲尔兹奖得主陶哲轩近期发布了一个开源项目,旨在通过大模型的协助开发一个概念验证软件工具,用于验证涉及任意正参数的给定估计是否成立。该项目最初的目标...

三位北大校友突破65年数学难题!证明126维空间“末日假说”,为母校126周年献贺

复旦大学林伟南、王国祯与UCLA的徐宙利合作,成功解决了126维空间的Kervaire不变量问题,这一成果标志着高维拓扑学中的一个核心难题取得了重大突破。Kervaire...

陶哲轩:感谢ChatGPT,4小时独立完成了一个开源项目

菲尔兹奖得主陶哲轩在五一假期期间发布了一个开源项目,该项目旨在通过大模型的协助,开发一个用于验证涉及任意正参数的估计是否成立的概念验证软件工具。这...

数学家们仍在追赶天才拉马努金

拉马努金,一位被数学界公认为神人的天才,尽管没有接受过正统的数学教育,却凭借惊人的数学直觉征服了数学大师G.H.哈代,并获得了剑桥大学三一学院的破例接...

刚刚,AI破解50年未解数学难题!南大校友用OpenAI模型完成首个非平凡数学证明

AI辅助人类完成了首个非平凡研究数学证明,破解了50年未解的数学难题。这项研究由美国纽约布鲁克海文国家实验室的华人学者Weiguo Yin主导,通过引入最大对称...

实测国内外大模型数学能力:YiXin-Distill-Qwen-72B登顶,半数大厂模型不及格?

最近,针对国内外7款大模型进行了一场数学能力测试,测试题目主要来自“阿里巴巴全球数学竞赛”和“中国数学奥林匹克(CMO)”的真题,涵盖了多个数学领域,包括...

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

大型语言模型(LLMs)在高等数学测试中表现出色,平均得分达到90.4分(按百分制计算),显示出其在数学问题求解中的强大能力。 研究通过32道测试题,涵盖向量...

阿里开源新模型:媲美DeepSeek-R1,参数大降20倍!

阿里巴巴近日开源了其最新的大模型QwQ-32B,该模型支持Apache 2.0开源协议,允许商业化使用。QwQ-32B在多个主流测试基准中表现优异,能够与DeepSeek的R1-671B...

阿里深夜开源推理模型QwQ-32B,性能比肩R1满血版。

阿里在凌晨发布了全新的推理模型QwQ-32B,这一模型在多个数据集上的表现令人震惊,尤其是在数学和代码领域,其性能甚至能与DeepSeek R1(671B)相媲美。QwQ-3...

讯飞星火X1单挑满血版DeepSeek-R1,全国产算力单机部署!中国AI再下一城

星火X1模型的全面升级标志着中国AI技术的显著进步,尤其在数学领域表现突出。该模型以70B参数规模追平了OpenAI o1和DeepSeek-R1,并在竞赛级难题和中小学实用...
1 2