标签:数学

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

大型语言模型(LLMs)在高等数学测试中表现出色,平均得分达到90.4分(按百分制计算),显示出其在数学问题求解中的强大能力。 研究通过32道测试题,涵盖向量...

阿里开源新模型:媲美DeepSeek-R1,参数大降20倍!

阿里巴巴近日开源了其最新的大模型QwQ-32B,该模型支持Apache 2.0开源协议,允许商业化使用。QwQ-32B在多个主流测试基准中表现优异,能够与DeepSeek的R1-671B...

阿里深夜开源推理模型QwQ-32B,性能比肩R1满血版。

阿里在凌晨发布了全新的推理模型QwQ-32B,这一模型在多个数据集上的表现令人震惊,尤其是在数学和代码领域,其性能甚至能与DeepSeek R1(671B)相媲美。QwQ-3...

讯飞星火X1单挑满血版DeepSeek-R1,全国产算力单机部署!中国AI再下一城

星火X1模型的全面升级标志着中国AI技术的显著进步,尤其在数学领域表现突出。该模型以70B参数规模追平了OpenAI o1和DeepSeek-R1,并在竞赛级难题和中小学实用...

清华北航博士生「强迫」Gemma-2说中文!弱智吧、角色扮演、数学问题表现惊喜

谷歌最新发布的Gemma 2模型在中文处理能力上存在不足,但清华大学和北航的两名博士生迅速推出了针对该模型的指令微调版本,显著提升了其在中文通用对话、角色...

深度思辨:高纬度剖析阿里数学竞赛姜萍事件的是是非非

姜萍事件引发了广泛的讨论,主要围绕教育、选拔和用人体系是否存在系统性埋没人才的问题。事件中的质疑者认为姜萍的数学成绩和能力存在疑点,提出了四种主要...

阿里数赛首次向AI开放!知乎网友:给AI捏了把汗,该防止人类替考

阿里全球数学竞赛2024年开启报名,首次向AI开放,最高奖金可达1万美元。网友热烈参与,有人表示双厨狂喜,有人担心AI解答证明题的准确性。竞赛题目涉及一个抽...

40%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果

摘要:克雷西报道了由DeepMind联合创始人Mustafa Suleyman领导的大模型初创公司Inflection-2.5推出的新产品Pi,以及该公司背后的故事。Inflection-2.5是一款...

陶哲轩:AI让业余数学家也能做出贡献

在Quantamagazine的访谈中,著名数学家陶哲轩分享了他对数学、AI以及技术工具的看法。他认为AI将对数学产生深远影响,特别是在证明生成和数学研究的协作方面...

2024斯隆研究员揭榜!29位华人科学家当选占比超1/5,获75000美元科研奖金

2024年斯隆研究员名单揭晓,华人学者29人入选斯隆研究奖(Sloan Research Fellowships)每年颁发一次,旨在表彰美国和加拿大的研究人员,特别是那些在创造力...