“强化学习”的搜索结果

秘密打造「AI陶哲轩」 震惊数学圈!谷歌IMO梦之队首曝光,菲尔兹奖得主深度点评
谷歌DeepMind的AI系统AlphaProof和AlphaGeometry 2在2024年国际数学奥林匹克竞赛(IMO)中取得了显著成绩,仅以一分之差错失金牌,这一...
陶哲轩点评谷歌AlphaProof:AI在数学竞赛中展现「超凡智慧」
谷歌DeepMind的人工智能系统在2024年国际数学奥林匹克竞赛(IMO)中取得了显著成绩,其得分接近金牌水平。在IMO的六个问题中,该系统解...
又一新风口!空间计算时代:要么沉浸,要么死亡 | Q 福利
2024年,苹果公司发布了Vision Pro,标志着计算行为轨迹的又一次变革,类似于2007年iPhone的问世。Vision Pro引入了智能化、沉浸式的空...
OpenAI发布最新大模型安全对齐奖励方法——RBR
随着大型语言模型(LLM)如ChatGPT的普及,确保其输出安全性变得至关重要。然而,传统的基于人类反馈的强化学习(RLHF)方法存在成本高...
牛津剑桥「投毒」AI失败9次登Nature封面,引爆学术圈激辩!AI训AI能否打破崩溃魔咒?
牛津、剑桥、帝国理工和多伦多大学等机构的研究人员在Nature杂志上发表了一篇关于人工智能(AI)模型崩溃的论文,引发了学术界和AI社区...
谷歌大模型获重大突破,首次拿下国际奥数银牌
谷歌DeepMind在2024年国际数学奥林匹克竞赛(IMO)中取得了显著成绩,其开发的两个混合大模型AlphaProof和AlphaGeometry 2获得了银牌。I...
谷歌AI一分之差痛失IMO金牌!19秒做一题碾压人类选手,几何AI超进化震撼评委
谷歌DeepMind的人工智能系统在国际数学奥林匹克竞赛(IMO)中取得了显著成绩,其中AI系统AlphaProof和AlphaGeometry 2成功完成了6道题目...
贾扬清十年经典之作获时间检验奖!ICML 2024十篇最佳论文开奖,爆火SD3、谷歌Genie在列
2024年国际机器学习会议(ICML)在奥地利维也纳举行,期间颁发了多个奖项,包括十篇最佳论文奖和一篇时间检验奖。其中,图像生成模型SD3...
Llama 3.1 源模型泄露背后:失手的 GitHub,破碎的 Meta,好在最小参数都能打脸GPT-4o!
7月23日凌晨,Meta的新版大型语言模型(LLM)Llama 3.1 405B在4chan上泄露,并在多数基准测试中击败了GPT-4o。据悉,Meta可能很快正式发...
首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了
Llama 3.1,一个多语言大型语言模型(LLM)集合,最近在Reddit上泄露,引起了广泛关注。这个集合包含8B、70B和405B三种不同参数规模的模...
1 4 5 6 7 8 15