“强化学习”的搜索结果

谷歌DeepMind的AI系统AlphaProof和AlphaGeometry 2在2024年国际数学奥林匹克竞赛（IMO）中取得了显著成绩，仅以一分之差错失金牌，这一...

AIGC动态

2个月前

谷歌DeepMind的人工智能系统在2024年国际数学奥林匹克竞赛（IMO）中取得了显著成绩，其得分接近金牌水平。在IMO的六个问题中，该系统解...

AIGC动态

2个月前

2024年，苹果公司发布了Vision Pro，标志着计算行为轨迹的又一次变革，类似于2007年iPhone的问世。Vision Pro引入了智能化、沉浸式的空...

AIGC动态

2个月前

随着大型语言模型（LLM）如ChatGPT的普及，确保其输出安全性变得至关重要。然而，传统的基于人类反馈的强化学习（RLHF）方法存在成本高...

AIGC动态

2个月前

牛津、剑桥、帝国理工和多伦多大学等机构的研究人员在Nature杂志上发表了一篇关于人工智能（AI）模型崩溃的论文，引发了学术界和AI社区...

AIGC动态

2个月前

谷歌DeepMind在2024年国际数学奥林匹克竞赛（IMO）中取得了显著成绩，其开发的两个混合大模型AlphaProof和AlphaGeometry 2获得了银牌。I...

AIGC动态

2个月前

谷歌DeepMind的人工智能系统在国际数学奥林匹克竞赛（IMO）中取得了显著成绩，其中AI系统AlphaProof和AlphaGeometry 2成功完成了6道题目...

AIGC动态

2个月前

2024年国际机器学习会议（ICML）在奥地利维也纳举行，期间颁发了多个奖项，包括十篇最佳论文奖和一篇时间检验奖。其中，图像生成模型SD3...

AIGC动态

2个月前

7月23日凌晨，Meta的新版大型语言模型（LLM）Llama 3.1 405B在4chan上泄露，并在多数基准测试中击败了GPT-4o。据悉，Meta可能很快正式发...

AIGC动态

2个月前

Llama 3.1，一个多语言大型语言模型（LLM）集合，最近在Reddit上泄露，引起了广泛关注。这个集合包含8B、70B和405B三种不同参数规模的模...

AIGC动态

2个月前