“强化学习”的搜索结果

最强智能体Agent Q发布!Llama 3成功率飙升3倍,OpenAI神秘「草莓」遭截胡?
MultiOn初创公司近期发布了一款名为Agent Q的智能体框架,宣称其在真实预订任务中的成功率达到了95.4%,引起了业界的广泛关注。该公司CE...
首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人
史上首位“AI科学家”由Sakana AI公司推出,该公司由Transformer论文作者之一Llion Jones创立。AI科学家能够独立完成从提出研究想法到论文...
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
近期,人工智能领域对于“从人类反馈中进行强化学习”(RLHF)是否属于真正的强化学习(RL)展开了激烈的讨论。这场讨论始于Andrej Karpat...
“Alpha 乒乓”来了!学了 1.4 万个对拉球,谷歌乒乓机器人球技横扫大部分选手!网友:4 年后代表美国打奥运
2024年巴黎奥运会上,中国乒乓球队再次展现了其卓越的实力,男团和女团均成功晋级决赛。与此同时,DeepMind的研究人员开发出了一款名为“...
阿里开源新模型:超GPT-4o,数学能力全球第一!
阿里巴巴集团开源了一款名为Qwen2-Math的最新数学模型,该模型包含1.5B、7B和72B三种参数规模的版本,旨在推动AIGC领域的专业社区发展。...
OpenAI高层巨变:联创辞职总裁休假,网友:领导层成了空壳
OpenAI近期经历了重大的高层变动,其中包括联合创始人John Schulman的离职,他曾是强化学习团队的领导者,并被誉为“ChatGPT架构师”。Sch...
AI顶会ICML收了一篇论文:没算法没实验
2024年国际机器学习会议(ICML)的Spotlight环节中,一篇名为“词的万能逼近:从语言角度看映射组合”的纯理论论文脱颖而出,成为唯一一篇...
鹅厂机器狗登Nature子刊封面:动作敏捷如真狗,能玩定向越野
腾讯的机器狗MAX登上了《Nature》子刊封面,展示了其在定向越野游戏中的卓越表现。MAX通过模仿真实动物的运动、感知和策略,实现了对真...
深度解码:AI 大模型的繁荣与困境 | Q福利
人工智能(AI)大模型的发展在数字化时代中突飞猛进,成为技术进步的重要推动力。AI大模型以其庞大的参数量和卓越的性能,在自然语言处...
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替,Siri华丽变身
苹果公司的最新版iOS 18.1 Beta已经上线,为注册开发者带来了Apple Intelligence的初步体验。这一更新的核心是Siri的全面升级,现在变身...
1 3 4 5 6 7 15