“强化学习”的搜索结果

ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景
天津大学深度强化学习实验室的研究团队推出了面向现实决策场景的 Uni-RLHF 平台,这是一个专为强化学习与人类反馈(RLHF)量身定制的综...
400米2分34秒破纪录!伯克利双足机器人「接管」人类
UC伯克利的双足机器人Cassie在HYBRID ROBOTICS研究团队的努力下,以惊人的速度跑完了400米,用时仅2分34秒,并且完成了1.4米的跳远。Cas...
像搭积木一样创作游戏场景!腾讯发布游戏 AI 引擎 GiiNEX
腾讯在2024年的全球游戏开发者大会(GDC)上发布了自研游戏AI引擎GiiNEX,该引擎基于生成式AI和决策AI技术,为游戏全生命周期提供丰富的...
腾讯发布自研游戏AI引擎:3D城市布局效率提升百倍,UGC工具已上线《元梦之星》
腾讯在游戏开发者大会(GDC)上发布了自研游戏AI引擎GiiNEX,该引擎基于生成式AI和决策AI技术,能够支持游戏从研发到运营的全生命周期需...
使用大模型进行股票预测,收益率16.6%,还会自我反思和给出合理解释
本文介绍了一种名为Summarize-Explain-Predict (SEP)的框架,该框架使用大型语言模型(LLMs)生成可解释的股票预测。SEP框架通过自我反...
AI大模型控制红绿灯,港科大(广州)智慧交通新成果已开源
香港科技大学(广州)的研究团队提出了一个名为LLMLight的框架,用于实现交通信号控制(TSC)。该框架结合了大模型的泛化能力和人类直觉...
总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述
机器之心编辑部撰写的这篇文章主要讨论了大语言模型(LLMs)的知识蒸馏技术及其在研究和工业界中的应用。文章首先指出,尽管闭源LLMs如G...
AI每日精选摘要
❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️ ◈ 09月29日 星...
首个AI程序员诞生!掌握全栈技能、已通过公司面试,华人创始团队已拿2100万融资
3月13日,由华人团队创立的Cognition Labs推出了AI软件工程师Devin,其在SWE-Bench基础测试中无需人类协助即可解决13.86%的问题,远超当...
1 10 11 12 13 14 15