“强化学习”的搜索结果

何恺明新作再战AI生成:入职MIT后首次带队,奥赛双料金牌得主邓明扬参与
何恺明在加入麻省理工学院(MIT)担任副教授后,首次独立带队完成了一项新的研究工作,提出了一种新的图像生成方法。该方法通过让自回归...
从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」
在人工智能领域,大语言模型(LLM)的控制与指导是核心挑战之一。早期,人类反馈的强化学习方法(RLHF)被用来管理这些模型,取得了显著...
抢疯了,腾讯给大模型人才,定了一个前所未有的标准
在21世纪,人才的重要性愈发凸显,特别是在人工智能领域。科技公司如OpenAI之所以能够取得成功,除了技术的不断探索和资金的持续注入,...
英伟达和IBM搞事情!主攻“量子计算+AI”
Ismael Faro,自2015年起成为IBM量子软件生态系统开发的关键人物,目前担任量子服务和数据部门副总裁,致力于利用AI优化量子软件堆栈。...
宇树科技王兴兴:与其完善多模态大模型,不如探索开发全新模型
2024年被广泛认为是人形机器人技术发展的重要年份,具身智能论坛在2024智源大会上成为焦点,吸引了众多关注。宇树科技的创始人兼CEO王兴...
英伟达开源合成数据大模型:奖励模型,超过GPT-4 Turbo
全球人工智能领导者英伟达(Nvidia)于6月15日在其官网开源了一款名为Nemotron-4 340B的大模型,专为生成合成数据而设计。该模型能够快...
Anthropic公开Claude 3,像人类一样特殊性格训练方法
Anthropic在其最新大模型Claude 3中引入了一种个性化性格训练方法。该方法名为“Constitutional AI: Harmlessness from AI Feedback”,其...
英伟达 Jim Fan:具身智能的难点不是硬件,而是「Foundation Agent」
本文介绍了一种称为“具身智能”的人工智能技术,它旨在将虚拟世界的成果转移到现实世界中。具身智能的研究包括以下几个方面:1. Minecraf...
不想炸薯条的Ilya和不送GPU的英伟达,Hinton最新专访:道路千万条,安全第一条
这篇采访文章详细总结了人工智能之父Hinton的心路历程和思考。主要内容包括:1. Hinton曾学习生理学和哲学,希望弄清人脑工作原理,但未...
罕见同台:xAI、Llama 3和Mistral的核心科学家对谈,详解三家最强模型背后的一切
这篇文章讨论了生成式人工智能在硅谷的发展现状和展望,重点围绕了xAI、Llama和Mistral AI等公司的最新动态展开。文章总结了几个关键点...
1 6 7 8 9 10 15