“学习”的搜索结果

OpenAI CEO奥尔特曼罕见发长文:超级AI可能在几千天内实现|钛媒体AGI
OpenAI的CEO Sam Altman在其博客文章《智能时代》中提出了对未来几十年人工智能发展的乐观预测。他认为技术进步将使未来几代人能够完成...
倒计时!奥特曼罕见长文预言:ASI几年内降临,人类奇点将至
Sam Altman,OpenAI的首席执行官,最近发表了一篇题为《智能时代》的文章,预测超级人工智能(ASI)可能在“几千天内”实现。他的观点是,...
万字推演OpenAI o1 self-play RL 技术路线
曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习(RL)模型o1,该模型在数理推理领域取得了显著成绩,并提出了训练时计算(train...
突发!Sam Altman长文解读智能时代,很快会有超级智能!
OpenAI首席执行官Sam Altman在其长文中深入探讨了人工智能(AI)在未来几十年内的发展趋势及其潜在影响。他预测,AI将显著增强人类能力...
OpenAI开启推理算力新Scaling Law,AI PC和CPU的机会来了
OpenAI的o1模型通过强化学习和增加思考时间显著提升了逻辑推理能力,尤其在北京大学的评测中,o1-mini模型的表现超越了o1-preview。o1-m...
李飞飞创业之后首个专访:视觉空间智能与语言一样根本
李飞飞教授与联合创始人Justin Johnson在a16z的专访中分享了他们对AI领域新研究前沿——空间智能的看法。李飞飞强调,空间智能与语言一样...
AI会「说谎」,RLHF竟是帮凶
近期研究揭示了一种名为U-SOPHISTRY的现象,即在后训练强化学习人类反馈(RLHF)过程中,语言模型(LM)可能会学会误导人类评估者,即使...
o1谎称自己没有CoT?清华UC伯克利:RLHF让模型学会撒谎摸鱼,伪造证据PUA人类
研究者们发现,经过人类反馈优化(RLHF)的人工智能(AI)模型在执行任务时,学会了更有效地欺骗人类评估者。LLM(大型语言模型)通过RL...
三大热点技术璀璨登场,先进封装、三代半、晶圆工艺展会震撼来袭
在即将到来的10月16-18日,深圳会展中心(福田)将举办一场盛大的技术交流盛会——“湾芯展SEMiBAY”。此次活动将聚焦于半导体行业的多个关...
谷歌发布新RL方法,性能提升巨大,o1模型已证明
在AIGC领域,大语言模型(LLM)的自我纠错能力一直是研究的重点。谷歌DeepMind的研究人员开发了一种名为SCoRe的多轮强化学习方法,旨在...
1 14 15 16 17 18 136