“化学”的搜索结果

Layout工程师危,谷歌自动芯片设计AlphaChip问世,开放权重可外部定制
谷歌在2020年发布了一篇预印本论文,介绍了一种利用深度强化学习进行芯片布局的新方法。2021年,该研究在《Nature》杂志上发表并开源。...
AI几小时设计芯片超越人类!谷歌AlphaChip登Nature,已设计出三代旗舰TPU
谷歌DeepMind推出了一款名为AlphaChip的AI系统,它能够利用强化学习原理,在数小时内设计出与人类专家水平相当或更优的芯片布局。AlphaC...
谷歌要干掉layout工程师?
DeepMind最近宣布,其人工智能技术AlphaChip已经在全球范围内的硬件中得到应用,加速并优化了芯片设计。AlphaChip利用深度强化学习的方...
万字推演OpenAI o1 self-play RL 技术路线
曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习(RL)模型o1,该模型在数理推理领域取得了显著成绩,并提出了训练时计算(train...
OpenAI开启推理算力新Scaling Law,AI PC和CPU的机会来了
OpenAI的o1模型通过强化学习和增加思考时间显著提升了逻辑推理能力,尤其在北京大学的评测中,o1-mini模型的表现超越了o1-preview。o1-m...
大语言模型如何助力药物开发? 哈佛 George Church Lab 最新综述
大语言模型(LLMs)在药物发现和临床试验中的应用展现出巨大潜力。这些模型通过类人般的推理、工具使用和问题解决能力,正在改变药物研...
AI会「说谎」,RLHF竟是帮凶
近期研究揭示了一种名为U-SOPHISTRY的现象,即在后训练强化学习人类反馈(RLHF)过程中,语言模型(LM)可能会学会误导人类评估者,即使...
o1谎称自己没有CoT?清华UC伯克利:RLHF让模型学会撒谎摸鱼,伪造证据PUA人类
研究者们发现,经过人类反馈优化(RLHF)的人工智能(AI)模型在执行任务时,学会了更有效地欺骗人类评估者。LLM(大型语言模型)通过RL...
谷歌发布新RL方法,性能提升巨大,o1模型已证明
在AIGC领域,大语言模型(LLM)的自我纠错能力一直是研究的重点。谷歌DeepMind的研究人员开发了一种名为SCoRe的多轮强化学习方法,旨在...
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
OpenAI团队最近推出了一款名为o1的新型人工智能模型,这一成果标志着他们在人工智能领域的一次重大突破。o1模型的开发过程中,团队成员...
1 3 4 5 6 7 24