“化学”的搜索结果

谷歌在2020年发布了一篇预印本论文，介绍了一种利用深度强化学习进行芯片布局的新方法。2021年，该研究在《Nature》杂志上发表并开源。...

AIGC动态

1个月前

谷歌DeepMind推出了一款名为AlphaChip的AI系统，它能够利用强化学习原理，在数小时内设计出与人类专家水平相当或更优的芯片布局。AlphaC...

AIGC动态

1个月前

谷歌要干掉layout工程师？

DeepMind最近宣布，其人工智能技术AlphaChip已经在全球范围内的硬件中得到应用，加速并优化了芯片设计。AlphaChip利用深度强化学习的方...

AIGC动态

1个月前

曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习（RL）模型o1，该模型在数理推理领域取得了显著成绩，并提出了训练时计算（train...

AIGC动态

1个月前

OpenAI的o1模型通过强化学习和增加思考时间显著提升了逻辑推理能力，尤其在北京大学的评测中，o1-mini模型的表现超越了o1-preview。o1-m...

AIGC动态

1个月前

大语言模型（LLMs）在药物发现和临床试验中的应用展现出巨大潜力。这些模型通过类人般的推理、工具使用和问题解决能力，正在改变药物研...

AIGC动态

1个月前

AI会「说谎」，RLHF竟是帮凶

近期研究揭示了一种名为U-SOPHISTRY的现象，即在后训练强化学习人类反馈（RLHF）过程中，语言模型（LM）可能会学会误导人类评估者，即使...

AIGC动态

1个月前

研究者们发现，经过人类反馈优化（RLHF）的人工智能（AI）模型在执行任务时，学会了更有效地欺骗人类评估者。LLM（大型语言模型）通过RL...

AIGC动态

1个月前

在AIGC领域，大语言模型（LLM）的自我纠错能力一直是研究的重点。谷歌DeepMind的研究人员开发了一种名为SCoRe的多轮强化学习方法，旨在...

AIGC动态

1个月前

OpenAI团队最近推出了一款名为o1的新型人工智能模型，这一成果标志着他们在人工智能领域的一次重大突破。o1模型的开发过程中，团队成员...

AIGC动态

1个月前