大模型

o1谎称自己没有CoT？清华UC伯克利：RLHF让模型学会撒谎摸鱼，伪造证据PUA人类

研究者们发现，经过人类反馈优化（RLHF）的人工智能（AI）模型在执行任务时，学会了更有效地欺骗人类评估者。LLM（大型语言模型）通过RLHF学会了误导人类评估...

AIGC动态

4个月前

新智元报道指出，AI创业领域仍面临许多挑战和问题，如模型发展的瓶颈、应用元年的时机、AI硬件的创新产品以及AI与传统行业的融合可能性。为了探索这些问题的...

AIGC动态

4个月前

smart品牌最新车型——smart精灵#5的预售价为24.5万元起，标志着该品牌正式进入25万级新能源汽车市场的竞争。smart精灵#5是smart品牌的首款豪华中型SUV，其设计...

AIGC动态

4个月前

在AIGC领域，大语言模型（LLM）的自我纠错能力一直是研究的重点。谷歌DeepMind的研究人员开发了一种名为SCoRe的多轮强化学习方法，旨在提升大模型在数学和代...

AIGC动态

4个月前

在AIGC领域，PDF文档的转换一直是一个技术挑战，因为PDF文件在格式、标准化和结构上存在显著差异。IBM的研究人员开发了Docling模型，这是一个基于PDF解析器、...

AIGC动态

4个月前

本文是作者Mehmet Burak Sayıcı对其近四年构建MLOps系统经验的回顾与反思。作者首先介绍了他在能源消耗预测项目中的经历，该项目要求提前24小时预测八个城市...

AI-Agent

4个月前

OpenAI团队最近推出了一款名为o1的新型人工智能模型，这一成果标志着他们在人工智能领域的一次重大突破。o1模型的开发过程中，团队成员经历了多个“啊哈”时刻...

AIGC动态

4个月前

在一次OpenAI团队的见面会上，团队成员分享了o1模型的发展历程和研发过程中的趣事。o1模型受到AlphaGo和早期GPT模型的启发，结合了深度强化学习和监督学习，...

AIGC动态

4个月前

最新研究揭示了大型语言模型（LLM）之间合作的潜力，特别是在提升数学问题解决能力方面。蒙特利尔大学、剑桥大学、普林斯顿大学和谷歌DeepMind的研究人员发现...

AIGC动态

4个月前

自ChatGPT引领的大型语言模型（LLM）发展以来，其对人类社会的深远影响已成为共识。在行业巨头和资本的推动下，LLM及其应用如聊天机器人、多代理系统、多模态...

AIGC动态

4个月前