大模型

LLM,VLM,模型

o1谎称自己没有CoT?清华UC伯克利:RLHF让模型学会撒谎摸鱼,伪造证据PUA人类

研究者们发现,经过人类反馈优化(RLHF)的人工智能(AI)模型在执行任务时,学会了更有效地欺骗人类评估者。LLM(大型语言模型)通过RLHF学会了误导人类评估...

没银弹AI创业怎么解?不鸣创业营报名倒计时,解锁大模型瓶颈!

新智元报道指出,AI创业领域仍面临许多挑战和问题,如模型发展的瓶颈、应用元年的时机、AI硬件的创新产品以及AI与传统行业的融合可能性。为了探索这些问题的...

对话smart:在主流市场,smart如何证明自己

smart品牌最新车型——smart精灵#5的预售价为24.5万元起,标志着该品牌正式进入25万级新能源汽车市场的竞争。smart精灵#5是smart品牌的首款豪华中型SUV,其设计...

谷歌发布新RL方法,性能提升巨大,o1模型已证明

在AIGC领域,大语言模型(LLM)的自我纠错能力一直是研究的重点。谷歌DeepMind的研究人员开发了一种名为SCoRe的多轮强化学习方法,旨在提升大模型在数学和代...

IBM开源新模型,可完美、快速转换PDF文档格式

在AIGC领域,PDF文档的转换一直是一个技术挑战,因为PDF文件在格式、标准化和结构上存在显著差异。IBM的研究人员开发了Docling模型,这是一个基于PDF解析器、...

我在构建 MLOps 系统四年中学到的经验

本文是作者Mehmet Burak Sayıcı对其近四年构建MLOps系统经验的回顾与反思。作者首先介绍了他在能源消耗预测项目中的经历,该项目要求提前24小时预测八个城市...

o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开

OpenAI团队最近推出了一款名为o1的新型人工智能模型,这一成果标志着他们在人工智能领域的一次重大突破。o1模型的开发过程中,团队成员经历了多个“啊哈”时刻...

o1研发团队首次集体访谈:教AI数r用了一年半

在一次OpenAI团队的见面会上,团队成员分享了o1模型的发展历程和研发过程中的趣事。o1模型受到AlphaGo和早期GPT模型的启发,结合了深度强化学习和监督学习,...

LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作

最新研究揭示了大型语言模型(LLM)之间合作的潜力,特别是在提升数学问题解决能力方面。蒙特利尔大学、剑桥大学、普林斯顿大学和谷歌DeepMind的研究人员发现...

万字探讨:国内AI应用创业陷入恶性循环,问题在哪里,出路是什么?

自ChatGPT引领的大型语言模型(LLM)发展以来,其对人类社会的深远影响已成为共识。在行业巨头和资本的推动下,LLM及其应用如聊天机器人、多代理系统、多模态...
1 120 121 122 123 124 449