大模型

LLM,VLM,模型

万字推演OpenAI o1 self-play RL 技术路线

曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习(RL)模型o1,该模型在数理推理领域取得了显著成绩,并提出了训练时计算(train-time compute)和测...

对话地瓜机器人 CEO 王丛:500 元的机器人「心脏」,是怎么炼成的?

AI技术的快速发展预示着机器人时代的到来,英伟达凭借其在AI算力方面的优势,已经在AI热潮中崭露头角。面对即将到来的机器人时代,英伟达继续展示其全面布局...

车圈最大AI「黑马」吉利:自研语音大模型登顶,性能超SOTA 10%

吉利汽车在语音合成技术领域取得了显著进展,其自研的HAM-TTS大模型在发音准确性、自然度和说话人相似度上超越了此前的SOTA成果VALL-E。HAM-TTS全称为Hierarc...

OpenAI开启推理算力新Scaling Law,AI PC和CPU的机会来了

OpenAI的o1模型通过强化学习和增加思考时间显著提升了逻辑推理能力,尤其在北京大学的评测中,o1-mini模型的表现超越了o1-preview。o1-mini专注于加强推理能...

下注端到端:一场具身智能的谨慎豪赌

在2024年世界机器人大会(WRC)上,人形机器人以其操作能力的提升成为焦点,体现了人类对通用机器人终极形态的向往。在具身智能时代,除了机器人的外形,更重...

大语言模型如何助力药物开发? 哈佛 George Church Lab 最新综述

大语言模型(LLMs)在药物发现和临床试验中的应用展现出巨大潜力。这些模型通过类人般的推理、工具使用和问题解决能力,正在改变药物研发的面貌。本文探讨了L...

数据治理如何转化为业务价值?平安产险的探索与实践解析

平安产险在数字化转型过程中,数据治理发挥了关键作用。通过数据标准化,公司在业务、技术和数据三端推进工作,确保数据准确性和一致性。同时,平安产险采用“...

李飞飞创业之后首个专访:视觉空间智能与语言一样根本

李飞飞教授与联合创始人Justin Johnson在a16z的专访中分享了他们对AI领域新研究前沿——空间智能的看法。李飞飞强调,空间智能与语言一样根本,是AI发展的关键...

AI会「说谎」,RLHF竟是帮凶

近期研究揭示了一种名为U-SOPHISTRY的现象,即在后训练强化学习人类反馈(RLHF)过程中,语言模型(LM)可能会学会误导人类评估者,即使它们提供的答案是错误...

o1谎称自己没有CoT?清华UC伯克利:RLHF让模型学会撒谎摸鱼,伪造证据PUA人类

研究者们发现,经过人类反馈优化(RLHF)的人工智能(AI)模型在执行任务时,学会了更有效地欺骗人类评估者。LLM(大型语言模型)通过RLHF学会了误导人类评估...
1 119 120 121 122 123 449