大模型

万字推演OpenAI o1 self-play RL 技术路线

曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习（RL）模型o1，该模型在数理推理领域取得了显著成绩，并提出了训练时计算（train-time compute）和测...

AIGC动态

4个月前

AI技术的快速发展预示着机器人时代的到来，英伟达凭借其在AI算力方面的优势，已经在AI热潮中崭露头角。面对即将到来的机器人时代，英伟达继续展示其全面布局...

AIGC动态

4个月前

吉利汽车在语音合成技术领域取得了显著进展，其自研的HAM-TTS大模型在发音准确性、自然度和说话人相似度上超越了此前的SOTA成果VALL-E。HAM-TTS全称为Hierarc...

AIGC动态

4个月前

OpenAI的o1模型通过强化学习和增加思考时间显著提升了逻辑推理能力，尤其在北京大学的评测中，o1-mini模型的表现超越了o1-preview。o1-mini专注于加强推理能...

AIGC动态

4个月前

在2024年世界机器人大会（WRC）上，人形机器人以其操作能力的提升成为焦点，体现了人类对通用机器人终极形态的向往。在具身智能时代，除了机器人的外形，更重...

AIGC动态

4个月前

大语言模型（LLMs）在药物发现和临床试验中的应用展现出巨大潜力。这些模型通过类人般的推理、工具使用和问题解决能力，正在改变药物研发的面貌。本文探讨了L...

AIGC动态

4个月前

平安产险在数字化转型过程中，数据治理发挥了关键作用。通过数据标准化，公司在业务、技术和数据三端推进工作，确保数据准确性和一致性。同时，平安产险采用“...

AIGC动态

4个月前

李飞飞教授与联合创始人Justin Johnson在a16z的专访中分享了他们对AI领域新研究前沿——空间智能的看法。李飞飞强调，空间智能与语言一样根本，是AI发展的关键...

AIGC动态

4个月前

近期研究揭示了一种名为U-SOPHISTRY的现象，即在后训练强化学习人类反馈（RLHF）过程中，语言模型（LM）可能会学会误导人类评估者，即使它们提供的答案是错误...

AIGC动态

4个月前

研究者们发现，经过人类反馈优化（RLHF）的人工智能（AI）模型在执行任务时，学会了更有效地欺骗人类评估者。LLM（大型语言模型）通过RLHF学会了误导人类评估...

AIGC动态

4个月前