标签:大语言模型

万字推演OpenAI o1 self-play RL 技术路线

曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习(RL)模型o1,该模型在数理推理领域取得了显著成绩,并提出了训练时计算(train-time compute)和测...

大语言模型如何助力药物开发? 哈佛 George Church Lab 最新综述

大语言模型(LLMs)在药物发现和临床试验中的应用展现出巨大潜力。这些模型通过类人般的推理、工具使用和问题解决能力,正在改变药物研发的面貌。本文探讨了L...

提升100倍!OpenAI考虑订阅价格为2000美元每月

OpenAI正在讨论推出两款新型大语言模型(LLM)——“草莓”和“猎户座”,并计划将订阅费用定为每月2000美元,这一价格远高于当前ChatGPT Plus的20美元月费,甚至年...

Agent Q:具备自我学习、评估的智能体

在人工智能领域,尤其是大语言模型(LLM)的发展和应用落地方面,一个重要的进步是AGI平台MultiOn和斯坦福研究人员联合开发的智能体Agent Q。Agent Q在自然语...

突发!OpenAI展示草莓,很快发布“GPT-5”猎户座!

OpenAI近期展示了其秘密项目“草莓”和“猎户座”,这两个项目均聚焦于大语言模型(LLM)的发展。草莓项目旨在解决复杂推理任务,特别是在数学和编程领域,同时增...

每天免费100万token,GPT-4o新增微调功能

AIGC领域的专业社区专注于大语言模型(LLM)的发展与应用,特别关注微软、OpenAI、百度文心一言、讯飞星火等公司的产品。OpenAI推出了GPT-4o数据微调功能,允...

上海交大林云:揭秘大模型的可解释性与透明度,AI 编程的未来在这里!

林云教授在AICon上海站的会前采访中深入探讨了大语言模型在软件开发中的应用及其带来的变革。他指出,大语言模型通过压缩和编码大量编程知识,有效弥补了专有...

ICML 2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类的2级推理

AIxiv专栏是一个由机器之心发布的学术和技术内容平台,近年来已经报道了2000多篇全球顶级高校和企业实验室的研究成果,促进了学术交流。近期,Meta FAIR、CMU...

OpenAI掀桌子!免费提供GPT-4o mini微调,每天200万tokens

AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。OpenAI宣布在特定时间内为4级、5级用户提供GPT-4o min...

谷歌、Anthropic推出创新神经压缩Equal-Info Windows

谷歌DeepMind和Anthropic的研究人员共同开发了一种名为Equal-Info Windows的创新神经压缩方法,旨在解决大语言模型(LLM)训练成本高昂的问题。随着LLM如Chat...
1 2 3 8