大语言模型 | 第 2 页

AI圈纷纷传阅，Andrej Karpathy 的最新演讲全文来了

Andrej Karpathy在首届YC AI创业学校的演讲中，深入探讨了人工智能时代软件的变革及其对未来编程范式的影响。他提出，软件正在经历第三次革命，即“软件3.0”，...

AIGC动态

3个月前

一次集成，减少 80% 适配工作！从 0 到 1 开发一款 MCP Server 难不难？

Base44的8000万美元收购案例展现了小型技术团队在AI领域的巨大潜力，仅用8名员工和180天就完成了从开发到退出的全过程。这一成功案例打破了硅谷传统创业模式...

AIGC动态

3个月前

TTS和TTT已过时？TTRL横空出世，推理模型摆脱「标注数据」依赖，性能暴涨

在大语言模型（LLMs）竞争日益激烈的背景下，推理能力成为评估模型性能的关键指标。测试时缩放（TTS）作为一种新兴策略，通过优化推理过程（如多数投票、蒙特...

AIGC动态

5个月前

DeepSeek之后，每一家公司都是Agent

以DeepSeek-R1为代表的大型语言模型，在推理方面展现了巨大的进步，这种进步对企业和个人而言是一个重要的发展机遇。尽管这些模型功能强大，但也存在一定的问...

AI-Agent

5个月前

Sam Altman：用户要求，永远别更新GPT-4.5

OpenAI最新发布的GPT-4.5模型在用户群体中引发强烈反响，其核心突破点聚焦于情感智能与自然对话能力的显著提升。该模型首次出现用户主动要求承诺永久保留特定...

AIGC动态

6个月前

大语言模型系统评估新框架：微观指标构建方法论

大语言模型（LLM）的系统化评估面临独特挑战，需通过微观指标体系的构建实现持续优化。将LLM视为系统组件而非独立存在，其性能需结合实时监控、防护机制与业...

AIGC动态

7个月前

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

Scale AI、Center for AI Safety与MIT研究者联合推出的ENIGMAEVAL基准，通过1184道源自解谜寻宝竞赛的复杂题目，系统评估大语言模型的多模态推理能力。该基准...

AIGC动态

7个月前

赶紧放弃强化学习？！Meta 首席 AI 科学家杨立昆喊话：当前推理方式会“作弊”，卷大模型没有意义！

Meta首席AI科学家杨立昆在AI Action Summit 2025的演讲中指出，当前基于大语言模型的人工智能系统存在根本性缺陷。现有模型通过自回归生成token的暴力计算范...

AIGC动态

7个月前

DeepSeek R1遇难题142次”I give up”，研究还称需增加推理时机控制机制

最新研究利用NPR周日谜题挑战构建的新型基准测试，揭示了当前大语言模型在语言推理任务中的独特表现与局限。该数据集包含近600个涉及字母重组、单词变换等类...

AIGC动态

7个月前

招生信息丨香港大学建筑学院招收「大模型 BIM 应用」博士后/RA

马骏博士及其团队专注于智能建造和智慧城市领域的前沿研究，致力于将人工智能与建筑信息模型（BIM）结合，推动行业技术创新。此次招聘的重点在于探索大语言模...

AIGC动态

7个月前

标签：大语言模型

AI圈纷纷传阅，Andrej Karpathy 的最新演讲全文来了

一次集成，减少 80% 适配工作！从 0 到 1 开发一款 MCP Server 难不难？

TTS和TTT已过时？TTRL横空出世，推理模型摆脱「标注数据」依赖，性能暴涨

DeepSeek之后，每一家公司都是Agent

Sam Altman：用户要求，永远别更新GPT-4.5

大语言模型系统评估新框架：微观指标构建方法论

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

赶紧放弃强化学习？！Meta 首席 AI 科学家杨立昆喊话：当前推理方式会“作弊”，卷大模型没有意义！

DeepSeek R1遇难题142次”I give up”，研究还称需增加推理时机控制机制

招生信息丨香港大学建筑学院招收「大模型 BIM 应用」博士后/RA

热门网址

标签：大语言模型

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址