推理能力 | 第 4 页

Ilya Sutskever 在 NeurIPS 2024 的演讲：预训练时代已经结束了

在NeurIPS 2024会议上，Safe SuperIntelligence实验室创始人、原OpenAI联合创始人兼首席科学家Ilya Sutskever发表了题为《Sequence to sequence learning wit...

AI-Agent

8个月前

田渊栋团队论文火了！连续思维链优于CoT，打开LLM推理新范式

在认知科学领域，关于语言是否用于思考或交流的辩论一直存在。随着大型语言模型（LLM）和思维链（Chain of Thought, CoT）的兴起，语言已成为机器推理的默认...

AIGC动态

8个月前

很快OpenAI能证明陶哲轩错了？陶哲轩一句话，被OpenAI高管怼回去

OpenAI的最新o1模型在数学和代码能力上取得了显著提升，其中数学性能提升了36%。菲尔兹奖得主陶哲轩在与OpenAI研究高级副总Mark Chen的访谈中，讨论了o1推理...

AIGC动态

8个月前

OpenAI狂飙突进！仅12个例子就能打造专属AI专家，核心技术竟来自字节？

OpenAI在其“12天”活动的第二天发布了强化微调（Reinforcement Fine-Tuning）技术，并展示了ChatGPT Pro。这项技术允许企业用户通过极少的数据定制o1 mini模型...

AIGC动态

8个月前

第一个国产中文o1来了，直接数学竞赛题伺候！

昆仑万维的Skywork o1系列模型因其出色的推理能力而备受关注。该系列包括Skywork o1 Open、Skywork o1 Lite和Skywork o1 Preview三个细分模型，分别具备解决...

AIGC动态

8个月前

OpenAI怒斥Scaling撞墙论！o1已产生推理直觉潜力巨大

OpenAI高级研究副总裁Mark Chen在一次炉边谈话中反驳了关于Scaling Law（规模法则）撞墙的观点。他强调，OpenAI通过o系列和GPT系列模型，成功维持了模型的Sca...

AIGC动态

8个月前

震撼预警：满血版o1倒计时！奥特曼完整专访流出：o系列疯狂迭代，马上起飞

OpenAI即将推出的满血版o1模型在科技圈引起了广泛关注。该模型预计将具备函数调用、开发者消息、结构化输出和流式传输等能力，可能成为OpenAI历史上的重大突...

AIGC动态

9个月前

Transformer能否推理引争议，DeepMind连夜更新论文开源数据集：Transformer真的很强

DeepMind最近的研究在人工智能领域引起了广泛关注，他们训练了一个仅270M大小的Transformer模型，该模型在下棋任务中展现出了大师级的表现，且无需依赖搜索算...

AIGC动态

9个月前

我们能够让开源小模型变得比人类更聪明吗

本文由安全研究员Harish SG撰写，旨在探讨如何提升开源大语言模型（LLM）的推理能力，以期达到或超越闭源模型的性能。Harish SG是德克萨斯大学达拉斯分校网络...

AIGC动态

10个月前

苹果一篇论文得罪大模型圈？Transformer不会推理，只是高级模式匹配器！所有LLM都判死刑

苹果研究者的最新研究对大型语言模型（LLM）的推理能力提出了质疑。研究发现，无论是闭源的OpenAI GPT-4o和o1模型，还是开源的Llama、Phi、Gemma和Mistral等...

AIGC动态

10个月前

标签：推理能力

Ilya Sutskever 在 NeurIPS 2024 的演讲：预训练时代已经结束了

田渊栋团队论文火了！连续思维链优于CoT，打开LLM推理新范式

很快OpenAI能证明陶哲轩错了？陶哲轩一句话，被OpenAI高管怼回去

OpenAI狂飙突进！仅12个例子就能打造专属AI专家，核心技术竟来自字节？

第一个国产中文o1来了，直接数学竞赛题伺候！

OpenAI怒斥Scaling撞墙论！o1已产生推理直觉潜力巨大

震撼预警：满血版o1倒计时！奥特曼完整专访流出：o系列疯狂迭代，马上起飞

Transformer能否推理引争议，DeepMind连夜更新论文开源数据集：Transformer真的很强

我们能够让开源小模型变得比人类更聪明吗

苹果一篇论文得罪大模型圈？Transformer不会推理，只是高级模式匹配器！所有LLM都判死刑

热门网址

标签：推理能力

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址