大模型 | 第 8 页

4位图灵奖得主布道，2大冠军机器人登台，“AI春晚”果然又高又硬

智源大会2024以“AI春晚”规格拉开帷幕，人形机器人冠军天工与宇树G1同台展示技能迭代成果。宇树G1凭借灵活拳击动作展现运动控制突破，天工2.0版本则从长跑转向...

AIGC动态

2个月前

RL后训练步入超节点时代！华为黑科技榨干算力，一张卡干俩活

在大模型竞赛日益激烈的背景下，强化学习后训练（RL后训练）已成为突破大语言模型（LLM）性能瓶颈的关键路径。OpenAI o1、DeepSeek-R1等模型的成功，均得益于...

AIGC动态

2个月前

微软等提出「模型链」新范式，与Transformer性能相当，扩展性灵活性更好

随着大语言模型（LLM）的快速发展，扩展Transformer架构已成为推动人工智能领域进步的关键途径。然而，LLM参数规模的指数级增长带来了高昂的训练成本和推理效...

AIGC动态

3个月前

SFT在帮倒忙？新研究：直接进行强化学习，模型多模态推理上限更高

随着OpenAI的o1/o3和Deepseek-R1等具备强大推理能力的大语言模型相继问世，学界普遍采用「监督微调 + 强化学习」的两阶段训练范式。这种范式在纯文本领域取得...

AIGC动态

3个月前

微软副总裁X上「开课」，连更关于RL的一切，LLM从业者必读

微软副总裁 Nando de Freitas 在 X 平台上发布了一系列关于人工智能教育的帖子，内容涵盖大语言模型（LLM）的强化学习、扩散模型、流匹配等技术。他通过深入...

AIGC动态

3个月前

华为中科大联创大模型低比特量化算法，1‰数据实现昇腾无损压缩7倍

大模型在人工智能领域展现出强大的能力，但其庞大的参数量和部署成本成为广泛应用的主要障碍。以DeepSeek-R1 671B为例，其推理过程需要高达1342GB的显存，即...

AIGC动态

3个月前

以加代乘？华为数学家出手，昇腾算子的高能设计与优化，性能提升30%！

随着大语言模型（LLM）参数规模的指数级增长，AI 的智力正在快速跃迁，但大模型在落地过程中面临着一系列推理层面的难题，如推理速度慢、计算成本高、部署效...

AIGC动态

3个月前

今年第二笔大模型融资披露：面壁获新一轮数亿元融资

面壁智能近日完成了新一轮数亿元融资，本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。此次融资的完成，将为面壁智能在高效大模型技术、产品壁...

AI-Agent

3个月前

通义实验室新研究：大模型自己「扮演」搜索引擎，提升推理能力无需搜索API

阿里通义实验室最近开源了ZeroSearch，这是一个无需与真实搜索引擎交互的强化学习框架，旨在提升大模型的检索和推理能力。传统的强化学习方法依赖于真实搜索...

AIGC动态

3个月前

标签：大模型

4位图灵奖得主布道，2大冠军机器人登台，“AI春晚”果然又高又硬

RL后训练步入超节点时代！华为黑科技榨干算力，一张卡干俩活

微软等提出「模型链」新范式，与Transformer性能相当，扩展性灵活性更好

SFT在帮倒忙？新研究：直接进行强化学习，模型多模态推理上限更高

微软副总裁X上「开课」，连更关于RL的一切，LLM从业者必读

华为中科大联创大模型低比特量化算法，1‰数据实现昇腾无损压缩7倍

最新W4A4KV4全量化框架，单卡A100大模型推理速度飙升

以加代乘？华为数学家出手，昇腾算子的高能设计与优化，性能提升30%！

今年第二笔大模型融资披露：面壁获新一轮数亿元融资

通义实验室新研究：大模型自己「扮演」搜索引擎，提升推理能力无需搜索API

热门网址

标签：大模型

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址