推理效率 | 学习AIGC

英伟达、港大等发布创新KV缓存，实现扩散模型无训练加速

扩散语言模型（Diffusion Language Models, dLLM）与传统的自回归模型（如GPT系列）在文本生成方式上存在显著差异。扩散模型通过逐步去除文本中的噪声来生成...

AIGC动态

4周前

MoE推理「王炸」组合：昇腾×盘古让推理性能狂飙6-8倍

华为团队推出的Pangu Pro MoE 72B模型在昇腾平台上实现了显著的推理性能提升，通过系统级软硬协同优化，推理性能提升6~8倍。该模型采用混合专家（MoE）架构，...

AIGC动态

2个月前

博士宿舍激情脑暴，革新了Scaling Law？Qwen和浙大联手推出新定律，直接干掉95.5%推理内存！

阿里巴巴研究团队与浙江大学合作提出了一种新的并行计算缩放定律（ParScale），该定律通过在训练和推理阶段增加并行计算量，显著提升大模型的能力，同时保持...

AIGC动态

2个月前

DeepSeek精度效率双提升，华为&信工所提出思维链“提前退出”机制

华为与中科院信工所合作提出了一种名为DEER（动态提前退出推理）的新方法，旨在解决大模型在长思维链推理中可能出现的过度思考问题。DEER的核心在于找到推理...

AIGC动态

3个月前

别让大模型想太多了，过度思考会影响性能

加州大学伯克利分校和苏黎世联邦理工学院等高校的研究人员深入探讨了大模型在执行Agent任务时面临的“过度思考”问题。过度思考是指大模型过度依赖内部推理，而...

AI-Agent

4个月前

世界最好小参数开源大模型！超谷歌、Meta，手机、平板轻松运行

法国大模型平台Mistral.AI推出了专为移动设备设计的Ministraux模型，包含3B和8B两个版本。这些模型在文本生成、推理、函数调用和效率方面表现出色，性能超越...

AIGC动态

10个月前

Meta版快慢机来了！田渊栋团队整合快慢思考，能走迷宫推箱子

Meta的田渊栋团队最近推出了一款名为Dualformer的新型人工智能模型，该模型能够将快速和慢速思考方式无缝结合，以提高性能并降低成本。Dualformer通过在推理...

AIGC动态

10个月前

比OpenAI的Whisper快50%，最新开源语音模型

生成式AI公司aiOla在其官网开源了一款名为Whisper-Medusa的语音模型，该模型在推理效率上相较于OpenAI的Whisper模型提升了50%。Whisper-Medusa在Whisper的基...

AIGC动态

1年前 (2024)

Meta开源多token预测，提升大模型推理效率

AIGC开放社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，专注于AIGC领域的市场研究和开发者生态。传统的大模型预训练...

AIGC动态

1年前 (2024)

Meta等最新研究：多token预测，提升大模型推理效率

在自然语言处理领域，大语言模型如GPT-4、Gemini系列和Llama-3等，通常采用下一个token预测的损失函数进行预训练。然而，这种预训练方法需要大量数据且可能降...

AIGC动态

1年前 (2024)

标签：推理效率

英伟达、港大等发布创新KV缓存，实现扩散模型无训练加速

MoE推理「王炸」组合：昇腾×盘古让推理性能狂飙6-8倍

博士宿舍激情脑暴，革新了Scaling Law？Qwen和浙大联手推出新定律，直接干掉95.5%推理内存！

DeepSeek精度效率双提升，华为&信工所提出思维链“提前退出”机制

别让大模型想太多了，过度思考会影响性能

世界最好小参数开源大模型！超谷歌、Meta，手机、平板轻松运行

Meta版快慢机来了！田渊栋团队整合快慢思考，能走迷宫推箱子

比OpenAI的Whisper快50%，最新开源语音模型

Meta开源多token预测，提升大模型推理效率

Meta等最新研究：多token预测，提升大模型推理效率

热门网址

标签：推理效率

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址