长上下文 | 学习AIGC

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

普林斯顿大学陈丹琦团队提出统一框架解决长上下文语言模型中的KV缓存内存瓶颈问题。随着'长思维链'等技术的兴起，模型需要处理数万token的输入，导致基于Tran...

AIGC动态

12小时前

OpenAI 推出 GPT-4.1，撞期智谱 Z.ai

OpenAI近日推出了GPT-4.1系列模型，包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano，这些模型在多个方面超越了之前的GPT-4o和GPT-4o mini。GPT-4.1在编码、指令跟...

AIGC动态

2个月前

谷歌提出Titans：突破算力限制，扩展上下文

谷歌研究院推出的Titans框架通过创新架构设计突破了大语言模型的长上下文处理瓶颈，将模型上下文窗口扩展至200万token，同时仅增加1.8倍算力消耗。该框架在语...

AIGC动态

4个月前

谷歌AI掌门人Jeff Dean对话Transformer作者：AI提速300%，1000万倍工程师要来了

谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer在访谈中揭示了AI技术发展的关键趋势与未来挑战。低精度计算技术的突破使模型推理速度提升三倍，从TPU...

AIGC动态

4个月前

1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

谷歌近期发布了Gemini 2.0 Flash Thinking推理模型的加强版，并在Chatbot Arena排行榜上再次登顶。谷歌AI负责人Jeff Dean表示，新版本引入了1M长的上下文，以...

AIGC动态

5个月前

Transformer继任者「Titans」来了，上下文记忆瓶颈被打破

谷歌推出了一种新的AI架构——Titans，旨在解决现有注意力机制无法扩展到长上下文的问题。Titans结合了注意力机制和元上下文记忆，能够处理长达200万tokens的上...

AIGC动态

5个月前

只有模仿没有创新？国产 AI 用行动打破质疑

MiniMax公司在2025年初发布了MiniMax-01系列模型，包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01，标志着公司首次开源模型。这些模型采...

AI-Agent

5个月前

清华微软最新力作：用物理学革新Transformer注意力，「大海捞针」精度暴涨30%！

微软研究院和清华大学的研究人员提出了一种名为Differential Transformer（DIFF Transformer）的新模型架构，旨在改进Transformer模型中的注意力机制。该架构...

AIGC动态

9个月前

陈丹琦团队新作：Llama-2上下文扩展至128k，10倍吞吐量仅需1/6内存

陈丹琦团队发布了一种名为CEPE（并行编码上下文扩展）的新方法，该方法通过添加小型编码器和交叉注意力模块，扩展了预训练和指令微调模型的上下文窗口。这种...

AIGC动态

1年前 (2024)

标签：长上下文

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

OpenAI 推出 GPT-4.1，撞期智谱 Z.ai

谷歌提出Titans：突破算力限制，扩展上下文

谷歌AI掌门人Jeff Dean对话Transformer作者：AI提速300%，1000万倍工程师要来了

1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

Transformer继任者「Titans」来了，上下文记忆瓶颈被打破

只有模仿没有创新？国产 AI 用行动打破质疑

清华微软最新力作：用物理学革新Transformer注意力，「大海捞针」精度暴涨30%！

陈丹琦团队新作：Llama-2上下文扩展至128k，10倍吞吐量仅需1/6内存

热门网址

标签：长上下文

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址