长上下文 | 学习AIGC

扎克伯格的豪赌初见成效？Meta新方法让LLM长上下文处理提速30倍

扎克伯格的投资似乎初见成效，Meta Superintelligence Labs 联合提出 REFRAG 高效解码框架，旨在解决大语言模型（LLM）处理长上下文输入时的效率瓶颈。在当前...

AIGC动态

1周前

Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

开源大模型领域近期迎来了显著的技术进展，尤其是中国市场的竞争愈发激烈。Kimi K2作为一款备受关注的模型，其1T的总参数量在短时间内被Qwen3的新版本超越。Q...

AIGC动态

2个月前

MiniMax 技术闭门会分享：长上下文是 Agent 的 Game Changer

MiniMax在7月10日举办的M1技术研讨会汇集了全球顶尖的研究者和业界嘉宾，深入探讨了模型架构创新、RL训练、长上下文应用等前沿话题。RL能否赋予模型新能力？...

AI-Agent

2个月前

最强3B「小钢炮」，代码数据全公开！推理随意开关，128k超长上下文

Hugging Face最新推出的30亿参数模型SmolLM3，以其全面开源和卓越性能成为小模型领域的标杆。该模型支持128k长上下文处理，并在多语言任务中展现出色表现，同...

AIGC动态

2个月前

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

普林斯顿大学陈丹琦团队提出统一框架解决长上下文语言模型中的KV缓存内存瓶颈问题。随着'长思维链'等技术的兴起，模型需要处理数万token的输入，导致基于Tran...

AIGC动态

3个月前

OpenAI 推出 GPT-4.1，撞期智谱 Z.ai

OpenAI近日推出了GPT-4.1系列模型，包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano，这些模型在多个方面超越了之前的GPT-4o和GPT-4o mini。GPT-4.1在编码、指令跟...

AIGC动态

5个月前

谷歌提出Titans：突破算力限制，扩展上下文

谷歌研究院推出的Titans框架通过创新架构设计突破了大语言模型的长上下文处理瓶颈，将模型上下文窗口扩展至200万token，同时仅增加1.8倍算力消耗。该框架在语...

AIGC动态

7个月前

谷歌AI掌门人Jeff Dean对话Transformer作者：AI提速300%，1000万倍工程师要来了

谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer在访谈中揭示了AI技术发展的关键趋势与未来挑战。低精度计算技术的突破使模型推理速度提升三倍，从TPU...

AIGC动态

7个月前

1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

谷歌近期发布了Gemini 2.0 Flash Thinking推理模型的加强版，并在Chatbot Arena排行榜上再次登顶。谷歌AI负责人Jeff Dean表示，新版本引入了1M长的上下文，以...

AIGC动态

8个月前

Transformer继任者「Titans」来了，上下文记忆瓶颈被打破

谷歌推出了一种新的AI架构——Titans，旨在解决现有注意力机制无法扩展到长上下文的问题。Titans结合了注意力机制和元上下文记忆，能够处理长达200万tokens的上...

AIGC动态

8个月前

标签：长上下文

扎克伯格的豪赌初见成效？Meta新方法让LLM长上下文处理提速30倍

Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

MiniMax 技术闭门会分享：长上下文是 Agent 的 Game Changer

最强3B「小钢炮」，代码数据全公开！推理随意开关，128k超长上下文

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

OpenAI 推出 GPT-4.1，撞期智谱 Z.ai

谷歌提出Titans：突破算力限制，扩展上下文

谷歌AI掌门人Jeff Dean对话Transformer作者：AI提速300%，1000万倍工程师要来了

1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

Transformer继任者「Titans」来了，上下文记忆瓶颈被打破

热门网址

标签：长上下文

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址