标签:架构

革命新架构掀翻Transformer!无限上下文处理,2万亿token碾压Llama 2

新智元报道了Meta、南加州大学(USC)、CMU和UCSD联合提出的革命性新架构Megalodon,旨在处理无限上下文,并在2万亿token训练任务中超越了Llama2-7B,展现出...

兆级长文本,已是一线大模型机构标配能力丨上海AI Lab林达华

林达华是一位深度学习与计算机专家,他在大模型领域取得了重要突破。他指出,大模型的关键在于能够将海量信息串接起来做出深层次的结论,这远比简单的检索问...