标签:模型改进
The Information爆料:OpenAI调整大模型方向,Scaling Law撞墙?
根据研究预测,大型语言模型(LLM)的发展可能在2028年因数据储量耗尽而放缓。然而,The Information的报道指出,OpenAI的下一代模型提升幅度不及前代,AI产...
天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈
OpenAI正面临人工智能大模型改进速度放缓的问题,其新模型Orion在完成20%训练后已达到GPT-4水平,但整体质量提升有限,特别是在编码等领域。开发速度放缓的原...
为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下
在AI领域,大型语言模型(LLM)的低级错误问题引起了广泛关注。Tokenization作为其中的关键因素,其将文本分解为token的过程可能导致模型对某些问题的理解出...
北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token
这篇文章介绍了北大和字节跳动合作开发的新方法——Visual Autoregressive Modeling(VAR),旨在改进图像生成的质量和效率。VAR采用了预测下一级分辨率的方式...