标签:Scaling Law

大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘

本文探讨了大模型性能与训练数据规模、模型架构等设计要素之间的关系,即Scaling Law。研究者们主要关注了迁移学习中的Scaling Law,即预训练数据集大小与任...

Sora带来的四点启发(抱歉,内文不含“xx行业已死、AI一夜变天”等内容)

文章讨论了Sora的发布及其对AI领域的影响。首先,作者探讨了视觉数据在训练模型中的作用,以及它如何帮助模型获得泛化能力。Sora模型通过结合视频数据和大语...
1 2