标签:数据筛选
训练数据量降低1万倍,谷歌提出超高质量数据主动学习方法
大模型应用于特定领域需数据微调,但为复杂任务微调大模型时,筛选高保真训练数据难度大、成本高。为此,谷歌提出新的可扩展主动学习筛选流程。该流程从初始...
谷歌发布大模型数据筛选方法:效率提升13倍,算力降低10倍
在AIGC领域,大语言模型(LLM)的发展和应用落地对训练数据的需求日益增长。然而,现有的数据处理流程依赖人工筛选,成本高昂且效率低下。谷歌Deepmind的研究...
破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍
谷歌DeepMind研究团队提出了一种名为JEST(多模态对比学习与联合示例选择)的新算法,旨在解决大型语言模型(LLM)训练过程中的高能耗问题。JEST算法通过优化...