标签:AIGC研究

斯坦福、Salesforce等开源1万亿tokens多模态数据集

华盛顿大学、斯坦福大学和Salesforce的研究人员联合发布了一个名为MINT-1T的多模态数据集,其规模是现有开源数据集的10倍,包含约1万亿个文本标记和34亿张图...