SAM 2.1上新、Lingua代码库发布,一大波Meta开源工具来袭

SAM 2.1上新、Lingua代码库发布,一大波Meta开源工具来袭

 

文章摘要


【关 键 词】 机器智能开源模型多模态跨语言自学习

Meta公司近期分享了一系列研究和模型,旨在推动高级机器智能(AMI)的发展,并促进开放科学和可复现性。这些研究涵盖了AMI的多个构建模块,如感知、语音和语言、推理、具身智能和对齐。

SAM 2.1是SAM 2的升级版本,已经在多个学科领域产生积极影响。新版本通过额外的数据增强技术和对模型的调整,提高了对遮挡的处理能力。SAM 2.1的代码已在GitHub上开源。

Spirit LM是Meta构建的开源多模态语言模型,它通过词级交织方法在语音和文本数据集上进行训练,实现了语音和文本的无缝集成。Spirit LM的论文、代码和模型权重也已公开。

Layer Skip是Meta提出的端到端解决方案,旨在加快大型语言模型(LLM)在新数据上的生成时间,而无需专门的硬件或软件支持。Layer Skip通过执行层的子集并利用后续层进行验证和校正来加速LLM。Meta还发布了Layer Skip的推理代码和微调检查点,Llama 3、Llama 2和Code Llama等模型已经使用Layer Skip进行了优化。

Lingua是一个轻量级且独立的代码库,旨在助力大规模训练语言模型。Lingua强调简单性和可复用性,以加速研究。Lingua项目也在GitHub上开源。

MEXMA是一种新型预训练跨语言句子编码器,通过结合token层级和句子层级的目标,MEXMA在训练过程中的表现优于以往方法。MEXMA覆盖了80种语言,并在下游任务中表现出色。MEXMA的论文、模型和代码也已公开。

Meta还提出了自学习评估器,用于生成合成偏好数据来训练奖励模型,无需依赖人工标注。Meta发布了使用直接偏好优化训练的模型,并在RewardBench上展示了其优于其他模型的表现。自学习评估器的论文、代码和模型也已公开。

这些研究成果和模型的开源,不仅展示了Meta在AMI领域的进展,也为全球研究社区提供了宝贵的资源,推动了整个领域的开放科学和可复现性。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 1826字 | 8分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...