标签:开源数据

腾讯混元康战辉:将开源大模型训练代码,但数据开源意义不大

腾讯混元近期宣布开源两款大模型:“混元 Large”和“Hunyuan3D-1.0”。混元 Large 是开源领域参数规模最大、效果最好的MoE模型,拥有389B总参数量和52B激活参数...

刚刚,Meta开源「分割一切」2.0模型,视频也能分割了

Meta最近在SIGGRAPH上宣布了Segment Anything Model 2(SAM 2)的发布,这是对去年4月发布的“分割一切模型”的重大升级。SAM 2能够实现对静态图像和动态视频内...

深度|大模型真的在吞噬人类的一切数据吗?

弗兰克·赫伯特的科幻巨著《沙丘》中,沙漠星球厄拉科斯下的香料是宇宙中最宝贵的资源,它不仅驱动了太空旅行,还具有延长寿命和扩展意识的能力。在现实世界中...

对话林咏华:刚在“AI春晚”上开源了3.4T数据集的智源,是如何死磕大模型数据难题的

北京智源大会作为一年一度的AI行业盛会,汇聚了众多AI领域的顶尖学者和产业专家。本次大会的亮点之一是开源数据的讨论和贡献,智源研究院在推动全球大模型开...