标签:数据集

对话林咏华:刚在“AI春晚”上开源了3.4T数据集的智源,是如何死磕大模型数据难题的

北京智源大会作为一年一度的AI行业盛会,汇聚了众多AI领域的顶尖学者和产业专家。本次大会的亮点之一是开源数据的讨论和贡献,智源研究院在推动全球大模型开...

27岁华裔天才少年对打UC伯克利,首发SEAL大模型排行榜!Claude 3 Opus数学封神

SEAL排行榜是一个全新的大模型评估平台,由Scale AI团队推出,得到AI领域知名人士的认可。该排行榜的特色在于使用私有数据集,确保评估公正性;定期更新数据...

西安交大发表鲁棒视觉问答综述,揭秘AI视觉问答的“超强大脑”丨IEEE TPAMI

该论文在人工智能顶级期刊IEEE TPAMI上发表,对鲁棒视觉问答方法与测评数据集进行了深入探讨与梳理,并对该方向未来的研究重点进行了凝练与总结。视觉问答(V...

“弱智贴吧”的数据,居然是最强中文语料库

随着人工智能的快速发展,大语言模型(LLM)在多个领域的应用变得越来越广泛。专注于AIGC领域的专业社区特别关注了微软 & OpenAI、百度文心一言、讯飞星火等...

让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了

在人工智能领域,模仿人类学习能力一直是研究的热点。近期,由上海人工智能实验室、南京大学、中科院深圳先进技术研究院等机构联合发布的EgoExoLearn数据集,...

弱智吧:大模型变聪明,有我一份贡献

机器之心报道了一项关于中文大型语言模型(LLM)的研究,该研究通过利用百度贴吧中的“弱智吧”内容作为数据集,对人工智能模型进行训练和评估。弱智吧以其高质...

还得是抖音,字节推出竖屏视频理解数据集,入选CVPR2024

随着短视频在社交媒体的流行,竖屏视频成为了主流的视频格式。然而,传统视频处理技术主要集中在横屏视频上,忽视了竖屏视频的独特性。为了弥补这一研究空白...

何恺明刘壮新作:消除数据集偏差的十年之战

这篇文章介绍了MIT新晋副教授何恺明与刘壮合作完成的研究,针对AI发展中长期存在的数据集偏差问题展开探讨。过去十多年来,尽管业界努力构建更大、更多样化、...

大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀

这篇文章介绍了一项由加拿大蒙特利尔大学和 Mila 研究所的研究团队进行的关于将人工智能(AI)引入剧本杀游戏的研究。剧本杀是一种多角色扮演侦探游戏,玩家...

「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

摘要:在机器之心编辑部的专栏中,介绍了牛津大学 VGG 实验室 Andrew Zisserman 团队最新工作,解决了计算机视觉中遮挡问题的挑战。该工作提出了非模态分割(...
1 2