标签:数据集

清华、面壁提出创新AI Agent交互:能主动思考、预测需求

清华大学联合面壁智能团队提出了新一代主动Agent交互范式(ProActive Agent),这一范式下的Agent具备主观能动性,能够主动观察环境、预判用户需求,并在未被...

史上最严“中文真实性评估”:OpenAI o1第1豆包第2,其它全部不及格

淘宝天猫集团的研究者们最近提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,旨在评估语言模型回答简短问题的真实性能力。该基准具有中文...

全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大

HK-O1aw是由香港生成式人工智能研发中心(HKGAI)的AI for Reasoning团队(HKAIR)与北京大学对齐团队(PKU-Alignment Team)合作推出的全球首个慢思考范式法律推理...

击败GPT-4o、仅次于o1!英伟达重磅开源超强大模型–Nemotron

全球AI领域的领导者英伟达(Nvidia)最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的强大模型,该模型在测试中超越了140多个开闭源模型,包括GPT-4o、G...

终于来了!OpenAI开放GPT-4o高级语音,还用中文说「对不起」

OpenAI公司最近推出了其高级语音功能,名为GPT-4o,该功能将向Plus和Team用户开放,但免费用户无法体验。Plus用户每月需支付20美元,而Team用户则需支付30美...

苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替,Siri华丽变身

苹果公司的最新版iOS 18.1 Beta已经上线,为注册开发者带来了Apple Intelligence的初步体验。这一更新的核心是Siri的全面升级,现在变身为Apple Intelligence...

对话林咏华:刚在“AI春晚”上开源了3.4T数据集的智源,是如何死磕大模型数据难题的

北京智源大会作为一年一度的AI行业盛会,汇聚了众多AI领域的顶尖学者和产业专家。本次大会的亮点之一是开源数据的讨论和贡献,智源研究院在推动全球大模型开...

27岁华裔天才少年对打UC伯克利,首发SEAL大模型排行榜!Claude 3 Opus数学封神

SEAL排行榜是一个全新的大模型评估平台,由Scale AI团队推出,得到AI领域知名人士的认可。该排行榜的特色在于使用私有数据集,确保评估公正性;定期更新数据...

西安交大发表鲁棒视觉问答综述,揭秘AI视觉问答的“超强大脑”丨IEEE TPAMI

该论文在人工智能顶级期刊IEEE TPAMI上发表,对鲁棒视觉问答方法与测评数据集进行了深入探讨与梳理,并对该方向未来的研究重点进行了凝练与总结。视觉问答(V...

“弱智贴吧”的数据,居然是最强中文语料库

随着人工智能的快速发展,大语言模型(LLM)在多个领域的应用变得越来越广泛。专注于AIGC领域的专业社区特别关注了微软 & OpenAI、百度文心一言、讯飞星火等...
1 2 3