标签:数据集
清华、面壁提出创新AI Agent交互:能主动思考、预测需求
清华大学联合面壁智能团队提出了新一代主动Agent交互范式(ProActive Agent),这一范式下的Agent具备主观能动性,能够主动观察环境、预判用户需求,并在未被...
史上最严“中文真实性评估”:OpenAI o1第1豆包第2,其它全部不及格
淘宝天猫集团的研究者们最近提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,旨在评估语言模型回答简短问题的真实性能力。该基准具有中文...
全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大
HK-O1aw是由香港生成式人工智能研发中心(HKGAI)的AI for Reasoning团队(HKAIR)与北京大学对齐团队(PKU-Alignment Team)合作推出的全球首个慢思考范式法律推理...
击败GPT-4o、仅次于o1!英伟达重磅开源超强大模型–Nemotron
全球AI领域的领导者英伟达(Nvidia)最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的强大模型,该模型在测试中超越了140多个开闭源模型,包括GPT-4o、G...
终于来了!OpenAI开放GPT-4o高级语音,还用中文说「对不起」
OpenAI公司最近推出了其高级语音功能,名为GPT-4o,该功能将向Plus和Team用户开放,但免费用户无法体验。Plus用户每月需支付20美元,而Team用户则需支付30美...
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替,Siri华丽变身
苹果公司的最新版iOS 18.1 Beta已经上线,为注册开发者带来了Apple Intelligence的初步体验。这一更新的核心是Siri的全面升级,现在变身为Apple Intelligence...
对话林咏华:刚在“AI春晚”上开源了3.4T数据集的智源,是如何死磕大模型数据难题的
北京智源大会作为一年一度的AI行业盛会,汇聚了众多AI领域的顶尖学者和产业专家。本次大会的亮点之一是开源数据的讨论和贡献,智源研究院在推动全球大模型开...
27岁华裔天才少年对打UC伯克利,首发SEAL大模型排行榜!Claude 3 Opus数学封神
SEAL排行榜是一个全新的大模型评估平台,由Scale AI团队推出,得到AI领域知名人士的认可。该排行榜的特色在于使用私有数据集,确保评估公正性;定期更新数据...
西安交大发表鲁棒视觉问答综述,揭秘AI视觉问答的“超强大脑”丨IEEE TPAMI
该论文在人工智能顶级期刊IEEE TPAMI上发表,对鲁棒视觉问答方法与测评数据集进行了深入探讨与梳理,并对该方向未来的研究重点进行了凝练与总结。视觉问答(V...
“弱智贴吧”的数据,居然是最强中文语料库
随着人工智能的快速发展,大语言模型(LLM)在多个领域的应用变得越来越广泛。专注于AIGC领域的专业社区特别关注了微软 & OpenAI、百度文心一言、讯飞星火等...