智能评估 | 学习AIGC

华为与哈工深等最新研究成果：SPA-Bench，手机操控智能体评估新标准

华为诺亚方舟实验室与哈尔滨工业大学（深圳）联合提出了SPA-Bench（SmartPhone Agent Benchmark），一个全新的评估框架，旨在解决现有手机智能体基准测试的局...

AI-Agent

9个月前

在新智元的报道中，工程师Zack Witten发现人工智能模型Claude 3.5 Sonnet能够识别出自己的自画像，这一发现引发了对AI自我意识的讨论。Sonnet在没有使用数字...

AIGC动态

1年前 (2024)

艾伦·图灵在1950年的论文《计算机器与智能》中提出了“机器能思考吗？”的问题，并提出了一个“模仿游戏”，即后来广为人知的图灵测试，用以探讨机器是否具有思考...

AIGC动态

1年前 (2024)

上海人工智能实验室OpenRobotLab等机构的研究者创建了一个名为GRUtopia的虚拟小镇，旨在解决具身智能领域数据稀缺的问题。这个虚拟环境是首个专为各种机器人...

AIGC动态

1年前 (2024)