“测试”的搜索结果

GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了
DevBench团队最近推出了首个AI软件工程师Devin,它的能力在技术界引起了广泛关注。Devin不仅能够解决编码任务,还能独立完成软件开发的...
用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质|清华出品
本文介绍了清华大学研究团队基于大语言模型(LLM)的多智能体系统,提出的创新性心理测量范式——PsychoGAT。该范式通过定制化生成可交互...
强如 GPT-4,也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试
一项最新研究由加州大学伯克利分校、斯坦福大学联合AI安全中心(CAIS)和阿卜杜勒阿齐兹国王科技城(KACST)联合发表,提出了一种名为“R...
谷歌工程师硬核长篇预测,证实黄仁勋观点:AGI或在2029年出现,AI五年内通过人类测试
摘要AI和AGI的未来展望- 英伟达CEO黄仁勋预测:AI将在五年内通过人类测试,AGI即将到来。他在斯坦福大学的一个论坛上提出,如果以通过人...
Sora外部测试翻车了!3个视频都有Bug
Sora,OpenAI的文本转视频模型,最近在油管上引起了一些关注。科技up主分享了他们使用Sora生成的视频,其中包含了一些有趣的bug。例如,...
ChatGPT有记忆了!OpenAI官宣记忆功能开启测试,奥特曼称GPT-5更智能
OpenAI最近宣布了ChatGPT的一个重要更新,即新增了记忆功能,预计将在下周向部分免费及Plus用户推出。这一功能允许ChatGPT记住用户的对...
被选中!GPT-4.5 小范围测试
摘要:在人工智能领域,OpenAI推出了GPT-4.5-turbo,专注于提升交互体验和响应速度。该模型相较于GPT-4在架构、性能、适用场景和更新方...
终于!KREA AI免费开放测试,支持实时图像生成,大大提高创作效率
文章介绍了KREA AI的最新进展,它是一个AI绘画平台,以其出色的产品化能力而闻名。现在,KREA AI向所有人免费开放测试,主题是'Design a...
知情人揭秘!GPT-5已经开启灰度测试!
文章主要介绍了GPT-5的最新动态以及其预期的新功能。GPT-5正在进行灰度测试,这意味着OpenAI正在特定用户群体中试行新功能以收集反馈。O...
在软件测试中使用 ChatGPT
本文介绍了AI在软件交付中的帮助作用,特别是在自动化软件测试和优化项目工作方面的应用。Dimitar Panayotov在2023年QA Challenge Accep...
1 2 3 4 5 6 87