标签:性能争议
官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug
近日,Sakana AI推出的「AI CUDA工程师」系统因涉嫌作弊引发行业震动。该系统曾宣称通过LLM驱动的进化算法,能将PyTorch代码转换为优化后的CUDA内核,实现模...
测试「天下最聪明」的 Grok3:它真的是模型边际效应的终点吗?
马斯克与xAI团队发布的Grok3模型在基准测试中宣称超越主流AI系统,但其实际表现引发广泛质疑。在基础数学与物理问题测试中,Grok3未能正确回答'9.11与9.9大小...
微软全新原生 Copilot 应用被指是 Edge 套壳:从 PWA 转向“原生”,内存占用却飙升至 1GB
微软近期对Windows系统中的Copilot进行了更新,推出了专为Windows 11设计的全新原生Copilot应用,这是Copilot在Windows平台上的第四次重新设计。新版本通过Mi...