标签:模型局限

大模型集体失智!9.11和9.9哪个大,几乎全翻车了

在最近的一项测试中,多个主流大型AI模型在回答“9.11和9.9哪个大”这一简单问题时,意外地给出了错误答案,认为9.11大于9.9。这一现象引起了广泛关注和讨论。R...

菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM

剑桥大学研究主任、菲尔兹奖得主Timothy Gowers最近对大型语言模型(LLM)如GPT-4o进行了一项测试,以解决经典的“狼-山羊-卷心菜”过河问题。测试结果显示,这...

Sora「翻车」:猴子长出鹦鹉尾巴,物体学会「穿墙术」

在彭博社对OpenAI的Sora进行的测试中,Sora在将文本提示转换为视频方面表现出了一些技术局限性。尽管Sora能够生成视频,但在处理复杂的场景时,如物体的物理...