标签:Few-Shot CoT

大模型智障检测+1:Strawberry有几个r纷纷数不清,最新最强Llama3.1也傻了

近期,大型AI模型在处理一些看似简单的问题时出现了集体失智的现象,引起了广泛关注和讨论。例如,在计算单词'Strawberry'中'r'的数量时,一些模型给出了错误...