标签:腾讯MLPD

“大海捞针”out!“数星星”成测长文本能力更精准方法,来自鹅厂

腾讯MLPD实验室近期提出了一种新的大模型长文本能力测试方法,名为“数星星”,旨在替代传统的“大海捞针”测试。这种新方法更注重评估模型处理长依赖关系的能力...