标签:置信度评估

IBM推出创新框架用“黑盒”方式,评估大模型的输出

在AIGC领域,大语言模型(LLM)的准确性、安全性和可解释性比性能和评测排名更为关键。IBM研究人员开发了一种黑盒框架,无需访问内部结构、参数或训练数据,...