标签:模型测试

大决战!OpenAI可能发布GPT-4.5,狙击马斯克Gork3

今天凌晨,OpenAI首席执行官Sam Altman透露GPT-4.5已进入测试阶段,其展现的AGI(通用人工智能)体验深度远超预期,标志着该模型距离正式发布仅一步之遥。这...

腾讯AI视频生成曝光!与Sora同提示词PK,你来投票

腾讯公司正在开发其首个文生视频模型,目前该模型和产品正在紧张的升级和调试阶段,尚未确定正式上线时间。内测阶段的模型已经能够生成包括自然场景、游戏画...

“大海捞针”out!“数星星”成测长文本能力更精准方法,来自鹅厂

腾讯MLPD实验室近期提出了一种新的大模型长文本能力测试方法,名为“数星星”,旨在替代传统的“大海捞针”测试。这种新方法更注重评估模型处理长依赖关系的能力...