OpenAI首次公开前沿大模型安全：基础架构、保护措施等

AIGC动态1年前 (2024)发布 AIGCOPEN

3,165 0 0

文章摘要

OpenAI最近公开了其前沿大模型的安全策略，这是首次系统性地公布与此相关的细节，旨在让外界深入了解其模型的开发流程。
该策略建立在微软Azure云服务之上，并利用Kubernetes进行工作负载的协调和管理。
为确保研究基础设施的安全性，OpenAI实施了一系列措施，包括使用Azure Entra ID进行身份验证和授权，Kubernetes的基于角色的访问控制（RBAC）以及“默认拒绝”的网络策略。
敏感数据保护方面，OpenAI采用了密钥管理服务和基于角色的访问控制，同时开发了AccessManager服务来管理内部授权。
此服务通过策略定义的审批者联合访问管理决策，确保敏感资源的访问受到适当的监督。
此外，模型权重的保护策略包括多方批准的授权流程、专用链接的存储资源和网络出口控制。
OpenAI还通过内部和外部“安全红队”测试研究环境的安全控制，并探索合规制度来确保大模型的权重安全。
公司频繁公布大模型安全信息的原因之一是近期受到的安全压力，包括关键安全负责人的离职和公开批评。
此外，11名OpenAI现役和前员工联名呼吁行业和学术机构遵循四项原则，以促进对AI模型安全风险的管理和透明度。
这些原则包括支持监管条例、为员工提供风险疑虑的上报途径、鼓励公开批评的文化以及不对报告风险的员工进行报复。
联名信强调了前沿AI模型可能带来的风险，包括错误内容生成、人为操控和不平等加剧等，呼吁全球参与者制定安全、可持续的监督规则，以避免不幸的意外发生。
这一系列动作体现了OpenAI在AI安全方面的自我反思和外界对其安全实践的关切。