OpenAI首次公开前沿大模型安全:基础架构、保护措施等

AIGC动态4周前发布 AIGCOPEN
162 0 0
OpenAI首次公开前沿大模型安全:基础架构、保护措施等

 

文章摘要


【关 键 词】 OpenAI安全策略模型开发数据保护行业原则

OpenAI最近公开了其前沿大模型的安全策略,这是首次系统性地公布与此相关的细节,旨在让外界深入了解其模型的开发流程。
该策略建立在微软Azure云服务之上,并利用Kubernetes进行工作负载的协调和管理。
为确保研究基础设施的安全性,OpenAI实施了一系列措施,包括使用Azure Entra ID进行身份验证和授权,Kubernetes的基于角色的访问控制(RBAC)以及“默认拒绝”的网络策略。
敏感数据保护方面,OpenAI采用了密钥管理服务和基于角色的访问控制,同时开发了AccessManager服务来管理内部授权。
此服务通过策略定义的审批者联合访问管理决策,确保敏感资源的访问受到适当的监督。
此外,模型权重的保护策略包括多方批准的授权流程、专用链接的存储资源和网络出口控制。
OpenAI还通过内部和外部“安全红队”测试研究环境的安全控制,并探索合规制度来确保大模型的权重安全。
公司频繁公布大模型安全信息的原因之一是近期受到的安全压力,包括关键安全负责人的离职和公开批评。
此外,11名OpenAI现役和前员工联名呼吁行业和学术机构遵循四项原则,以促进对AI模型安全风险的管理和透明度。
这些原则包括支持监管条例、为员工提供风险疑虑的上报途径、鼓励公开批评的文化以及不对报告风险的员工进行报复。
联名信强调了前沿AI模型可能带来的风险,包括错误内容生成、人为操控和不平等加剧等,呼吁全球参与者制定安全、可持续的监督规则,以避免不幸的意外发生。
这一系列动作体现了OpenAI在AI安全方面的自我反思和外界对其安全实践的关切。

网易AI智能绘画

原文和模型


【原文链接】 阅读原文 [ 2440字 | 10分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 glm-4
【摘要评分】 ★★★★★

© 版权声明
讯飞星火大模型

相关文章

星火内容运营大师

暂无评论

暂无评论...