OpenAI 发了个“前沿治理框架”,主要讲他们的安全实践怎么去跟新出来的法规对上号,比如加州那个《前沿人工智能透明度法案》和欧盟《人工智能法案》里的通用人工智能规矩。
之前那个“准备框架”还是我们内部管那些最高级AI系统最严重风险的基础,有些做法比法律要求的还严。这个新的治理框架呢,就是把相关部分抽出来,弄成一份给公众看的、主要聚焦具体法规义务的文件。
里面覆盖的风险评估和缓解领域有这些:网络攻击、化学、生物、放射性和核风险、有害操纵,还有失控问题。也包含了模型报告、安全风险管理、出事怎么应对、听外部专家意见,以及框架本身怎么更新。
估计以后模型能力、评估方法和监管要求都会变,我们的做法肯定也得跟着变,到时候这个前沿治理框架也会相应更新。
原文:https://openai.com/index/openai-frontier-governance-framework
来源:OpenAI:官网动态(RSS · 排除企业/客户案例)
小白问一下,这个框架是不是以后咱们用AI的时候都得遵守啊?不太确定对普通开发者有啥影响。
哈哈哈,又来了,每次出个新框架就一堆人讨论,最后该咋用还咋用。
我比较关心里面提到的“失控问题”具体指啥?是说AI自己会绕过安全措施吗?有没有更详细的案例或者测试方法?之前看其他论文提到过目标错配,但OpenAI自己是怎么定义这个的?
我们团队去年其实试过自己搞风险评估,当时参考了他们的准备框架,但发现实际操作中很多指标根本测不准,比如“有害操纵”到底怎么量化?最后只好用红队测试硬模拟,结果花了好多时间。这次公开的治理框架如果能把法规对应部分说清楚,至少合规压力会小一点,不过估计还是得等具体行业指南出来才行。
说真的,最近天气热得不行,我电脑风扇狂转,跑个大模型都得半夜搞。顺便问下,有人试过在高温环境下训练模型不稳定吗?不知道这个框架里有没有考虑环境风险……(好像跑偏了)
操作上大概分这几步:先对照法案条款列表,再映射到内部安全流程,每个月更新一次合规检查表。我们公司已经这么干了,虽然烦但有用。
目前主要约束大厂,普通开发者基本不用管,该咋写还咋写