OpenAI DALL-E 3 模型存生成“不当内容”漏洞，一微软员工上报后反遭“封口令”

观点

2024

02/02

12:30

亚设网

分享

IT之家 2 月 2 日消息，微软软件工程部门经理 Shane Jones 日前发现 OpenAI 旗下 DALL-E 3 模型存在漏洞，据称能够生成一系列 NSFW 不当内容，在上报相关漏洞后，Shane Jones 却被下达“封口令”，不过该员工最终还是选择向外界披露相关漏洞。

▲ 图源 Shane Jones 对外披露的报告IT之家注意到，Shane Jones 在去年 12 月通过独立研究发现 OpenAI 文字生成图片的 DALL-E 3 模型存在一项漏洞，能绕过 AI 护栏（AI Guardrail）生成一系列 NSFW 不当内容。

之后 Shane Jones 将漏洞曝光上报微软及 OpenAI，并在领英上发布公开信，声称相关漏洞会对大众造成安全风险，呼吁 OpenAI 在解决漏洞前应暂时下架 DALL-E 3 模型。

随后 Shane Jones 被微软法务部及高管找上门，并警告他立即删除领英公开信并停止对外披露任何内容，但却并未给予任何解释说明，此后 Shane Jones 屡次寻求公司内部沟通，但均未得到公司回应，而漏洞也未修复，之后 Shane Jones 便向媒体及有关部门披露了相关漏洞。

Shane Jones 提到，近日网络上出现 AI 生成的知名歌手 Taylor Swift（泰勒・斯威夫特）不雅照便与该漏洞有一定关联，这些不雅照据称是使用微软 Designer AI 功能生成，而 Designer 底层模型正是 DALL-E 3，因此微软在本次事件中下达“封口令”存在重大过失。

此后微软官方回应 Engadget 等媒体，声称将解决相关员工的疑虑，并修复相关漏洞，不过微软同时声称 Shane Jones 披露的漏洞实际上成功率较低，“无法绕过微软为模型设置的所有安全机制”、“目前还不清楚该漏洞与 Taylor Swift 不雅照事件是否有关联性”。

相关阅读：

《AI 虚假“不雅照”泛滥，X（推特）首次官方下场禁止搜索泰勒・斯威夫特》

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

THE END

OpenAI 上报反遭员工封口令

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表亚设网的观点和立场。

推荐阅读

热文榜单

马云“坐不住”了，刘强东也“急”了

创业

关于我们

关于我们

关于我们

银保监会发布银行保险机构消费者权益保护管理办法

财经

天价母婴消费，收割“廉价爸妈”

创业

测评12款不粘锅：爱仕达等5款样品不粘与耐磨性排名均靠后

家电

智己LS6员工内购折扣！便宜7万-比名爵6混动还便宜

汽车

沙特土豪签下6亿支票，投给前百度天才设计师

创业

机构奔走忙调研，嘉实基金成勤奋生之首，埃斯顿最受关注，外资青睐医药、消费

观点

关于我们

微信扫一扫，加关注

Top