AI 训练数据集惊现近 12000 个敏感信息
据外媒消息,AI 训练领域近日出现重大安全隐患,近 12000 个 API 密钥和密码现身用于 AI 训练的Common Crawl 数据集当中。这些 API 密钥能让攻击者接入各种在线服务,密码则涉及众多用户账户。进一步调查显示,数据收集和整理环节存在严重漏洞。一些数据源缺乏有效的加密保护,在数据采集时未对内容进行严格筛查,使得这些重要信息轻易流入训练数据集。比如某些云服务的 API 密钥被不当获取,若被恶意利用,攻击者就能随意操纵相关服务,访问并篡改大量数据。