首页 > 快讯 > 快讯详情

国家网信办:利用合成数据进行模型训练和关键能力优化时 应当评估合成数据安全性

格隆汇12月27日|国家互联网信息办公室起草了《人工智能拟人化互动服务管理暂行办法(征求意见稿)》,现向社会公开征求意见。意见稿提出,提供者开展预训练、优化训练等数据处理活动时,应当加强训练数据管理,遵守以下规定:

(一)使用符合社会主义核心价值观、体现中华优秀传统文化的数据集;

(二)对训练数据开展清洗、标注,增强训练数据的透明度、可靠性,防范数据投毒、数据篡改等行为;

(三)提高训练数据的多样性,通过负向采样、对抗训练等手段,提升模型生成内容安全性;

(四)利用合成数据进行模型训练和关键能力优化时,应当评估合成数据安全性;

(五)加强对训练数据的日常检查,定期对数据进行迭代升级,持续优化产品和服务的性能;

(六)保障训练数据来源合法、可追溯,采取必要措施保障数据安全,防范数据泄露风险。