自动驾驶数据匿名化挑战与方案
自动驾驶数据匿名化挑战与方案
- 崔嘉亮 | 仿真测试业务技术主管,康谋科技
当自动驾驶汽车每日生成数以 TB 级的数据时,企业该如何在全球化研发测试与数据跨境传输中,既满足不同地区严苛的隐私法规,又确保数据价值不被损耗?
本场演讲基于自动驾驶数据全球化的行业背景,剖析数据跨境流动的法规壁垒与技术瓶颈,对比欧盟、美国、中国等地的合规红线,解析企业如何避免因“一刀切”策略导致的业务停滞。并通过真实案例,展示头部企业如何通过AI数据匿名化技术将合规转化为竞争优势。
(点击视频观看高清版本)
精选Q&A
匿名化的效率和成功率如何?
匿名化的效率需要从多个角度考量,比如硬件和云端提供的算力,以及数据在不同IO环境下的读写速度都会影响匿名化的效率。对于匿名化的质量来说,我们针对公开数据集在不同的感知任务上进行了测试,基于DNAT的匿名化方案能够有效保留数据特征,且在匿名化识别率上基本可以实现95%+。
国内的隐私法与国外有哪些不同?
国内主要采用的法规是PIPL,我们和目前主流也是最为严格的GDPR可以进行比较,从有效范围上来说,PIPL针对的还是中国境内的个人信息的处理,对于个人信息而言,PIPL和GDPR有着轻微的差别,前者表明的是有电子类设备或其他方式记录与识别的自然人相关信息,GDPR则针对这一定义进行了更为细化的描述。
康谋AI数据技术匿名化方案,主要是哪些技术?
主要分为两种,一个是精准匿名化方案,通过模糊形状的方式提供高精度匹配的的面部、人体和车牌模糊匿名化处理,一种是基于AI生成的人脸和车牌的匿名化方案DNAT,通过生成符合原始数据特征的人脸和车牌进行不可逆的覆盖,实现合规匿名化。
康谋数据隐私和匿名化如何确保数据合规?
康谋方案中的两种匿名化方式都同通过了 GDPR/EuroPriSe 等隐私法规的认证,基于康谋方案匿名化后的数据将会充分满足相关法规的需求。
DNAT方案可以根据项目需求进行灵活定制和拓展吗?
可以,从方案的部署方式上灵活,而且对于DNAT来说,方案流程从目标识别分割到生成替换,拆分后也可以应用于目标识别的任务中。
数据加密与解密会存在哪些挑战?
一个关键的点是保证匿名化(加密)效果和对于隐私的保护,即确保匿名化后的数据无法被逆向恢复,这一点康谋方案采用的加盐随机的方式生成了随机扰动,无论是精准模糊还是DNAT方案都确保了匿名化操作不可逆,另一方面,是要对加密的适配性提出了挑战,需要针对不同灯光、视角下进行面部匿名化,康谋方案就此也针对大量数据集进行了训练,适配了不同地区面部和车牌的特征,提供了在不同环境下匿名化质量的保证。