应用案例:法雷奥使用DNAT开发首个广泛的汽车鱼眼数据集
项目背景
自动驾驶神经网络和验证系统的研究和训练需要大量的图像数据,因此法雷奥创建了WoodScape数据集。该数据集由来自几个国家收集的四个鱼眼相机的图像组成,是第一个广泛的汽车鱼眼数据集。
由于各国严格的隐私法规以及法雷奥对隐私合规和社会责任的重视,图像匿名化成为了法雷奥数据处理时的优先重要事项。此外,法雷奥也曾表明“像素化等传统匿名化方法会导致图像中出现伪影,并可能对训练模型的质量产生重大负面影响。
如何减少自然外观和最小像素对视觉数据的影响,成为了法雷奥面临的关键问题。
解决方案
DNAT 很好地满足法雷奥对数据集的复杂需求。由于 DNAT 与摄像机无关,因此它适用于任何类型的设置和标准格式,包含鱼眼相机。个人身份信息能够被准确地检测出来,并用生成的覆盖图层进行替换。这样既可以用于注释、分析和机器学习,同时又符合隐私要求。DNAT 支持在云端、经过认证的服务器或数据本地进行匿名化,法雷奥最终根据需求选择本地部署。
在使用初始数据成功进行概念验证后,法雷奥决定长期使用brighter AI数据匿名化解决方案,以满足目前和未来图像数据的隐私要求。这使得创建 WoodScape 数据集成为可能,该数据集现在包含超过10,000张图像,并在实例级别带有 40+ 类的语义注释。 brighter AI 数据匿名化解决方案证明了其高度准确的匿名化功能,且不会对机器学习模型产生任何负面影响。
WoodScape 收集了多个国家的图像数据,会面临违反隐私法规的重大风险。而使用像素化等传统方法对人脸和车牌等个人身份信息进行匿名处理会在图像中造成伪影,严重影响训练模型的质量。brighter AI深度自然匿名化数据处理技术帮助我们解决了这一难题。
woodscape.valeo.com/dataset