Open-sourced Dataset Protection via Backdoor Watermarking
这篇是李一鸣在arxiv上的文章。
backdoor embedding based dataset watermarking (BEDW)
文章的目的是为了保护开源数据集的知识版权。它的做法是:在开源数据集中添加利用BadNets和invisible attack的混合策略来标记数据集。
其整体思想非常简单,和后门攻击完全一样。
在验证上,利用假设检验来验证数据集是否被盗用。
给出两个性能度量指标:Benign accuracy(BA)和watermark success rate(WSR)。
https://paperswithcode.com/paper/open-sourced-dataset-protection-via-backdoor