华为诺亚方舟实验室开源百万级GenImage数据集,助力构建AIGC时代的图像检测器
在AIGC时代,利用Midjourney、Stable Diffusion等AI产品生成逼真难辨真伪的高质量图片已成为普遍现象。然而,这种虚假照片可能对社会产生负面影响,从生成不雅图片用于散播谣言,到合成虚假图片用于金融欺诈,导致信任危机等问题。
为了应对这一挑战,华为诺亚方舟实验室采取积极措施,开源了百万量级的GenImage数据集。该数据集旨在帮助企业和开发者快速构建用于区分AI生成图像和真实图像的检测器和评估工具,致力于构建AIGC时代的ImageNet。GenImage数据集的主要优点包括超过一百万对AI生成的假图像和收集的真实图像、涵盖广泛的1000类图像以及使用最先进的生成器,如Midjourney、Stable Diffusion、ADM、GLIDE、Wukong、VQDM等。
这些优点使得在GenImage上训练的检测器能够经过全面的评估,并展现对不同图像的强大适用性。未来展望中,随着AI生成图片能力的提升,对于AI生成的图片实现有效检测的需求将变得更加迫切。GenImage数据集致力于为真实环境下的生成图片检测提供有效训练数据。
开源地址:https://github.com/GenImage-Dataset/GenImage
论文:https://arxiv.org/abs/2306.08571
项目主页:https://genimage-dataset.github.io/
发表评论 取消回复