Artwork 생성 벤치마킹을 위한 새로운 데이터셋 ArtBench-10의 간략한 소개입니다.
Abstract
Artwork 생성을 벤치마킹하기 위한 균형적인 클래스, 고품질, 깔끔한 주석이 달린 표준화된 최초의 데이터셋인 ArtBench-10을 소개한다. 10개의 독특한 스타일의 예술 작품 60,000개의 이미지로 구성되어 있으며, 스타일당 5,000개의 훈련 이미지와 1,000개의 테스트 이미지를 가지고 있다. 또한 32x32, 256x256, 원본 크기로 총 3가지 버전이 있다.
The ArtBench-10 Dataset
Limitation of Existing Artwork Datasets
이전의 artwork 데이터셋들에는 여러가지 문제가 있었다.
- Long-tail 분포
- 이미지 품질이 일정하지 않고 중복 이미지가 있었다
- 데이터 수집, 주석 및 전처리가 비표준화되어 일부 이미지와 주석의 품질이 좋지 않았다
(WikiArt 데이터셋의 long-tail 분포와 중복 이미지)
Dataset Creation
Ukiyo-e
(https://Ukiyo-e.org), WikiArt(https://WikiArt.org), Surrealisum(https://surrealism.website/)에서 데이터를 수집하고 필터링, 샘플링, 표준화를 거쳤다.
Experiments
정량적 평가
ArtBench-10으로 훈련 후 생성한 이미지
(언급은 되어있지 않지만 정량적 평가에서 styleGAN2에 밀리는 것과 생성 이미지의 중복 현상을 보았을 때 Projected GAN의 백본으로 FastGAN을 사용한듯 하다.)
Top-7 retrieval result