본문 바로가기

논문 리뷰/etc.

The ArtBench Dataset

Artwork 생성 벤치마킹을 위한 새로운 데이터셋 ArtBench-10의 간략한 소개입니다.

 

Github

 

 

 

 

Abstract

Artwork 생성을 벤치마킹하기 위한 균형적인 클래스, 고품질, 깔끔한 주석이 달린 표준화된 최초의 데이터셋인 ArtBench-10을 소개한다. 10개의 독특한 스타일의 예술 작품 60,000개의 이미지로 구성되어 있으며, 스타일당 5,000개의 훈련 이미지와 1,000개의 테스트 이미지를 가지고 있다. 또한 32x32, 256x256, 원본 크기로 총 3가지 버전이 있다.

 

 

 

The ArtBench-10 Dataset

 

Limitation of Existing Artwork Datasets

이전의 artwork 데이터셋들에는 여러가지 문제가 있었다.

  • Long-tail 분포
  • 이미지 품질이 일정하지 않고 중복 이미지가 있었다
  • 데이터 수집, 주석 및 전처리가 비표준화되어 일부 이미지와 주석의 품질이 좋지 않았다

 

(WikiArt 데이터셋의 long-tail 분포와 중복 이미지)

 

Dataset Creation

Ukiyo-e

(https://Ukiyo-e.org), WikiArt(https://WikiArt.org), Surrealisum(https://surrealism.website/)에서 데이터를 수집하고 필터링, 샘플링, 표준화를 거쳤다.

 

 

 

Experiments

정량적 평가

 

ArtBench-10으로 훈련 후 생성한 이미지

(언급은 되어있지 않지만 정량적 평가에서 styleGAN2에 밀리는 것과 생성 이미지의 중복 현상을 보았을 때 Projected GAN의 백본으로 FastGAN을 사용한듯 하다.)

 

Top-7 retrieval result