본문 바로가기

Deep Learning/Diffusion

Paint by Example 써보기

Paint by Example 논문 리뷰, Paint by Example 코드 리뷰


Hugging face demo를 사용함

 

Paint by example - a Hugging Face Space by Fantasy-Studio

 

huggingface.co


아키텍처 구조를 봐도 알겠지만 CLIP 인코더를 통과하기에 CLIP에서 학습되지 않은 데이터는 표현하지 못할 것으로 보인다.

 

원본

 

곰돌이

 

세일러문

그냥도 해보고 상체 쪽만 확대해서 했는데도 안 된다.

 

그림체가 달라서 그런걸까? 오바마는?

약간 애매...

 

좀 더 그럴듯한 이미지 조합으로 해보자

끔찍하군...

 

 

사실 이건 예정된 결과였다. 훈련 데이터셋인 Open Images는 대부분이 natural 이미지인 데다 클래스가 카테고리화되어 있기 때문에 특정 인물에 작동하지는 않는다.

 

그러면 natural 이미지 + 애매한 카테고리의 동물로 해보자. 

엄청 자연스러운 이미지는 아니지만 예상 보다는 괜찮기도 하고?

 

무난한 natural 이미지 + 무난한 동물

괜찮긴 하지만 약간 부자연스러운...

 

배경 이미지

이 둘은 너무 자연스럽게 뽑혀서 좀 신기했다.

 

역시 얘는 잘 안되고...

 

 

몇 번 해보다 보니깐 약간 배경이 비슷하거나 배경이 없는 이미지가 좀 자연스럽게 잘 섞이는 느낌인데?

맨 밑 이미지가 제일 자연스러운 걸 보면 뭔가... 알다가도 모르겠다...

 

 

그나마 제일 괜찮게 뽑힌 자동차와 곰돌이를 이상한 모양의 마스크에 해보면...

 

먼저 곰돌이

 

귀여워서 그런가 신체 절단된 것만 빼면 다 좋게 나오는 듯...

 

자동차

 

 

총평 : 가끔 진짜 잘 뽑히는 것도 있긴 하지만 범용성이 부족하고, 입력 이미지가 카테고리화 되어서 시각적 특징을 잘 보존하지 못함.

'Deep Learning > Diffusion' 카테고리의 다른 글

Stable Diffusion, SDXL U-Net Architecture 살펴보기  (2) 2023.10.05
DiffStyler 써보기  (0) 2023.01.17
DAAM 써보기  (1) 2023.01.13