Paint by Example 써보기

Paint by example - a Hugging Face Space by Fantasy-Studio

huggingface.co

아키텍처 구조를 봐도 알겠지만 CLIP 인코더를 통과하기에 CLIP에서 학습되지 않은 데이터는 표현하지 못할 것으로 보인다.

원본

곰돌이

세일러문

그냥도 해보고 상체 쪽만 확대해서 했는데도 안 된다.

그림체가 달라서 그런걸까? 오바마는?

약간 애매...

좀 더 그럴듯한 이미지 조합으로 해보자

끔찍하군...

사실 이건 예정된 결과였다. 훈련 데이터셋인 Open Images는 대부분이 natural 이미지인 데다 클래스가 카테고리화되어 있기 때문에 특정 인물에 작동하지는 않는다.

그러면 natural 이미지 + 애매한 카테고리의 동물로 해보자.

엄청 자연스러운 이미지는 아니지만 예상 보다는 괜찮기도 하고?

무난한 natural 이미지 + 무난한 동물

괜찮긴 하지만 약간 부자연스러운...

배경 이미지

이 둘은 너무 자연스럽게 뽑혀서 좀 신기했다.

역시 얘는 잘 안되고...

몇 번 해보다 보니깐 약간 배경이 비슷하거나 배경이 없는 이미지가 좀 자연스럽게 잘 섞이는 느낌인데?

맨 밑 이미지가 제일 자연스러운 걸 보면 뭔가... 알다가도 모르겠다...

그나마 제일 괜찮게 뽑힌 자동차와 곰돌이를 이상한 모양의 마스크에 해보면...

먼저 곰돌이

귀여워서 그런가 신체 절단된 것만 빼면 다 좋게 나오는 듯...

자동차

총평 : 가끔 진짜 잘 뽑히는 것도 있긴 하지만 범용성이 부족하고, 입력 이미지가 카테고리화 되어서 시각적 특징을 잘 보존하지 못함.

Stable Diffusion, SDXL U-Net Architecture 살펴보기 (2)	2023.10.05
DiffStyler 써보기 (0)	2023.01.17
DAAM 써보기 (1)	2023.01.13

Ostin X