본문 바로가기

논문 리뷰/Diffusion Model

BK-SDM: A Lightweight, Fast, and Cheap Version of Stable Diffusion

[Github]

[arXiv](2023/11/16 version v3)

 

 

Abstract

Stable Diffusion에서 residual block과 attention block 제거, 증류를 통해 모델 크기를 줄인 BK-SDM 제안

 

 

 

Compact U-Net architecture

Pruning 후 generation score의 차이를 측정하여 민감도 분석. 높을수록 제거가 가능함을 의미한다.

 

Fewer blocks in the down and up stages

Down stages

첫 번째 RA pair가 변경된 공간 정보를 처리하기 때문에 더 중요하다. 민감도 분석과도 일치.

따라서 두 번째 RA pair를 제거.

 

Up stages

Down stage의 두 번째 RA pair와 잔차 연결된 RA pair 제거.

 

Removal of the entire mid-stage

민감도 분석에 따라 기여도가 낮은 Mid stage를 제거. 피라미터를 11% 줄일 수 있다.

 

Further removal of the innermost stages

민감도 분석에 따라 가장 작은 해상도의 Up/Down block 제거.

 

Distillation-based retraining

학생 모델 S가 ground truth를 예측하고

 

교사 모델의 출력을 모방하고

 

각 해상도의 마지막 단계에서 feature map이 일치하는지 확인한다.

 

Total Loss:

 

 

 

Experiments