본문 바로가기

논문 리뷰/Concept

Self-Conditioning

Self-Conditioning in Analog Bits: Generating Discrete Data using Diffusion Models with Self-Conditioning


 

일반적인 diffusion sampling에서는 x0를 반복적으로 예측하며 이 예측값은 바로 폐기된다. (a)

 

Self-conditioning은 이 예측값을 버리지 않고 다음 예측에 대한 조건으로 사용하는 것이다. (b)

 

0는 이전 예측값을 재사용할 뿐이고 stop_gradient를 통해 역전파가 흐르지 않으므로 무시할 수 있는 만큼의 추가 비용이 발생한다.

 

훈련 시 일정 확률(e.g. 50%)로 해당 컨디셔닝을 사용한다.

 

'논문 리뷰 > Concept' 카테고리의 다른 글

Rotary Position Embedding (RoPE)  (0) 2024.03.04
Constitutional DPO  (0) 2024.02.05
R1 Gradient Penalty  (1) 2023.12.01
Score Distillation Sampling  (1) 2023.11.30