DPM-Solver++: Fast Solver for Guided Sampling of Diffusion Probabilistic Models

DPM-solver에서 속도 개선, guided sampling에서도 작동되게 개선.

Abstract

Guided sampling을 위한 DPM-solver.

또한 임계값 방법과 DPM-solver++의 multi-step 변형 제안.

DPM-solver에서는 유도(guided) 샘플링에 대해 제대로 조사하지 않았다. 유도 샘플링의 경우 단순한 1차 solver인 DDIM보다도 좋지 않았다고 한다.

데이터 예측 매개 변수화로 ODE를 해결하기 위한 solver를 도출하고, train-test 불일치 문제를 완화하기 위해 동적 임계값 방법을 채택한다. 또한, 불안정 해결을 위해 다단계 solver를 개발.

Guided Sampling

고차 ODE solver의 유도 샘플 품질은 1차 ODE인 DDIM보다 나쁘다. 큰 지침 척도는 ODE solver의 수렴 범위에 영향을 미치며 고차 solver 일수록 더 예민하다.

또 다른 문제는 train-test 불일치이다. 데이터는 경계 구간 안에 있는데, 높은 지침 척도는 샘플을 경계 밖으로 떨어지게 한다.

표기법은 DPM-solver를 따름.

이전의 고차 solver는 노이즈 예측 모델 ε̃_θ를 위해 설계되었지만, 본 논문에서는 데이터 예측 모델 x_θ에 대한 ODE를 해결한다.

x_θ는 그 자체로 몇 가지 이점이 있으며 경계를 유지하기 위한 임계값 방법을 적용할 수 있다.

DPM-solver에서 정리한 x_t의 해를

x_θ의 change-of-variable form으로 나타내면 다음과 같다.

DPM-solver에서와 똑같이 테일러 전개 이용

또 똑같이 오차항O(h)를 생략하면 추정해야 하는 것은 n차 미분항 x_θ⁽ⁿ⁾ 뿐이다.

k=1 일 경우 solver는 DDIM과 동일,

k=2 일 경우 DPM-solver와 같이 중간 시간 단계 s_i를 도입하고, s_i와 t_i-1의 함숫값을 결합하여 근사화하며 2M+1의 시간 단계가 필요하다.

위 알고리즘의 단일 단계 solver는 두 번의 function evaluation이 필요하고 중간 값 u_i는 한 번 쓰이고 버려지기 때문에 비효율적이다. 따라서 이 섹션에서는 각 단계에서 이전 정보를 사용하는 solver를 제안한다.

중간 값이 아니라 x̃_{t_i-1}과 x̃_{t_i-2}를 결합하여 x̃_{t_i}를 계산한다.

다단계 방법은 단일 단계 방법보다 2배나 적은 시간 단계(=더 적은 function evaluation)가 요구되므로 오차항 O(h)도 더 작다.

임계값 방법은 데이터 경계 내에서 원래 모델 x_θ를 요소별로 클리핑해 클리핑된 데이터 예측 모델 x̂_θ를 정의하는 것이다.

DPM-solver++는 x_θ를 위해 설계되었기 때문에 바로 결합할 수 있다.

DDIM도 일종의 1차 ODE-solver이며 DPM-solver++는 일종의 DDIM 고차 일반화이다.

GLIGEN: Open-Set Grounded Text-to-Image Generation (0)	2023.01.19
DiffStyler: Controllable Dual Diffusion for Text-Driven Image Stylization (1)	2023.01.16
What the DAAM: Interpreting Stable Diffusion Using Cross Attention (0)	2023.01.09
DPM-Solver : A Fast ODE Solver for Diffusion Probabilistic Model Sampling in Around 10 Steps (0)	2023.01.07
Null-text Inversion for Editing Real Images using Guided Diffusion Models (0)	2022.12.30
Prompt-to-Prompt Image Editing with Cross-Attention Control (0)	2022.12.29