본문 바로가기

전체 글

(541)

Scalable Diffusion Models with Transformers (DiT) 확산 모델에 트랜스포머 백본. JAX로 구현됨. Arxiv Github Project Page Abstract 확산 모델에서 일반적으로 사용되는 U-Net 백본을 잠재 패치에서 작동하는 트랜스포머로 대체한다. 트랜스포머의 깊이/폭 증가 또는 입력 토큰의 증가가 더 낮은 FID를 갖는다는 것을 발견하였으며 class-conditional ImageNet 512, 256에서 이전의 모든 확산 모델을 능가한 2.27 FID를 달성하였다. Introduction 본 연구에서는 U-Net의 유도 편향이 확산 모델의 성능에 중요하지 않으며, 트랜스포머와 같은 표준 설계로 쉽게 대체될 수 있음을 보여준다. 또한 트랜스포머를 기반으로 한 새로운 확산 모델인 Diffusion Transformer(DiT)를 소개한다. ..

Improved Vector Quantized Diffusion Models 이산 확산 모델의 샘플링 전략 개선 Arxiv Github Abstract VQ-Diffusion에서 때때로 낮은 품질의 샘플이나 약한 상관관계의 이미지를 생성했는데, 주요한 원인 샘플링 전략 때문이라는 것을 발견하고 두 가지 중요한 기술을 제안한다. 이산 확산 모델에 대한 classifier-free guidance를 탐구하고 보다 일반적이고 효과적인 구현을 제안 VQ-Diffusion의 joint distribution 문제를 완화하기 위한 추론 전략 제안 Introduction VQ-Diffusion의 주요 장점 중 하나는 각 이산 토큰에 대한 확률을 추정할 수 있으므로 상대적으로 적은 추론 단계로 고품질 이미지를 생성한다는 것이다. 이를 바탕으로 VQ-Diffusion을 개선하기 위한 몇 가지 기..

Vector Quantized Diffusion Model for Text-to-Image Synthesis VQ-VAE + Diffusion + Masking Arxiv Github Abstract Diffusion + VQ-VAE + Masking. 확산으로 벡터 양자화에 의한 오차의 누적을 피하고 이미지 해상도에 따라 선형적으로 비용이 증가하는 선형 회귀 방법(AR)과 달리 엄청 빠르면서도 더 나은 품질을 보여준다. Introduction DALL-E와 같은 AR 방식의 단점 왼쪽 위에서 오른쪽 아래로 순차적으로 예측되기 때문에 편향 생김 추론 단계가 이전에 샘플링된 토큰을 기반으로 실행되기 때문에 앞선 토큰의 오차가 계속 누적되어 전파됨 따라서 확산 모델을 사용. 또한 네트워크 수렴을 위해 mask-and-replace 전략 사용. Background: Learning Discrete Latent Spa..

Paint by Example: Exemplar-based Image Editing with Diffusion Models Paint by Example 코드 리뷰, Paint by Example 써보기 예제 기반 이미지 편집(인페인팅) 모델 Arxiv Github Abstract 예제 기반 이미지 편집. Self-supervised training을 활용하여 소스와 예제를 분리시키고 재구성한다. 융합 아티팩트를 피하기 위해 information bottleneck과 강력한 증강을 제안함. 제어 가능성을 위해 classifier-free guidance를 사용하고 반복적인 최적화 없이 단일 forward로 진행된다. Introduction 먼저 예제 이미지를 조건으로 하는 확산 모델을 훈련한다. 텍스트 조건 모델과 달리 훈련 쌍을 수집하기가 힘들기 때문에 입력 이미지에서 개체를 잘라내어 사용한다. 하지만 위 방법은 문제가 있..

Classifier-Guidance Diffusion 논문 리뷰 Diffusion Models Beat GANs on Image Synthesis 논문 리뷰 Diffusion 모델 성능 개선, 분류기 가이드 도입 Github GitHub - openai/guided-diffusion Contribute to openai/guided-diffusion development by creating an account on GitHub. github.com Arxiv Diffusion Mo.. ostin.tistory.com 코드 GitHub - openai/guided-diffusion Contribute to openai/guided-diffusion development by creating an account on GitHub. github.com Clas..

Zero-Shot Image Restoration Using Denoising Diffusion Null-Space Model 사전 훈련된 확산 모델을 이용한 zero-shot 이미지 복원 모델 https://paperswithcode.com/paper/zero-shot-image-restoration-using-denoising Papers with Code - Zero-Shot Image Restoration Using Denoising Diffusion Null-Space Model Implemented in one code library. paperswithcode.com Abstract 추가 교육이나 네트워크 수정 없이 생성 prior로 사전 교육된 확산 모델만 있으면 되는 제로샷 이미지 복원 모델 Denoising Diffusion Null-Space Model (DDNM)을 제안. 이는 역확산 과정에서 null-sp..

Make-A-Video : Text-To-Video Generation Without Text-Video Data Meta AI에서 공개한 Text-to-Video 모델. 추후 코드 공개되면 수정. Project Page Arxiv Abstract Text-to-Image(T2I)의 엄청난 발전을 Text-to-Video(T2V)로 변환하기 위한 접근 방식을 제안한다. Make-A-Video(이하 MAV)는 T2V 모델의 훈련을 가속화하고 텍스트-비디오 데이터 쌍이 필요하지 않으며 발전된 이미지 생성 모델의 장점을 계승한다. 또한 full temporal U-Net과 attention tensor를 분해하여 시간과 공간에 근사하고 다양한 응용을 위해 비디오 디코더, 보간 모델, 초해상도 모델을 사용하여 시공간 파이프라인을 설계한다. Previous Work Cascade Diffusion Model GLIDE Ima..

Improved DDPM 논문 리뷰 Improved Denoising Diffusion Probabilistic Models : Improved DDPM DDPM을 개선시킨 논문을 발견하게 되어 공부하게 되었습니다. DDPM에 대해 한층 더 잘 알게된 경험이었어서 꼭 한번쯤 읽어보시는걸 추천드립니다 :) Introduction 본 논문에서 제시하는 바는 3가지 입 deepseow.tistory.com Code Source https://github.com/lucidrains/denoising-diffusion-pytorch GitHub - lucidrains/denoising-diffusion-pytorch: Implementation of Denoising Diffusion Probabilistic Model in Pytorc..

Denoising Diffusion Pytorch https://github.com/lucidrains/denoising-diffusion-pytorch GitHub - lucidrains/denoising-diffusion-pytorch: Implementation of Denoising Diffusion Probabilistic Model in Pytorch Implementation of Denoising Diffusion Probabilistic Model in Pytorch - GitHub - lucidrains/denoising-diffusion-pytorch: Implementation of Denoising Diffusion Probabilistic Model in Pytorch github.com https://huggingface.co..

DreamBooth : Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation Text-to-image 확산 모델에 원하는 대상의 시각적 특징 바인딩 Github Arxiv Abstract 이미지 몇 개만 입력하면 사전 훈련된 text-to-image 모델을 finetuning 하여 고유 식별자를 해당 특정 대상에 바인딩하는 방법을 학습한다. 고유 식별자를 사용하여 다른 장면에서 맥락화 된 대상의 완전히 새로운 사실적 이미지를 합성할 수 있다. Introduction Text-to-image 확산 모델의 "개인화"를 위한 새로운 접근 방식을 제시한다. 본 논문의 목표는 대상의 이미지 몇 개(3~5)가 주어지면 고유 식별자로 합성될 수 있도록 모델의 출력 도메인에 대상을 이식하는 것이다. 이를 희귀 토큰 식별자로 주어진 대상을 표현하고 두 단계로 작동하는 사전 훈련된 확산 기반 초해..

Cold Diffusion : Inverting Arbitrary Image Transforms Without Noise 노이즈 이외의 다른 이미지 저하 방법을 위한 새로운 샘플링 알고리즘 Arxiv Github Abstract 연구진은 확산 모델의 생성적 동작이 이미지 저하의 선택에 크게 의존하지 않는다는 것을 관찰했으며 완전히 결정적인 저하(blur, masking 등)를 사용하는 경우에도 규칙을 쉽게 일반화하여 생성 모델을 만들 수 있다. 이러한 완전 결정론적 모델의 성공은 gradient Langevin dynamics 또는 변분 추론의 노이즈에 의존하는 확산 모델에 대한 의문을 제기하고 일반화된 확산 모델의 길을 열어준다. Introduction 본 논문에서는 확산 모델이 실제로 작동하기 위해 가우스 잡음과 같은 랜덤성의 필요를 조사하고 확산 모델이 생겨난 이론적 프레임워크의 범위 밖에 있는 일반화된 확산 모델을 ..

Diffusion 논문 분류 GuidanceDiffusion Models Beat GANs on Image Synthesis : 분류기 가이드를 통한 다양성-품질 trade-offClassifier-Free Diffusion Guidance : 분류기 없는 가이드로 다양성-품질 trade-offSelf-Attention Guidance : 샘플의 fine-grained feature를 자체적인 지침으로 사용 SamplingCold-Diffusion : 노이즈 이외의 다른 이미지 저하 방법을 위한 새로운 샘플링 알고리즘DPM-Solver : ODE solver를 이용한 빠르고 고품질의 샘플링DPM-Solver++ : 속도 개선, guided sampling에서도 작동되게 개선Rectified Flow : 직선 경로를 통해 분포를 전송..

이전 1 ··· 35 36 37 38 39 40 41 ··· 46 다음

티스토리툴바