Fast Segment Anything (FastSAM)

SAM의 CNN version. 매우 빠름.

Abstract

SAM(Segment Anything Model)의 작업을 CNN 탐지기로 수행.

훨씬 적은 데이터셋과 빠른 속도로 SAM과 동일한 성능.

SAM은 ViT 때문에 계산 리소스 부담이 심함.

FastSAM에서는 segment 작업을 CNN 탐지기에 의한 all-instance segmentation과 prompt-guided selection 단계로 나눈다.

SA-1B 데이터셋의 2% 만으로 훈련하여 기존과 비슷한 성능을 보여주고 실행 속도도 50배 빠름.

YOLO v8-seg 백본에 YOLACT 적용. 다른 거 없음.

Flow-Guided Transformer for Video Inpainting (FGT) (0)	2023.10.12
FuseFormer: Fusing Fine-Grained Information in Transformers for Video Inpainting (0)	2023.10.10
StyleDrop: Text-to-Image Generation in Any Style (1)	2023.09.26
Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture (I-JEPA) (0)	2023.07.08
Recognize Anything: A Strong Image Tagging Model (RAM) (0)	2023.06.19
Tag2Text: Guiding Vision-Language Model via Image Tagging (0)	2023.06.19