DL| Weakly Supervised Semantic Segmentation (WSSS) 최신 연구 동향 정리

WSSS는 픽셀 수준 어노테이션 없이 이미지 수준 레이블만으로 의미론적 분할을 수행하는 기법, 대표적인 접근법들을 간략하게 정리

KL-Divergence Loss 간단 설명 BoostCampAITECH

DL| SegFormer

SegFormer는 효율성과 실시간 처리 능력을 강조한 Transformer 기반 semantic segmentation 모델로, hierarchical encoder와 lightweight MLP decoder를 통해 적은 연산량으로도 뛰어난 성능을 달성함, Overlapping patch merging, Efficient Self-Attention, Mix-FFN 등 구조적 혁신을 통해 기존 ViT 기반 모델의 한계를 극복

BoostCampAITECH

DL| HRNet

HRNet의 필요성부터 구조, 세부 구현 방식

BoostCampAITECH

DL| DeepLab v2, PSPNet DeepLab v3, DeepLab v3+(Xception) 정리

이전 포스트에 이어서 DeepLab v2의 ASPP, PSPNet의 Pyramid Pooling, DeepLab v3의 GAP 통합, DeepLab v3+의 Encoder-Decoder 구조 및 Xception 백본 수정까지 주요 모델들의 구조적 차이와 발전 과정을 비교하며 정리. Global Contextual Information 활용 방식 중심.

ASPP global contextual information BoostCampAITECH

DL| FCN의 Receptive Field를 개선한 DeepLabv1, DilatedNet 정리

FCN의 Receptive Field 문제를 해결하기 위한 기법으로 Dilated Convolution을 도입하고, 이를 기반으로 설계된 DeepLab v1과 DilatedNet의 구조와 특징, CRF 기반 후처리를 통한 정교한 예측 향상 방식

DeepLabv1 리뷰 DeepLab의 Atrous CNN DeepLab(2) Efficient Inference in Fully Connected CRFs with Gaussian Edge Potentials BoostCampAITECH

DL| FCN 기반 Semantic Semgnetaion 모델의 한계와 Decoder, Skip Connection을 통해 개선한 모델들 간략히 정리

FCN의 구조적 한계를 보완하기 위해 Decoder를 강화한 DeconvNet, SegNet과 Skip Connection을 활용한 FC DenseNet, U-Net의 구조적 특성

DeconvNet 리뷰 여러 유형의 Convolution BoostCampAITECH

DL| GAN, cGAN, SRGAN, Image-to-Image Translation(Pix2Pix, CycleGAN, Perceptual Loss)

cGAN 개념과 구조를 설명하고 Pix2Pix와 CycleGAN을 통해 이미지-이미지 변환 모델이 어떻게 설계되었는지, GAN의 한계를 보완하는 Perceptual Loss 방식과 SRGAN 등 고해상도 이미지 생성 방법, 응용 사례에는 뭐가 있는지

BoostCampAITECH

Pagination