목록U-Net (1)
코딩딩딩

1. 영상 패치 임베딩 - Image patch embedding이미지를 작은 패치 단위로 분할하는 과정이다. 지역적 특징 잘 포착할 수 있고, 큰 이미지를 다루는데에도 효율적이다.- 임베딩 패치의 단계[1] 단어처럼 이미지를 패치 단위로 나눈다. [2] 분활된 이미지를 N차원 공간에 매핑한다. 패치 평탄화: 각 패치를 1차원 벡터로 변환한다.2. Vision Transformer - ViTVision Transformer는 Transformer 아키텍처를 이미지 분류에 적용한 모델이다. 이미지 데이터를 패치 단위로 처리하며, 자연어 처리에서 성공적으로 활용된 Transformer의 강점을 비전 분야로 확장한 방식이다. CNN과 함께 사용되거나, 독립적으로 더 높은 성능을 발휘하는 경우도 있다.-..
인공지능/개념
2024. 12. 7. 12:00