본문 바로가기
반응형

분류 전체보기46

[논문 코드 리뷰] Instance Dependent Multi Label Noise Generation for Multi-Label Remote Sensing Image Classification 데이터 전처리, 메인 코드 리뷰 위성 사진 데이터셋에 대해 공부하고 있어서 위성사진 데이터처리 공부중에 교수님의 논문의 Instance depedent noise generation 이라는 방법론이 눈에 띄여 데이터처리 과정 코드 리뷰을 해보기로 했다.       위 그림은 사전학습된 CLIP 모델을 이용해 remote sensing image를 멀티라벨로 예측(Zero-shot prediction)하는 전체 과정을 나타낸다. 이미지를 CLIP의 이미지 인코더에 입력 → 이미지 임베딩 추출하고, 텍스트를 CLIP의 텍스트 인코더에 입력 → 텍스트 임베딩 추출. 각각의 이미지 임베딩과 텍스트 임베딩 사이의 유사도를 내적하여, 어떤 label과 가장 밀접한지 확인한 후, 결과로부터 Zero-shot prediction score가 산출되어.. 2024. 12. 29.
[논문코드구현] PASCAL VOC dataset 사용하여 데이터 처리 해보기 저번에는 Bridging the Gap between Model Explanations in Partially Annotated Multi-label Classification 논문에 대해 리뷰 및 코드 구현을 해보았다. 교수님의 피드백을 받고 데이터셋의 변화와 데이터 처리에 대해 공부를 하며 블로그를 작성할 생각이다.      가장 먼저 교수님께서 피드백을 주셨던 부분은 데이터셋의 사용에 대한 부분이다. 사실 멀티라벨 분류 문제를 단일 라벨 데이터셋을 사용하고 데이터 전처리를 통해 멀티 라벨 데이터셋으로 바꾼다는 것은 이론상 말이 되지만 데이터셋 세부적으로 문제가 생길 수 있기 때문에 이 과정을 생략하고 멀티 라벨 데이터셋을 처리하는 법을 공부해보고 직접 구현해보라는 교수님의 말씀이 있었다.   그렇기.. 2024. 12. 21.
[논문 코드구현] Bridging the Gap between Model Explanations in Partially Annotated Multi-label Classification 오늘은 교수님의 내주셨던 과제인 Code reproduction 을 해보겠다.다중 레이블 분류 문제에 기여한 논문인 Bridging the Gap between Model Explanations in Partially Annotated Multi-label Classification 에 대해 논문 리뷰와 코드를 살펴봤었다.   논문링크:https://openaccess.thecvf.com/content/CVPR2023/html/Kim_Bridging_the_Gap_Between_Model_Explanations_in_Partially_Annotated_Multi-Label_CVPR_2023_paper.html CVPR 2023 Open Access RepositoryBridging the Gap Betw.. 2024. 11. 26.
[인공지능] CNN 구현, 코드 및 아키텍처 구조 설명 이 블로그는 국민대학교 김영욱 교수님의 "인공지능" 교과목을 듣고 과제를 리뷰로 작성한 블로그입니다.  오늘은 인공지능 수업의 두 번째 과제인 Multi-layer perceptron, Convolution Neural Netwrok 구현을 해보았다. 그 중에서도 CNN 구현을 한것에 대해 리뷰를 해보겠다. ResNet을 사용하여 성능을 끌어올렸다코드와 아키텍처 구조, 작동 매커니즘에 대해 알아보자.        다음 모델은 CIFAR-100 데이터셋의 복잡한 이미지 분류 작업을 효과적으로 처리하기 위해 설계되었으며, 깊은 네트워크 구조를 통해 우수한 성능을 보였다.   # PyTorch 라이브러리 import  *** 해당 cell을 수정하지 말 것 ***import torchimport torch.n.. 2024. 11. 11.
반응형