본문 바로가기
반응형

data preprocessing3

[논문 코드 리뷰] Instance Dependent Multi Label Noise Generation for Multi-Label Remote Sensing Image Classification 데이터 전처리, 메인 코드 리뷰 위성 사진 데이터셋에 대해 공부하고 있어서 위성사진 데이터처리 공부중에 교수님의 논문의 Instance depedent noise generation 이라는 방법론이 눈에 띄여 데이터처리 과정 코드 리뷰을 해보기로 했다.       위 그림은 사전학습된 CLIP 모델을 이용해 remote sensing image를 멀티라벨로 예측(Zero-shot prediction)하는 전체 과정을 나타낸다. 이미지를 CLIP의 이미지 인코더에 입력 → 이미지 임베딩 추출하고, 텍스트를 CLIP의 텍스트 인코더에 입력 → 텍스트 임베딩 추출. 각각의 이미지 임베딩과 텍스트 임베딩 사이의 유사도를 내적하여, 어떤 label과 가장 밀접한지 확인한 후, 결과로부터 Zero-shot prediction score가 산출되어.. 2024. 12. 29.
[논문코드구현] PASCAL VOC dataset 사용하여 데이터 처리 해보기 저번에는 Bridging the Gap between Model Explanations in Partially Annotated Multi-label Classification 논문에 대해 리뷰 및 코드 구현을 해보았다. 교수님의 피드백을 받고 데이터셋의 변화와 데이터 처리에 대해 공부를 하며 블로그를 작성할 생각이다.      가장 먼저 교수님께서 피드백을 주셨던 부분은 데이터셋의 사용에 대한 부분이다. 사실 멀티라벨 분류 문제를 단일 라벨 데이터셋을 사용하고 데이터 전처리를 통해 멀티 라벨 데이터셋으로 바꾼다는 것은 이론상 말이 되지만 데이터셋 세부적으로 문제가 생길 수 있기 때문에 이 과정을 생략하고 멀티 라벨 데이터셋을 처리하는 법을 공부해보고 직접 구현해보라는 교수님의 말씀이 있었다.   그렇기.. 2024. 12. 21.
[EECS 498-007] lec10. Training Neural Networks I *강의 영상*: https://www.youtube.com/watch?v=lGbQlr1Ts7w     저번 강의에서 Convolutional 신경망, 아키텍처 구축에 필요한 하드웨어와 소프트웨어에 대해 배웠다. 필수적이지만 기본적인 내용이었기에 블로깅은 스킵했다. Pytorch, Tensorflow 기본 구성요소와 작동방식이 궁금하면 아래 링크를 참고하자.  https://kmiiiaa.tistory.com/29 EECS 498-007 / 598-005 Lecture 9 : Hardware and Software이번 시간에는 딥러닝에서 쓰이는 하드웨어 - 소프트웨어 순으로 알아볼 것인데, 딥러닝에서의 연산은 CPU와 GPU를 주로 사용한다. 현재 대부분의 GPU는 NVIDIA와 AMD의 GPU가 쓰이고 .. 2024. 8. 15.
반응형