반응형 컴퓨터비전15 [논문코드구현] PASCAL VOC dataset 사용하여 데이터 처리 해보기 저번에는 Bridging the Gap between Model Explanations in Partially Annotated Multi-label Classification 논문에 대해 리뷰 및 코드 구현을 해보았다. 교수님의 피드백을 받고 데이터셋의 변화와 데이터 처리에 대해 공부를 하며 블로그를 작성할 생각이다. 가장 먼저 교수님께서 피드백을 주셨던 부분은 데이터셋의 사용에 대한 부분이다. 사실 멀티라벨 분류 문제를 단일 라벨 데이터셋을 사용하고 데이터 전처리를 통해 멀티 라벨 데이터셋으로 바꾼다는 것은 이론상 말이 되지만 데이터셋 세부적으로 문제가 생길 수 있기 때문에 이 과정을 생략하고 멀티 라벨 데이터셋을 처리하는 법을 공부해보고 직접 구현해보라는 교수님의 말씀이 있었다. 그렇기.. 2024. 12. 21. [인공지능] CNN 구현, 코드 및 아키텍처 구조 설명 이 블로그는 국민대학교 김영욱 교수님의 "인공지능" 교과목을 듣고 과제를 리뷰로 작성한 블로그입니다. 오늘은 인공지능 수업의 두 번째 과제인 Multi-layer perceptron, Convolution Neural Netwrok 구현을 해보았다. 그 중에서도 CNN 구현을 한것에 대해 리뷰를 해보겠다. ResNet을 사용하여 성능을 끌어올렸다코드와 아키텍처 구조, 작동 매커니즘에 대해 알아보자. 다음 모델은 CIFAR-100 데이터셋의 복잡한 이미지 분류 작업을 효과적으로 처리하기 위해 설계되었으며, 깊은 네트워크 구조를 통해 우수한 성능을 보였다. # PyTorch 라이브러리 import *** 해당 cell을 수정하지 말 것 ***import torchimport torch.n.. 2024. 11. 11. [Computer Vision] Otsu Algorithm, 오츄 이진화 알고리즘 이 블로그는 국민대학교 윤상민 교수님의 Computer Vision 교과목을 듣고 작성한 블로그입니다. 오늘은 중간고사 정리 겸, 이진화 영상과 Otsu 알고리즘에 대해 알아보겠다. 가장 먼저, 컴퓨터 비전에서 이진화란, 명암 영상을 흑과 백으로만 이루어진 이진 영상으로 변환하는 것을 말한다. $b(j,i) = \begin{cases} 1, & \text{if } f(j,i) \geq T \\ 0, & \text{if } f(j,i) 오츠 알고리즘(Otsu algorithm)은 이미지의 이진화(binary thresholding)를 자동으로 수행하기 위한 방법이다. 이 알고리즘은 이미지의 히스토그램을 분석하여 최적의 임계값(threshold)을 찾아 배경과 전경을 분리한다. .. 2024. 10. 19. [논문리뷰] Co-teaching: Robust Training of Deep Neural Networks with Extremely Noisy 지능형 컴퓨터 비전 랩실에서 학부연구생 활동을 시작하고 교수님과 미팅 결과, 현재 Vision 쪽 관심 분야인 Remote sensing image, satelite image deep learning 탐구를 위해 Data labeling, Denoising 쪽 논문을 쭉 읽어보기로 하였다. 논문: “Co-teaching: Robust Training of Deep Neural Networks with Extremely Noisy Labels” 이 논문은 딥러닝 모델이 매우 노이즈가 많은 라벨 환경에서도 견고하게 학습할 수 있도록 새로운 학습 패러다임인 Co-teaching을 소개한다. 배경과 문제 인식 딥러닝 모델은 높은 학습 용량을 가지고 있어, 결국 노이즈가 있는 라벨까지 암기하게 된다. 이는 모델.. 2024. 10. 15. 이전 1 2 3 4 다음 반응형