본문 바로가기
반응형

분류 전체보기46

2025 Computer Vision 분야 트렌드, 동향 분석하기 인공지능 main stream 분야 COMPUTER VISION 분야의 2025년 동향을 파악하기 CVPR 2024를 분석하여 블로그를 작성한다. https://public.tableau.com/app/profile/joshpreston/viz/CVPR2024/CVPRtrends CVPR 2024CVPR 2024public.tableau.com 다음 링크는 The IEEE/CVF Conference on CVPR(Computer Vision and Pattern Recognition) 2024 이라는 vision 분야의 Top tier 학회에 accept 되었던 논문을 시각화, 정리해놓은 Tableau Public 이다. Top 100을 활용하여 동향 및 트렌드를 분석해보겠다. 블로그와 Tableau P.. 2025. 3. 9.
[논문 뜯어보기] DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 오늘은 Deepseek 연구팀의 R1 모델과 paper review 를 해보고 이를 둘러싼 controversies, discussions에 대해 알아보겠다. 논문 발제, 리뷰는 공동 발제로 빅데이터 연합 동아리 BOAZ에서 이루어졌다.     DeepSeek-V3 키포인트 잡기 DeepSeek-V3는 671억 개의 하이퍼 파라미터를 가진 MOE(Mixture of Experts) 기반의 대규모 언어모델이다. 이 모델로 pre-training 을 진행하면 일반적인 텍스트 생성 등 뛰어난 NLP task들을 처리 할 수 있다. V3는 R1을 리뷰할때의 필요한 요소에 대해서만 간단히 짚고 넘어가겠다.      다음은 DeepSeek-V3의 아키텍처인데, 기존 MoE 모델과의 차이점이 존재한다. FFN 블럭은.. 2025. 2. 14.
[논문 리뷰] OCELOT: Overlapped Cell on Tissue Dataset for Histopathology 현재 서울대병원 연구실에서 산학으로 병리 AI에 관한 캡스톤 프로젝트를 진행 중에 있다.연구에 도움이 될 만한 Medical AI, Computational Pathology 분야의 중요한 논문인 OCELOT 논문 발제를 위한 리뷰를 해보겠다. 공동 발제자 티스토리 링크:https://kmuhan-study.tistory.com/ kmuhan의 도움이 되는 개발나의 배움 너에게 가르침kmuhan-study.tistory.com   Background & Motivation 기존 세포 검출 연구는 고배율 패치에만 초점을 맞추는 경향이 있었다. 그러나 병리학자는 일반적으로 넓은 시야(FoV)를 통해 먼저 조직의 구조를 이해한 후, 세부적으로 개별 세포를 분석한다. 이를 고려하여 OCELOT 데이터셋은 세포와.. 2025. 1. 20.
[논문 리뷰] CLIP: Learning Transferable Visual Models From Natural Language Supervision 교수님께서 추천하신 vision-language multi modal 의 Baseline model인  CLIP 논문을 읽고 정리해보았다.  Abstract기존의 컴퓨터 비전 모델들은 주어진 고정된 레이블 집합을 예측하도록 훈련되는 경우가 많다. 따라서 새로운 범주의 이미지를 분류하려면 추가 라벨링 작업(“나비” 대신 “잠자리”와 같은 새로운 카테고리)에 의존해야 한다.NLP 분야는 방대한 웹 텍스트를 활용하여 자연어 자체로 풍부한 감독(supervision)을 얻어내고 있으며, GPT-3 같은 사례를 통해 대규모 프리트레이닝 + 제로샷(Zero-shot)으로도 많은 태스크를 수행 가능해졌다. After pre-training, natural language is used to reference lear.. 2025. 1. 20.
반응형