반응형 Multimodal1 [논문 리뷰] Debiasing Multimodal Large Language Models viaNoise-Aware Preference Optimization 최근에 MLLM의 편향에 대해 다루는 연구 프로젝트를 진행 하고 있다. 여러 논문을 공부 중에 Debiasing 논문 중 가장 최근에 나온 것을 블로그에 올려보고자 한다. 1쪽: Abstract + Figure 1 (문제 정의)핵심 문제MLLM은 종종 모달리티 편향(modality bias) 으로 인해 한 모달(텍스트 또는 이미지)에 과도 의존 → 다른 모달의 핵심 정보를 무시 → 틀린 초점/불필요한 출력 발생.두 대표 유형언어 편향(Language bias): 이미지의 증거를 무시하고 텍스트 사전지식에 끌림.비전 편향(Vision bias): 질문과 무관한 이미지 디테일을 장황하게 나열.결과 요지VLind-Bench(편향), Object/MMHal/AMBER(환각)에서 편향·환각 동시 감소.코드/데.. 2025. 8. 23. 이전 1 다음 반응형