입력 2026.05.20 11:08
- 융합대학 디지털애널리틱스융합협동과정 연구팀, 제로샷 이상 탐지 新 패러다임 제시
연세대학교(총장 윤동섭) 인공지능융합대학 디지털애널리틱스융합협동과정 박유랑 교수 (의과대학 의생명시스템정보학교실) 연구팀의 논문이 세계 최고 권위의 컴퓨터 비전 및 인공지능 국제 학술대회인 CVPR 2026(IEEE/CVF Conference on Computer Vision and Pattern Recognition)에 최종 채택됐다.
전기전자기술자협회(IEEE)와 국제컴퓨터비전재단(CVF)이 공동 주최하는 CVPR은 인공지능 컴퓨터 비전 분야에서 가장 영향력이 큰 국제학술대회로, 구글 스칼라(Google Scholar) h-인덱스(h-index) 기준 450으로 전 분야 2위(1위 Nature)에 해당하는 막대한 영향력의 국제학술대회이다. 이번 CVPR 2026에는 총 16,092편의 논문이 투고됐으며 4,090편만이 채택(채택률 25.42%)됐다. 치열한 경쟁을 뚫고 선정된 이번 연구는 세계적 수준에 오른 연세대 인공지능융합대학의 AI 연구역량을 다시 한번 입증하는 계기가 됐다. 연구팀은 오는 6월 미국 콜로라도주 덴버(Denver)에서 개최되는 학회에서 직접 논문을 발표하고 연구 성과를 공유할 예정이다.
채택된 논문 'MoECLIP: Patch-Specialized Experts for Zero-shot Anomaly Detection'은 제조·의료 등 산업 현장에서 핵심 기술로 부상 중인 제로샷 이상 탐지(Zero-Shot Anomaly Detection, ZSAD) 분야의 근본적 한계를 극복하는 새로운 인공지능 모델 MoECLIP을 제안했다. 제로샷 이상탐지란 학습 과정에서 보지 못한 새로운 유형의 불량·이상 패턴을 별도의 재학습 없이도 이미지에서 이상을 탐지하는 기술로, 최근 대규모 비전-언어 모델인 CLIP의 뛰어난 일반화 능력을 활용한 연구들이 국제적으로 주목받고 있다.
기존 연구들은 이미지 내 모든 패치에 동일한 변환을 획일 적용하는 '패치 무관(patch agnostic)' 방식으로, 물체 본체·배경·이상 영역 등 패치별 고유 특성을 반영하지 못하는 한계가 있었다. 이를 극복하고자 연구팀은 혼합 전문가(Mixture-of-Experts, MoE) 아키텍처 기반의 MoECLIP을 제안했다. MoECLIP은 이미지 내 각 패치를 고유 특성에 따라 경량 저차원 적응(LoRA) 전문가 모듈로 동적으로 라우팅함으로써 패치 단위의 세밀하고 특화된 적응을 최초로 실현했다. 또한, 전문가 모델 간에 발생할 수 있는 기능 중복(functional redundancy)을 해소하기 위해 입력 특성 공간을 직교 분리하는 'FOFS'와 출력 벡터의 최대 등각 구조를 유도하는 'ETF 손실 함수'도 함께 도입했다.
산업·의료 도메인 14개 벤치마크 데이터셋 실험 결과, MoECLIP은 이미지 수준 분류와 픽셀 수준 분할 모두에서 기존 최고 성능(SOTA) 대비 상당한 성능 향상을 달성했고 산업용 데이터로만 학습한 모델이 뇌 MRI, 간 CT, 대장 내시경 등 의료 영상에서도 강건한 성능을 보인 점이 특히 주목된다고 연구팀은 설명했다.
박유랑 교수는 "본 연구는 CLIP의 강력한 일반화 능력을 보존하면서도, 이미지 내 각 패치의 고유한 특성을 전문화된 전문가 모델이 개별적으로 처리하도록 함으로써 이상 탐지의 정확도와 효율성을 동시에 획기적으로 향상시켰다"며, "향후 반도체·디스플레이 등 정밀 제조 현장의 불량 검사 자동화, 병리 슬라이드 및 의료 영상에서의 이상 소견 자동 탐지 등 다양한 분야에서 실질적인 파급 효과를 가져올 것으로 기대한다"고 밝혔다.
한편, 연세대 인공지능융합대학 디지털애널리틱스융합협동과정은 인문·사회·이공학·의학 분야를 아우르는 학제적 융합 데이터사이언스 전문 인재 양성을 위해 설립된 연세대 최초의 융합 실용 일반대학원 과정으로, 인공지능 시대를 선도하는 데이터 사이언티스트 배출을 목표로 활발한 연구 활동을 이어가고 있다. 이번 연구는 산업통상자원부 디지털헬스산업 전문인력양성 사업의 지원으로 수행됐다.