서울시립대 전종준 교수 연구팀, 인공지능 분야 최우수 국제학술대회‘AAAI 2026’논문 채택

서울시립대 전종준 교수 연구팀, 인공지능 분야 최우수 국제학술대회‘AAAI 2026’논문 채택

입력 2025.11.17 13:55

- 결측치 불확실성까지 반영한 새로운 데이터 대치 모델 ‘U-VAE’ 개발

< 그림1. 제안하는 결측치 대치 방법론의 프레임워크 >
< 사진2. (좌측부터) 통계학과 전종준 교수, 임재성 박사과정 >
  서울시립대학교(총장 원용걸)는 통계데이터사이언스학과 전종준 교수 연구팀의 논문이 인공지능 분야 최우수 국제학술대회인 ‘AAAI (Association for the Advancement of Artificial Intelligence) 2026’의 Main Technical Track에 채택됐다고 밝혔다.
  AAAI는 인공지능 분야에서 세계적으로 권위 있는 학술대회로, BK 우수국제학술대회(인정 IF 4.0)로 등록되어 있다. 올해 학술대회에는 약 31,000편의 논문이 제출되었으며, 그 중 4,167편이 채택되는 높은 경쟁률을 보였다. 2026년 AAAI 학술대회는 2026년 1월 20일부터 1월 27일까지 싱가포르 엑스포에서 개최될 예정이다.
  이번에 채택된 논문 ‘Impute Missing Entries with Uncertainty’(불확실성을 반영한 결측 자료 대치)는 실제 데이터 수집 과정에서 필연적으로 발생하는 결측치 문제를 보다 정교하게 해결할 수 있는 새로운 접근법을 제시했다. 결측 데이터는 응답자의 미응답, 의료 기록의 누락, 측정 오류 등 다양한 원인으로 발생하며, 이는 단순한 빈칸이 아니라 통계적 분석의 신뢰성을 흔드는 근본적 불확실성의 요인이 된다. 그동안 다양한 단일 및 다중 대치 기법들이 사용돼 왔지만, 많은 방법들이 이러한 불확실성을 충분히 반영하지 못하거나 특정 분포를 가정해 실제 데이터의 복잡한 조건부 분포를 포착하지 못하는 한계를 갖고 있었다.
  연구팀이 제안한 U-VAE는 결측값의 조건부 분포 전체를 비모수적으로 근사하도록 설계한 것이 특징이다. 이를 위해 CRPS(Continuous Ranked Probability Score)를 재구성 손실함수로 도입하고, 실제 데이터 환경에서는 결측치의 실제 값이 존재하지 않는다는 현실적 제약을 고려해 re-masking/un-masking 기법을 활용해 다양한 결측 패턴을 학습하도록 했다. 또한, 제안된 대치 분포가 실제 조건부 분포와 이론적으로 얼마나 가까운지를 보여주는 KL divergence 상계(upper bound)를 증명해 모델의 이론적 타당성을 확보했다. U-VAE는 11개의 실제 테이블 데이터에서 단일 및 다중 대체 모두에서 기존 모델 대비 우수한 성능을 보였다. 
  이번 연구는 과학기술정보통신부(한국연구재단)의 데이터사이언스 융합인재양성사업과 개인기초연구사업(중견연구) ‘언어모형을 이용한 분포학습 연구’의 지원을 받아 수행됐다. 연구에는 서울시립대학교 통계데이터사이언스학과 임재성 박사과정생과 국립인천대학교 정보통신공학과 안승환 교수가 공동 제1저자로 참여했으며, 전종준 교수가 교신저자를 맡았다.
  전종준 교수는 “이번 연구는 단순히 값을 채워 넣는 수준을 넘어 결측치의 불확실성까지 모델링하는 방법을 제시했다는 점에서 의미가 크다”고 말했다. 
  또한 연구팀은 언어모형을 이용한 결측 대치 방법론을 개발하는 후속 연구도 이어서 진행하고 있다.
내가 본 뉴스 맨 위로

내가 본 뉴스 닫기