입력 2026.04.23 14:25
- 사람 선호 반영부터 사실성 검증, 임베딩 안정성, 강건성 확보까지 신뢰 가능한 AI 핵심 과제 제시
- 연세대 학생 연구진, ICLR 2026서 상위 1%대 오럴 성과와 함께 AI 신뢰성 연구 성과 주목
연세대학교(총장 윤동섭) 응용통계학과 송경우 교수 연구실 학생 연구자들이 표현학습 및 딥러닝 분야의 세계적 권위의 국제학술대회인 ICLR 2026(International Conference on Learning Representations 2026)에서 논문 4편을 동시에 채택받는 성과를 거뒀다. 특히 채택 논문 가운데 ‘Semi-Supervised Preference Optimization with Limited Feedback(SSPO)’는 공식 오럴 발표 논문으로 선정돼, 225건의 오럴 세션 기준 전체 제출 논문 상위 1%대에 해당하는 뛰어난 연구 성과로 주목받고 있다.
채택된 논문은 총 네 편으로 ‘Semi-Supervised Preference Optimization with Limited Feedback’(이성균·임성준·박서진·천소은·송경우, 이하 SSPO), ‘Multi-LLM Adaptive Conformal Inference for Reliable LLM Responses’(노강준·이성찬·김일문·송경우, 이하 MACI), ‘Uncertainty-Driven Embedding Convolution’(임성준·노강준·최영준·이희영·송경우, 이하 UEC), ‘Spurious Correlation-Aware Embedding Regularization for Worst-Group Robustness’(박수빈·김주왕·이하경·유선재·송경우, 이하 SCER)이다.
이들 연구는 공통적으로 단순한 성능 향상을 넘어, 현실에서 더욱 신뢰하고 활용할 수 있는 인공지능 기술 구현에 초점을 맞췄다. SSPO는 소규모의 인간 피드백만으로도 언어모델이 사람의 선호도를 효과적으로 반영하도록 학습하는 방법을 제시했으며, MACI는 대규모 언어모델 응답의 사실성을 보다 정교하게 검증해 신뢰도와 효율성을 함께 높이는 방안을 제안했다. UEC는 입력 별 불확실성을 반영해 임베딩 결합의 성능과 안정성을 높였고, SCER는 우연한 상관관계에 의존하는 편향을 줄여 다양한 환경과 집단에서 더욱 강건하게 작동하는 모델 구현 가능성을 보여줬다. 이는 생성형 AI 시대의 핵심 과제를 폭넓게 다루며, 신뢰 가능한 AI 연구의 새로운 방향을 제시했다는 점에서 의미가 크다.
이번 성과는 연세대 학생 연구자들이 인공지능의 핵심 과제를 국제 학술무대에서 제시했다는 점에서 의미가 있다. 이성균, 노강준, 임성준, 박수빈을 비롯한 연구진은 사람 선호 반영의 효율성, 언어모델 응답의 사실성, 검색·추천 기반 기술의 안정성, 편향에 강한 모델의 강건성 등 인공지능 연구의 주요 과제를 폭넓게 다뤘다. ICLR 2026 논문 4편 동시 채택은 연세대 연구진의 연구 역량과 국제 경쟁력을 보여주는 성과로 평가된다.
해당 연구는 한국연구재단 중견연구자지원사업의 지원을 받아 수행됐다.