<숭실대 전자정보공학부 권민혜 교수(사진=숭실대)>
숭실대학교(총장 이윤재)는 전자정보공학부 권민혜 교수 연구팀이 인공지능 분야 최고 권위의 국제학회 중 하나인 ‘ICML 2025(International Conference on Machine Learning)’에서 심층강화학습(Deep Reinforcement Learning) 관련 논문을 발표한다고 밝혔다.
매년 7월 개최되는 ICML은 ‘NeurIPS’와 함께 전 세계 인공지능 연구를 이끄는 양대 학술대회로 꼽힌다. 권 교수팀은 지난 2024년 12월 NeurIPS에서도 심층강화학습 분야 논문을 발표하며 해당 분야의 국제적 리딩 그룹으로 자리매김하고 있다. 특히, 이번 논문은 숭실대 대학원생이 학위 과정 중 수행한 결과라는 점에서 더욱 의미가 크다.
권 교수팀이 발표할 ‘TempDATA’는 오프라인 강화학습의 한계를 극복한 새로운 학습 알고리즘이다. 기존 강화학습 기법은 보상이 희박하고 작업 과정이 긴 환경에서 성능이 급격히 저하되는 한계가 있었지만, 연구팀은 상태 추상화(state abstraction)와 시간 거리(temporal distance) 개념을 결합해 이러한 문제를 해결했다. 특히, ‘TempDATA’는 실제 환경과의 직접 상호작용 없이 사전 수집된 데이터만으로도 효과적인 학습이 가능해, 로봇 제어, 자율주행 등 물리적 실패의 비용이 큰 분야에서 기존 기법의 강력한 대안으로 주목받고 있다.
권민혜 교수는 “복잡하고 예측 불가능한 환경에서도 로봇이 효율적으로 동작할 수 있도록 학습하는 AI 기술은 미래 산업의 핵심이 될 것”이라며, “이번 연구가 행동 중심 AI의 실질적 확산에 기여하길 기대한다”고 말했다.