[한국정경신문=변동휘 기자] 가상자산 거래소 업비트 운영사 두나무가 AI 연구 역량을 다시금 인정받았다.
두나무는 본사 머신러닝(ML)팀의 개인화 뉴스 추천 연구 논문이 국제 정보검색학회 ‘SIGIR 2025’에 채택돼 메인 콘퍼런스에서 발표했다고 17일 밝혔다.
두나무 머신러닝팀이 ‘SIGIR 2025’에서 논문을 발표했다. (사진=두나무)
‘SIGIR’은 정보검색 분야에서 가장 영향력 있는 국제 학회 중 하나다. 올해 제출된 논문의 약 27%만이 채택됐다.
올해 SIGIR의 메인 컨퍼런스는 13일부터 18일까지(현지 시각) 이탈리아 파도바 센트로 콩그레스에서 열린다. 두나무 머신러닝팀 박충원 연구원은 지난 14일 현장에서 자체 개발한 개인화 뉴스 추천 시스템 연구 성과를 직접 발표했다.
이번 발표 논문 제목은 ‘LLM(대규모 언어모델) 기반 사용자 시뮬레이터: 실제 사용자 상호작용 없이 뉴스 추천 모델을 학습하기 위한 방법론’이다. 실제 사용자 데이터 없이 LLM으로 가상의 이용자를 생성해 학습 데이터를 만들고 이를 바탕으로 뉴스를 추천하는 방안을 다뤘다.
기존 시스템과 비교해 이용자 로그에 대한 의존도를 대폭 해소했다는 점이 특징이다. 기존 뉴스 추천 방식은 머신러닝 모델의 학습을 위해 클릭 로그나 뉴스 선호도 등의 사용자 데이터를 수집해야 했다. 그러나 이는 대규모 데이터 확보의 어려움과 개인정보 침해 우려 문제가 있었다.
두나무 머신러닝팀은 이를 해결하기 위해 가상의 사용자를 시뮬레이션하는 ‘LAUS’라는 프레임워크를 개발했다. LAUS는 실제 사용자 데이터 대신 가상의 사용자를 생성해 다양한 상호작용 패턴을 만들어 학습 데이터를 만드는 방식이다.
연구 결과 LAUS는 기존 학습 데이터 없이도 뉴스를 추천하는 ‘제로샷’ 방식 대비 높은 성과를 보였다. 동시에 지연 시간도 짧게 유지하는 것으로 검증됐다. 노르웨이어나 영어 등 다양한 언어권의 뉴스 추천 시스템 벤치마크에서 실제 사용자 데이터로 학습된 모델과 유사한 수준의 성능을 보였다. 방대한 데이터를 별도 수집하지 않아도 고품질 개인화 서비스를 빠르게 구축할 가능성이 확인된 것이다.
박 연구원은 “개인화 뉴스 추천 시스템 품질은 이용자가 원하는 정보를 얼마나 정확히 제공하는가와 직결돼 서비스 만족도를 높이는 핵심 요소”라며 “이번 연구를 통해 고객 정보 보호와 운영 효율성을 모두 충족하면서 더욱 정교한 추천 서비스를 제공할 수 있는 기반을 마련하게 돼 기쁘다”고 밝혔다.
한편 두나무 머신러닝팀은 주식과 디지털 자산 시장에서 활용되는 AI 모델을 연구·개발 중이다. 지난해 11월 ‘콜링2025’에서 금융 허위정보 탐지 챌린지(FMD) 1위를 차지하는 등 글로벌 연구 역량을 다방면으로 인정받고 있다.