최민진 석박통합과정, 정윤기 석사과정 WSDM 2021 국제 학술대회 논문 채택
23 Oct 2020
DIAL 연구실 소속 소프트웨어학과 최민진(석박통합과정, 제1저자) 학생, 정윤기(석사과정, 제2저자) 학생, 이준석(구글 리서치, 제3저자) 박사, 이종욱(교신저자) 교수가 연구한 “Local Collaborative Autoencoders” 논문이 데이터마이닝 분야 최우수 국제 학술대회인 ACM International Conference on Web Search and Data Mining (ACM WSDM 2021)에 최종 게재가 승인되었고, 3월에 발표될 예정입니다.
이 연구에서는 추천 시스템을 위해 사용되는 사용자-항목 상호작용 데이터의 복잡성과 희소성 문제를 지역 모델의 활용을 통해 해결하고 있습니다. 제안 모델인 지역적 협업 오토인코더(Local Collaborative Autoencoders)는 여러 개의 지역 모델을 활용하여 다양한 사용자 군을 여러 개의 하위 커뮤니티로 분류하여 학습함으로써, 각각의 지역 모델이 서로 다른 특성을 포착할 수 있도록 하여 개인에게 더 적합한 추천을 제공합니다. 이 연구의 주요 공헌은 다음과 정리할 수 있습니다. 첫째, 학습 단계와 추론 단계에서 서로 다른 범위의 커뮤니티를 활용하여 지역 모델이 잘 학습될 수 있도록 합니다. 둘째, 지역 모델의 적용 범위를 최대화할 수 있는 하위 커뮤니티 탐색 방법을 사용함과 동시에 많은 수의 지역 모델을 사용하여 지역 모델의 활용을 극대화하였습니다. 셋째, 비선형성을 포착할 수 있는 오토인코더를 기본 모델로 활용하여 하위 커뮤니티에 내재한 의미 있는 정보를 추출할 수 있습니다. 마지막으로, 여러 데이터셋에서 철저한 검증을 통해 제안 모델이 충분히 확장 가능하며, 기존 추천 모델 대비 높은 정확도를 보이는 것을 확인하였습니다.
“Local Collaborative Autoencoders”, Minjin choi, Yoonki Jeong, Joonseok Lee, Jongwuk Lee. ACM International Conference on Web Search and Data Mining 2021 (WSDM 2021)
Top-N recommendation is a challenging problem because complex and sparse user-item interactions should be adequately addressed to achieve high-quality recommendation results. The local latent factor approach has been successfully used with multiple local models to capture diverse user preferences with different subcommunities. However, previous studies have not fully explored the potential of local models, and failed to identify many small and coherent sub-communities. In this paper, we present Local Collaborative Autoencoders (LOCA), a generalized local latent factor framework. Specifically, LOCA adopts different neighborhood ranges at the training and inference stages. Besides, LOCA uses a novel sub-community discovery method, maximizing the coverage of a union of local models and employing a large number of diverse local models. By adopting autoencoders as the base model, LOCA captures latent non-linear patterns representing meaningful user-item interactions within sub-communities. Our experimental results demonstrate that LOCA is scalable and outperforms stateof-the-art models on several public benchmarks, by 2.99–4.70% in Recall and 1.02–7.95% in NDCG, respectively.