ESSIR 2023 후기 by Hye-young

19 Oct 2023 

지난 8월, 인공지능대학원에서 지원하는 해외 단기집중교육 프로그램에 선발되어 오스트리아 비엔나에서 열린 “The 14th European Summer School on Information Retrieval(ESSIR 2023)”에 다녀왔습니다. ESSIR은 정보 검색을 주제로 6일간 진행되는 여름 학교로, 다양한 국적의 교수님들과 학생들을 만나고 자유롭게 소통할 수 있는 행사였습니다. 이번 글에서는 ESSIR을 참석하며 들었던 강의들과 오스트리아 체류기간동안 방문하였던 여행지들을 함께 공유드리려고 합니다. 

Enjoy ESSIR!

Intoduction to IR

첫째날은 정보 검색과 평가 방법에 관한 기본적인 소개를 주제로 진행되었습니다. 본격적으로 심도깊은 주제의 정보 검색을 다루기 전,  IR 초심자도 재미있게 들을 수 있는 워밍업과 같은 날이었습니다.

Domain-Specific IR

ESSIR 2023은 도메인 특화 정보 검색(Domain-specific IR) 을 주제로 진행되었습니다. 강의에서 다룬 정보 검색 도메인은 법률, 의학, 특허, 학술 등 매우 다양했습니다. 특히 이번 ESSIR은 작년과 달리 각 도메인별 Group work도 진행하여 실제 도메인 특화 정보 검색 시스템의 동작 과정을 경험해보고, 같은 group 학생들과 소통할 수 있는 시간이 주어졌습니다. 도메인 특화 정보 검색에서 각 도메인별 다양한 challenge들을 보고 각각의 문제 해결 과정들을 배울 수 있는 유익한 시간이었습니다. 

Legal search

저는 legal search group work를  진행하였습니다. legal search는 말 그대로 법률 도메인에서의 정보 검색을 의미하는데요.

leagal search의 대표적인 예시로는 1) legal web search, 2) Prior case retrieval, 3) eDiscovery가 있습니다.



Challenges of legal search 

해결 방법 1. Full text에 word-based method(BM25) 활용.

해결 방법 2. 적절한 query term extraction 이후, 기존 retrieval models 활용. 

해결 방법 3. 문서를 truncate하거나 abstract만 활용. (보통 앞의 512 토큰만 활용한다고 함.)

해결 방법 4. Automatic summarization 활용.

해결 방법 5. 문단 단위의 retrieval 후, aggregation.

해결 방법이라고 볼 수 있는지는 모르겠으나, 도메인 특화 모델들이 존재!

scratch부터 domain language에 맞게 학습된 transformer모델 혹은 사전학습 모델 활용하여 도메인 데이터에 추가 학습.

Excursion

여름학교 기간 중 하루는 강의를 진행해주셨던 교수님들과 참가자들 모두 함께 짧게나마 비엔나 여행을 하는 시간을 가졌습니다. walk/easy가 아닌 climb/hard hike였습니다. 비엔나의 가장 높은 곳에 올라서 시내 전체를 내려다 보았습니다. 힘들었습니다.

School closing 

6일 간의 여름학교 일정이 모두 무사히 마무리되었습니다.

Enjoy, Enjoy Austria!!

할슈타트(Hallstatt) 여행

할슈타트는 오스트리아 서쪽에 위치한 작은 마을입니다. 영화 겨울왕국에 등장하는 ‘아렌델’의 배경이 된 곳으로 유명한데요, 본격적인 여름학교가 시작되기 전 할슈타트로 당일치기 기차여행을 다녀왔습니다. 할슈타트를 대표하는 백조와 사진도 찍고 마을 구석구석 산책도 했습니다. 

비엔나(Wien) 시내 여행

여름학교 기간 동안 수업을 마치고 틈틈이 시내 여행을 했습니다.  비포 선라이즈 촬영지인 프라터 놀이공원도 가고 빈 공과대학 바로 옆에 있던 카를 성당 앞에서 사진도 찍었습니다. 오스트리아 전통 음식인 타펠 슈피츠는 한국에서 먹는 갈비탕과 맛이 똑같았습니다.