수업 내용 리마인드 및 아카이빙 목적의 업로드 토픽 모델링(Topic Modeling) 들어보셨나요? 문서들이 많을 때, 그 문서들이 어떤 주제를 다루고 있는지 자동으로 찾아내는 기법을 말해요. 예를 들어, 우리가 뉴스 기사를 수백 개 모아 놓고 주제별로 분류하려고 할 때 이 기법을 활용할 수 있답니다. 그중에서도 특히 많이 쓰이는 방법이 바로 LSA(잠재 의미 분석)와 LDA(잠재 디리클레 할당)예요. 오늘은 이 두 가지 기법을 하나하나 차근차근 설명해드릴게요. 1. 토픽 모델링이란? 토픽 모델링은 말 그대로 문서 속에서 주제(토픽)를 찾아내는 기법이에요. 예를 들어, 어떤 문서가 "경제"와 "기술"에 대한 이야기를 하고 있다면, 그 문서에서 "경제"와 "기술" 관련 단어들이 많이 등장하게 되겠죠? 이..