텍스트 데이터 분석에서 키워드로는 피상적인 결과만 얻을 수 있습니다. '은행'이라는 단어는 '은행'이라는 금융기관을 가리키기도 하고, 가을이면 노랗게 물드는 은행나무의 열매를 가리키기도 합니다. '은행'이라는 단어의 수만 세는 것으로는 이 단어가 텍스트에서 어떤 의미로 쓰였는지 알 수 없겠지요. 텍스트에 쓰인 단어들로부터 의미와 주제(topic)를 추출해서 텍스트 데이터에 대한 깊이 있는 분석을 가능케 합니다.
제목 | 강의시간 | 시청 |
---|---|---|
토픽 분석 및 실습 준비 | ||
주제분석이란? | 21:31 | |
설치 및 데이터 | ||
Term Document Matrix | 13:29 | |
예제 데이터 소개 | 4:33 | |
R에서 Term Document Matrix 만들기 | 9:09 | |
stopwords 제거하기 | 10:08 | |
잠재 의미 분석(LSA) | ||
LSA의 개념 | 20:09 | |
R에서 LSA 실행하는 법 | 21:53 | |
회전(rotation) | 5:06 | |
가중치 (tf, idf) | 15:19 | |
LSA에서 차원의 해석 | 16:31 | |
LSA에서 문서 좌표와 유사도 | 9:41 | |
R에서 문서 좌표와 유사도 구하기 | 9:42 | |
잠재 디리클레 할당(LDA) | ||
LDA의 개념 | 11:57 | |
R에서 LDA 실행하는 법 | 12:18 | |
LDA 결과 해석 | 16:04 | |