Python 주제 분석


수강중

8. 회전 실습

주제의 해석을 좀 더 쉽게 하기위해 회전을 시킨다. 먼저 factor_analyzer를 설치한다.

!pip install factor_analyzer

SVD 결과를 불러온다.

import joblib
svd = joblib.load('svd.pkl')
data = joblib.load('plot.pkl')
locals().update(data)

Rotator를 불러들여 초기화한다.

from factor_analyzer.rotator import Rotator
rotator = Rotator()

단어와 주제의 관계를 나타내는 svd.components_를 회전시킨다.

rotated = rotator.fit_transform(svd.components_.T)

회전된 행렬을 데이터 프레임 형식으로 바꾼다.

import pandas as pd
rloading = pd.DataFrame(rotated)
rloading['word'] = cv.get_feature_names()

0번 주제를 다시 확인해본다.

i = 0
rloading.sort_values(i, ascending=False).loc[:, [i, 'word']].head()
0 word
636 0.393021 father
1087 0.261919 love
630 0.254933 family
1188 0.221321 mother
838 0.155209 home