Okt Library
- 한국어 형태소 분석기 KoNLPy 패키지에 속한 라이브러리
KoNLPy 테스트
|
|
norm
: 정규화(Normalization), ‘안녕하세욯’ -> ‘안녕하세요’stem
: 어근화(Stemming, Lemmatization), (‘한국어’, ‘Noun’)
Pickle Library (Extra)
- 파이썬 변수를 pickle 파일로 저장/불러오기
|
|
크롤링 데이터 전처리
크롤링 데이터 불러오기
|
|
- Article 데이터를 불러와서 리스트화 시키고 다시 하나의 문자열로 변환
형태소 단위 분해
|
|
단어 등장 빈도 시각화
|
|
단어 등장 빈도 시각화 (막대그래프)
|
|
Word Cloud
Import Libraries
|
|
Create WordCloud
|
|
width
,height
: 워드클라우드 해상도background_color
: 배경색max_words
: 단어 최대 갯수 (default: 200)max_font_size
: 최대 글자 크기prefer_horizontal
: 가로로 보여주는 정도, 가로로만 그리려면 1.0 설정
Show WordCloud
|
|
Masking
|
|
np.array
로 이미지 파일을 열면 픽셀 단위의 행렬 생성mask
파라미터에 Numpy Array 전달- WordCloud의 해상도는 원본 이미지의 해상도에 영향을 받음
Coloring
|
|
ImageColorGenerator
객체를 통해 이미지로부터 색상을 추출recolor
함수를 통해 이미지 컬러 다시 칠하기interpolation
: 비어있는 픽셀 값을 칠하는 방법,bilinear
(보간법)colormap
: 임의로 색상 지정 ('Reds'
,'Blues'
등)
Save to Image File
|
|