API World for Mobile Developers

Wordcloud 만들기 - 문대통령 취임사 본문

잡동사니

Wordcloud 만들기 - 문대통령 취임사

미니렉스 2017. 5. 22. 15:42

개요

R 을 설치하고 제일 처음 해보는 가공을 절차별로 정리함


준비작업: 일단 대통령 취임사를 검색하고 txt 파일로 저장.   PresidentMoon_201705.txt

1. R을 기동함

2. 환경 설정

install.packages("KoNLP")

install.packages("wordcloud")

library(KoNLP)

library(wordcloud)

useSejongDic()


3. 파일 읽기

txt <- readLines("PresidentMoon_201705.txt")


4.명사만 추출하기

nouns <- sapply(txt, extractNoun, USE.NAMES=F)


5. 필터링 하기 ( 두글자 이상만 사용하기 )

c <- unlist(nouns)

nouns <- Filter( function(x) {nchar(x) >= 2} , c)


6. 걸러내기 (필요시) - 음 연설문에는 필요 없네요

data3 <- gsub("\\d+", "", data3)              #숫자 제외, 정규식

data3 <- gsub("\\(", "", data3)                 # (괄호 제외

data3 <- gsub("\\)", "", data3)                 # )괄호 제외

data3 <- gsub("[A-Za-z]", "", data3)            # 영문 제외, 정규식


7. table로 변환하기

wordcount <- table(nouns)


8. 가장 많이 사용된 명사는?

head( sort(wordcount, decreasing=T), 30)


9. WordCloud 로 보기

언급된 횟수가 2회이상 단어만 클라우드화

wordcloud( names(wordcount), freq = wordcount, scale=c(5,1), rot.per=0.5, min.freq=2, random.order=F, family="AppleGothic" )


9-1. 색상 예쁘게 입히기

library(RColorBrewer)

palete <- brewer.pal(9, "Set1")

wordcloud( names(wordcount), freq = wordcount, scale=c(5,1), rot.per=0.5, min.freq=2, random.order=F, family="AppleGothic", random.color=T, colors=palete )


10. 이미지 파일 저장하기 - MAC에서는 동작 안되넹...  왜?

savePlot("PresidentMoon_201705.png", type="png")

Error in savePlot("PresidentMoon_201705.png", type = "png") : 

  'X11(type="*cairo")' 장치들로부터 복사만을 할 수 있습니다


결과


PresidentMoon_201705.pdf


스터디 서적 :R까기 - 느린서적 출판 (2014) http://www.yes24.com/24/goods/13434081?scode=032&OzSrank=2 
참조페이지 : 
http://ertai119.tistory.com/entry/R-사용하기 [꿈을 현실로 바꾸는 연금술사~]



Comments