워드 클라우드word cloud 쉽게 만들기 #아이폰앱
본문
오늘은 워드클라우드 아래의 보고서에 포함된 주요한 키워드를 시각화하기 위해 R의 word cloud 패키지를 이용하여 워드클라우드를 그려보았다.주요 키워드와 빈도는 먼저 분석을 해두었고, 시각화만 word cloud로 했다.주요 키워드와 빈도 분석 방법은 다음에 다루도록 한다.이 포스팅에서는 키워드와 워드클라우드 빈도가 분석된 csv 파일을 불러와서 word cloud로 그려보는 과정을 다룬다.1. Working Directory(작업폴더) 세팅 : setwd디텍토리를 설정해놓으면 파일의 경로를 반복해서 알려줘야 하는 번거로움을 줄일 수 있다.2. Working Directory(작업폴더) 확인 : getwd3. 데이터 불러오기(CSV) 워드클라우드 : read.csvfile에는 따옴표와 함께() 파일명과 확장자(csv)를 입력한다. setwd를 하지 않았다면 데이터가 저장된 경로를 그대로 입력해도 된다. header는 첫 행이 이름이면 T, 바로 데이터가 나온다면 Fsep은 셀을 구분하는 구분기호를 지정한다.na.strings는 R로 불러올 때 워드클라우드 NA 값으로 인식시키고 싶은 문자를 지정할 수 있다. 여러개 일 때 c()로 묶어서 쓴다.stringsAsFactors는 문자로 된 값을 Factor로 불러오려면 T, Character로 불러오려면 F* Factor와 Character를 모른다면 아래 링크 참고불러온 csv 데이터는 Environment에서 워드클라우드 확인할 수 있다.나는 미리 보고서에 담긴 키워드와 키워드가 언급된 빈도수를 분석해두었다. KoNLP라는 패키지와 wordclouds 홈페이지를 이용했는데, 이 내용은 다음에 다뤄보도록 한다. * wordclouds 홈페이지 링크4. 워드클라우드 그리기 : wordcloud워드클라우드를 그리는 데 필요한 워드클라우드 패키지는 wordcloud와 RcolorBrewer 2가지다. 패키지 설치를 하고 라이브러리 등록하면 코딩 한 줄만에 워드클라우드를 그릴 수 있다.words는 키워드의 목록, freq는 빈도다. 나는 keyword로 지정한 csv 파일에 미리 분석을 해두었기 때문에 각각의 열을 불러오도록 워드클라우드 코드를 짰다. min.freq는 최소 N번 이상 나온 단어, max.words는 최대 N개의 단어를 고르는 옵션이다. random.order =TRUE는 무작위로 배열하는 것이고(아래의 왼쪽그림), FALSE는 제일 많이 나온 단어가 먼저 나오도록 지정하는 옵션이다(아래의 오른쪽그림). colors는 색을 워드클라우드 지정하는 것으로 단순히 색을 지정할 수도 있지만(아래의 왼쪽그림), Frequency 에 따라 다른 색이 나오게도 할 수 있다.(아래의 오른쪽 그림)왼쪽이 예시 1 결과, 오른쪽이 예시 2 결과+ colors=brewer.pal() 관련 색상표 : colors=brewer.pal()로 지정할 워드클라우드 수 있는 색상들
댓글목록 0
댓글 포인트 안내