프로그래밍/데이터분석 8

파이썬 데이터분석 필수 라이브러리 - pandas, numpy, matplotlib

python에서 데이터 분석에 사용되는 주요 라이브러리가 있죠. pandas, numpy, matplotlib 등이 있는데요. 라이브러리별 주요 기능 및 설치 방법 등을 정리해 보려고 합니다. 파이썬의 데이터 분석용 플랫폼인 Anaconda를 깔면 위의 주요 라이브러리와 주피터 노트북 등의 편리한 툴들까지 모두 깔리니까 좀 더 사용하기 편리합니다. 또한 라이브러리 설치나 import 등은 본인 취향에 따라 다른 방법을 사용하셔도 됩니다. 1. pandas 가. 주요 기능 : pandas는 유용한 데이터 구조를 제공하는 파이썬 패키지이다. 주요 데이터 구조로는 Series와 DataFrame이 있음. 이 중 DataFrame은 일종의 엑셀같은 스프레드시트형태의 데이터를 관리할 수 있는 데이터 구조라고 할 ..

특정 키워드(중고) 트위터로 워드클라우드 만들기

R Studio를 통해서 특정 단어를 언급한 트위터 데이터를 가져오는 내용을 지난 번 글(링크)에서 다뤘었는데요. 이번에는 가져온 데이터를 이용해서 워드클라우드를 만드는 내용을 해보죠. 사실 별 거 아닌데 뭔가 분석할 만한 키워드를 찾는 게 조금 시간이 걸렸네요. 광고글이 너무 많이 검색되거나 다 똑같은 트윗들만 있거나 한 경우가 많더라구요. 검색을 한 키워드는 [중고], 검색한 숫자는 10000개입니다. tweets라는 변수에 10000개가 할당된 거 보이시죠. 이런식으로 데이터가 로딩된 상태라면 분석이 가능합니다. 1. 필요 패키지 설치 : KoNLP, wordcloud> install.packages("KoNLP")> install.packages("wordcloud")- 위 두 문장을 Consol..

특정단어 언급한 트위터 데이터 가져오기

R Studio를 통해서 특정 단어를 언급한 트위터 데이터를 가져와서 워드클라우드를 만드는 걸 한 번 해볼 건데요. 이러한 작업을 R 스튜디오에서 하기 위해서는 몇 가지 사전 작업을 해줘야 합니다.(파이썬이나 다른 언어로 해도 마찬가지예요. 다만 방법 달라질 뿐이지.) 사전 작업에 대한 내용은 이전 글(링크1, 링크 2)에서 했었기 때문에 여기에서는 간략하게 진행 순서만 얘기할게요. 내용이 좀 길어질 것 같으니까 일단 이번 글에서는 트위터에서 특정 단어를 언급한 내용을 가져오는 것만 먼저 해보죠. 1. Twitter 데이터를 분석하기 위한 사전 설정가. Twitter App 설정 - Twitter apps 페이지를 통해 APP을 생성(핸드폰 인증 필요) - Twitter apps 페이지를 통해 생성된 앱..

R Studio를 통해 트위터 데이터 가져오기(2)

지난번 글(링크)에서 데이터를 가져오기 위한 트위터 설정은 마쳤으니 이번에는 R Studio에서의 작업과 읽어온 데이터만 확인하면 됩니다. 혹시나 R Studio를 설치 안 하신 경우에는 먼저 R Studio를 설치해 줍니다.(링크) R Studio를 실행해 줍니다. 1. 필요 패키지 설치 - R Studio 우측 하단 부의 Packages 선택 후 Install 선택 - [Install Pakages] 팝업창에서 중간 [Packages]란에 [twitterR] 입력 후 [Install] - 위와 같은 방법으로 [base64enc], [ROAuth] 설치 - 설치가 진행되는 동안 Console창에는 위와 같은 메시지들이 표시가 됩니다. - Console창에 [ > install.packages("twit..