티스토리 뷰

반응형

오늘은 R을 이용해서 기존에 갖고 있던 데이터를 불러와볼거예요.

Working Directory

먼저 파일을 저장할 폴더를 지정해볼까요?

원래 있던 폴더를 연결해서 파일들을 저장하시려면 setwd 기능을 이용하시면 돼요.

setwd("C:/Users/.../Desktop/R Practice")

이게 웃긴게 그냥 폴더 주소를 복사해서 붙여넣으면

C:\Users\...\Desktop\R Practice

이렇게 나와요. 그대로 복사 붙여넣기 하면 안돼요. 저 \표시를 /로 바꿔줘야 해요.

파일 불러오기

이제 working 폴더를 지정해줬어요.

이번에는 csv 확장자로 된 데이터를 불러올게요.

read.csv라는 명령어를 이용해서,

NewData <- read.csv("Regret__Liking__Fall_2018.csv", header=TRUE, na.strings=c(" ",""))

여기서 NewData는 저번에 배운 것처럼, 새롭게 만들어지는 object 이름이예요.

만약 working 폴더(위에서 지정한 폴더)에 데이터가 있으면 데이터 이름만 저렇게 넣으면 돼요. 만약 다른 폴더에 있으면 전체 주소를 적어주시고요.

header=true 라는 의미는, 보통 첫 번째 가로줄이 변수 이름이잖아요? 그걸 포함시킨다 라는 의미고요.

na.strings는 결측값을 지정해주는 거예요.

만약 결측값을 99로 입력이 되어있다면 na.strings=c("99") 이렇게 하면 돼요.

 

만약 다른 확장자로 된 파일을 불러오고 싶으면 주로 foreign 패키지를 많이 써요.

설치 방법은

install.packages("foreign".dependencies=T)

근데 최신 버전에는 이미 있더군요. 그런 경우에는 그냥 실행해주세요.

library(foreign)

이 패키지를 이용하면 다양한 종류의 파일을 불러올 수 있어요.

SPSS, Stata, SAS, Minitab 등등

SPSS파일을 불러오기 위해서는

SPSSData <- read.spss("Regret__Liking__Fall_2018.sav", to.data.frame=TRUE)

요런식으로 하면 돼요.

to.data.frame은 저번 포스팅에서 data frame 만드는거 배웠죠?

그렇게 데이터를 불러온다는 뜻이예요.

 

R은 코드 베이스 프로그램이라 코드에 익숙해져야 하는데,

데이터 불러오기만이라도 좀 편하게 하고싶다면 사실 쉬운 방법이 있어요.

Environment -> Import Dataset -> ... 원하는거 불러오면 돼요.

Haven 이라는 패키지를 이용하는데, 자동으로 설치해줄거예요.

설치하고 나서 들어가면 뭐 어려운 건 없어요.

 

또 다른 방법도 있어요.

Files -> More ->

만약 저 따라서 working 폴더 설정했고, 그 안에 데이터 파일이 있으면

Go To Working Directory

그럼 파일이 보일거예요. 그 파일 마우스 왼쪽 클릭해서 import dataset 하면 끝...

어려운거 먼저 소개해서 ㅈㅅ

코드에 익숙해지자는 의미에서 먼저 코드로 했어요 ㅎㅎ

데이터를 잘 불러왔을까?

그럼 데이터를 잘 불러왔나 궁금하겠죠?

만약 haven을 이용해서 불러왔다면 data frame 탭이 생겼을거예요.

이렇게요.

 

이걸로 말고 코드로도 확인할 수 있어요.

제 object이름은 RLSPSS이고요,

names(RLSPSS)

이 기능은 프레임 안에 변수 이름들을 보여줘요.

 

head(RLSPSS)

이건 위에서부터(ID 1번) 데이터를 보여주는데, default는 6개를 보여줘요.

만약 더 많이 보고싶다면,

head(RLSPSS, 8)

이러면 위에서부터 8번째까지 데이터를 보여주고요.

반대로 head 대신에 tail을 치면 뒤에서부터 보여줘요.

View(RLSPSS)

이건 위에서처럼 데이터 프레임을 보여주고요.

이렇게요.

데이터 구조를 보고싶다면

str(RLSPSS)

이러면 각 변수의 데이터가 numeric인지 integer인지 factor인지가 나올거예요.

이걸로 데이터 불러오기는 끝났어요.

다음에는 대략적으로 데이터를 탐색해보도록 해요.

 

 

도움이 됐다면 커피 한 잔 사주시면 감사하겠습니다^^

 

EPIK is 어려운 지식을 가능한 한 쉽게 공유하는 곳이예요 :)

Hey 👋 I just created a page here. You can now buy me a coffee!

www.buymeacoffee.com

 

반응형

'통계 이야기 > R을 공부해보자' 카테고리의 다른 글

R 데이터를 살펴보자 2  (0) 2020.06.14
R 데이터를 살펴보자  (0) 2020.06.08
R 기초 2 (갖고 놀기)  (0) 2020.06.05
R 기초 1 (갖고 놀기)  (0) 2020.06.03
R 입문! (설치 및 세팅)  (0) 2020.06.03
댓글