티스토리 뷰
오늘은 R을 이용해서 기존에 갖고 있던 데이터를 불러와볼거예요.
Working Directory
먼저 파일을 저장할 폴더를 지정해볼까요?
원래 있던 폴더를 연결해서 파일들을 저장하시려면 setwd 기능을 이용하시면 돼요.
setwd("C:/Users/.../Desktop/R Practice")
이게 웃긴게 그냥 폴더 주소를 복사해서 붙여넣으면
C:\Users\...\Desktop\R Practice
이렇게 나와요. 그대로 복사 붙여넣기 하면 안돼요. 저 \표시를 /로 바꿔줘야 해요.
파일 불러오기
이제 working 폴더를 지정해줬어요.
이번에는 csv 확장자로 된 데이터를 불러올게요.
read.csv라는 명령어를 이용해서,
NewData <- read.csv("Regret__Liking__Fall_2018.csv", header=TRUE, na.strings=c(" ",""))
여기서 NewData는 저번에 배운 것처럼, 새롭게 만들어지는 object 이름이예요.
만약 working 폴더(위에서 지정한 폴더)에 데이터가 있으면 데이터 이름만 저렇게 넣으면 돼요. 만약 다른 폴더에 있으면 전체 주소를 적어주시고요.
header=true 라는 의미는, 보통 첫 번째 가로줄이 변수 이름이잖아요? 그걸 포함시킨다 라는 의미고요.
na.strings는 결측값을 지정해주는 거예요.
만약 결측값을 99로 입력이 되어있다면 na.strings=c("99") 이렇게 하면 돼요.
만약 다른 확장자로 된 파일을 불러오고 싶으면 주로 foreign 패키지를 많이 써요.
설치 방법은
install.packages("foreign".dependencies=T)
근데 최신 버전에는 이미 있더군요. 그런 경우에는 그냥 실행해주세요.
library(foreign)
이 패키지를 이용하면 다양한 종류의 파일을 불러올 수 있어요.
SPSS, Stata, SAS, Minitab 등등
SPSS파일을 불러오기 위해서는
SPSSData <- read.spss("Regret__Liking__Fall_2018.sav", to.data.frame=TRUE)
요런식으로 하면 돼요.
to.data.frame은 저번 포스팅에서 data frame 만드는거 배웠죠?
그렇게 데이터를 불러온다는 뜻이예요.
R은 코드 베이스 프로그램이라 코드에 익숙해져야 하는데,
데이터 불러오기만이라도 좀 편하게 하고싶다면 사실 쉬운 방법이 있어요.
Environment -> Import Dataset -> ... 원하는거 불러오면 돼요.
Haven 이라는 패키지를 이용하는데, 자동으로 설치해줄거예요.
설치하고 나서 들어가면 뭐 어려운 건 없어요.
또 다른 방법도 있어요.
Files -> More ->
만약 저 따라서 working 폴더 설정했고, 그 안에 데이터 파일이 있으면
Go To Working Directory
그럼 파일이 보일거예요. 그 파일 마우스 왼쪽 클릭해서 import dataset 하면 끝...
어려운거 먼저 소개해서 ㅈㅅ
코드에 익숙해지자는 의미에서 먼저 코드로 했어요 ㅎㅎ
데이터를 잘 불러왔을까?
그럼 데이터를 잘 불러왔나 궁금하겠죠?
만약 haven을 이용해서 불러왔다면 data frame 탭이 생겼을거예요.
이렇게요.
이걸로 말고 코드로도 확인할 수 있어요.
제 object이름은 RLSPSS이고요,
names(RLSPSS)
이 기능은 프레임 안에 변수 이름들을 보여줘요.
head(RLSPSS)
이건 위에서부터(ID 1번) 데이터를 보여주는데, default는 6개를 보여줘요.
만약 더 많이 보고싶다면,
head(RLSPSS, 8)
이러면 위에서부터 8번째까지 데이터를 보여주고요.
반대로 head 대신에 tail을 치면 뒤에서부터 보여줘요.
View(RLSPSS)
이건 위에서처럼 데이터 프레임을 보여주고요.
이렇게요.
데이터 구조를 보고싶다면
str(RLSPSS)
이러면 각 변수의 데이터가 numeric인지 integer인지 factor인지가 나올거예요.
이걸로 데이터 불러오기는 끝났어요.
다음에는 대략적으로 데이터를 탐색해보도록 해요.
도움이 됐다면 커피 한 잔 사주시면 감사하겠습니다^^
'통계 이야기 > R을 공부해보자' 카테고리의 다른 글
R 데이터를 살펴보자 2 (0) | 2020.06.14 |
---|---|
R 데이터를 살펴보자 (0) | 2020.06.08 |
R 기초 2 (갖고 놀기) (0) | 2020.06.05 |
R 기초 1 (갖고 놀기) (0) | 2020.06.03 |
R 입문! (설치 및 세팅) (0) | 2020.06.03 |
- process
- multilevel
- Mplus
- SEM
- 부정적 평가 두려움 척도
- 조절분석
- R 기초
- EFA
- amos
- 탐색적 요인분석
- 사회심리
- mediation
- moderation
- 간접효과
- 논문통계
- 매개효과
- rstudio
- probing
- exploratory factor analysis
- social exclusion
- 프로세스
- 구조방정식
- invariance test
- close relationships
- 소속감
- Hayes
- indirect effect
- MLM
- structural equation modeling
- process macro