탐색적 요인분석 실전 1

티스토리 뷰

통계 이야기/탐색적요인분석(EFA)

탐색적 요인분석 실전 1

EPIK. 2020. 5. 10. 07:58

오늘은 탐색적 요인분석 분석하는 과정에 대해서 알아볼게요.

[통계 이야기/탐색적요인분석(EFA)] - 탐색적 요인분석 개괄

[통계 이야기/탐색적요인분석(EFA)] - 탐색적 요인분석 실전 1 ◁ 현재 포스팅

[통계 이야기/탐색적요인분석(EFA)] - 탐색적 요인분석 실전 2

[통계 이야기/탐색적요인분석(EFA)] - 탐색적 요인분석 문답

저번에 탐색적 요인분석의 목적, 원리 등을 설명드렸어요. 따라서 이론적인 내용은 되도록 빼고 실전 위주로 설명드릴게요. 물론, 아직 설명드리지 않은 이론적인 부분은 길어지더라도 포함할거예요.

탐색적 요인분석(Exploratory Factor Analysis: EFA)은 SPSS상에서 analysis - dimension reduction 에 있어요.

Factor에 들어가셔서 분석하고자 하는 문항들을 넣어주세요.

단, 주의하실 점은 하나의 상위 잠재변수별로 넣어주어야 해요.

이게 무슨 말이냐, 예를 들어서, 인간의 태도라는 변수와 욕망이라는 변수를 측정하기 위해 각각 10 문항씩 총 20문항을 설문조사 했다고 쳐요. 이런 경우, 20문항을 전부 한꺼번에 넣으면 안돼요.

상식적으로 생각해보세요.

만약 이 두 변수가 인과관계에 있으면 상관관계가 높겠죠? 상관관계는 요인분석의 기초예요. 즉, 10문항, 10문항이 원래는 각각 다른 변수를 대변하는데 인과관계에 있기 때문에 (상관관계가 높기 때문에) 20문항 전부가 하나의 변수를 나타낼 수도 있어요. 우리가 원하는 건 태도와 욕망 각각에 대한 요인 분석이지 두 개를 합친 어떤 다른 변수를 보고자 하는게 아니잖아요. 만약 태도와 욕망이라는 변수가 서로 다른 독립변수라고 해도, 여전히 따로 분석해야 해요. 여전히 이 둘은 다른 변수니깐요. 쉽게 생각하면, 각각의 변수는 따로 요인 분석을 해야해요.

자, 이제 진도를 나가봅시다.

factor에 들어가서 문항을 넣어 주었어요. HC라는 변수를 위해 측정한 문항들이예요.

Descriptives

오른쪽에 descriptives를 클릭하시면 다음과 같은 창이 떠요. 처음에 default로 initial solution만 체크되어 있고, 나머지는 제가 체크해준거예요.

먼저 univariate descriptives는 기술통계값을 계산해줘요. 평균, 분산 등 기초적인 값을 제공하고요.

coefficients는 문항들 간의 상관계수 값을 계산해주고요,

KMO (kaiser-meyer-olkin measure)는 MSA (measure of sampling adequacy)라고 하기도 하고요, 이 값은 상관계수와 partial 상관계수를 비교한 지표인데... 간단히 말하면, 이 데이터를 가지고 요인분석 해도 돼/아니야 적합하지 않아

이런걸 말해줘요. 이 값은 0 부터 1까지의 값을 가지는데, 0.5가 넘으면 오케이해요.

Bartlett's test of sphericity 역시 요인분석이 적합해를 말해주는 값으로, 이 값의 p 값이 유의하면 적합함을 의미해요.

Extraction

다음 Extraction을 클릭하시면 위와 같은 창이 뜨고요.

먼저 method 에 principal components로 되어있죠?

제가 저번 포스팅에서 말씀드린 부분인데, principal components 방법은 자료를 단순히 요약하는 목적이 강하고, common factor 방법이 잠재된 변수를 찾는 목적이 강해요.

common factor analysis 는 여러가지 방법이 있어요. spss에서는 unweighted least squares, generalized least squares, maximum likelihood, and principal axis factoring 이 4가지가 전부 common factor analysis 방법이예요.

목적에 따라 잠재 요인을 찾고자 하면 maximum likelihood 방법을 권하고, 단순 자료 축소를 원하면 principal components 방법을 권해드려요.

그리고 아래 보시면 Eigenvalues가 있어요. 1이 기본 설정이죠. 일단 이 값이 의미하는건 eigenvalue가 1이 되면 요인을 분류하겠다는 말이예요. 즉, 문항 1,3,5가 모여 eigenvalue가 1이 넘으면 요인1, 그리고 역시 문항 2, 4가 모여 eigenvalue가 1이 넘으면 문항2 이런 기준을 말해요.

그럼 eigenvalue가 뭘까요?

이 값은 쉽게 말하면 설명력이라고 보시면 돼요. 예를 들어 설명력 100%가 eigenvalue 1이고, 설명력 200%가 2가 돼요. 즉, 문항 1, 3, 5가 모여 설명력이 100%가 되면 하나의 변수가 된다는 말이죠. 왜냐하면 설명력이 100%니깐요!

나중에 결과표 보면서 더 상세히 말씀드릴게요.

하지만 이 방법은 근래들어 많이 비판받고 있어요. 그래서 fixed number of factors를 이용하는 분들도 많아요.

이럴 경우에는 이론적인 바탕이 강해야겠죠. (fixed number of factors에 만약 2를 넣으면 문항 1,2,3,4,5를 가지고 무조건 2개의 변수를 만들어라 라는 의미예요.)

Rotation

이번에는 rotation이네요. 원래는 none에 체크되어 있는데 저는 varimax에 체크해주었어요.

이 회전이라는 건 그래프를 보며 이해해야 이해하기 쉬운데... 생략할게요.

먼저 rotation의 목적은 해석을 용이하게 하고, 초기 결과의 모호함을 줄여주기 위해서예요.

rotation은 크게 orthogonal 과 oblique rotations으로 나뉘고요

Quartimax, Varimax, Equamax가 orthogonal rotation에 속하고,

나머지 두개는, Promax 와 Oblimin이 oblique rotation에 속해요.

주로 orthogonal rotation 방법들을 많이 쓰고, 그 중에서도 Varimax 방법을 많이 쓰더라고요.

사실 회전 방법은 요인 간의 관계에 대한 가정을 바탕으로 결정해야 해요. 만약 요인 간 상관관계가 0일 꺼라는 가정이 있을 때만 Varimax를 써야해요. 그렇지 않다면 Promax 방법이 더 적합해요.

이 포스팅은 EFA 실전이고 기초이므로 설명은 여기까지만 할게요.

데모로 Varimax 방법을 보여주지만 개인적으로는 oblique rotation을 권해드리고, varimax는 가장 비추해요.

Options

다음 options에 가셔서 Sorted by size를 클릭해주세요. 이걸 클릭해야 결과값 보기가 수월해요.

오늘은 여기까지. 다음 포스팅에서 결과 분석에 대해서 해볼게요!

도움이 됐다면 커피 한 잔 사주시면 감사하겠습니다^^

EPIK is 어려운 지식을 가능한 한 쉽게 공유하는 곳이예요 :)

Hey 👋 I just created a page here. You can now buy me a coffee!

www.buymeacoffee.com

'통계 이야기 > 탐색적요인분석(EFA)' 카테고리의 다른 글

탐색적 요인분석 문답 (0)	2020.05.10
탐색적 요인분석 실전 2 (0)	2020.05.10
탐색적 요인분석 개괄 (0)	2020.05.10

링크

최근에 올라온 글

TAG more

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

생각보다 어렵지 않아

티스토리 뷰

탐색적 요인분석 실전 1

'통계 이야기 > 탐색적요인분석(EFA)' 카테고리의 다른 글

티스토리툴바