티스토리 뷰

반응형

[통계 이야기/탐색적요인분석(EFA)] - 탐색적 요인분석 개괄

[통계 이야기/탐색적요인분석(EFA)] - 탐색적 요인분석 실전 1

[통계 이야기/탐색적요인분석(EFA)] - 탐색적 요인분석 실전 2

[통계 이야기/탐색적요인분석(EFA)] - 탐색적 요인분석 문답 ◁ 현재 포스팅

 

이 포스팅에서는 제가 흔히 받던 질문에 대한 답변을 해보려고 해요.

 

1) 요인분석 결과 공통성 등 때문에 아주 많은 문항을 제거해야 하는 상황이 왔어요. 그래도 괜찮은 걸까요? 

 

아주 많은 문항을 제거했다는 것은 뭘 의미할까요? 가장 먼저 드는 인상은 설문 문항 구성이 잘 못 되었다는 생각이 들 것 같아요. 즉, 그다지 괜찮은 상황은 아니라는 거죠. 만약 이게 어떤 스케일을 개발하는 과정이라면 괜찮을 것 같아요. 하지만 여전히 왜 그 문항들을 제거하는지에 대한 언급이 있어야겠죠. 하지만 그게 아니라면 여러 대안을 살펴보면 좋겠어요.

탐색적 요인분석은 아주 많은 의사결정 과정이 숨어있어요. 마치 닥터 스트레인지가 수 백만 가지의 미래를 봤던 것 처럼, 탐색적 요인분석 역시 수 많은 다른 결과를 낼 수 있어요. 그렇다고 자신의 입 맛에 맞게 결과를 내라는 말은 아니예요. 처음부터 의사 결정 과정들을 되집어 보면서 다시 분석해보는거죠.

먼저 outliers를 걸러내고, 데이터를 쭉 살펴봐서 1111111 이런 불성실한 응답은 제거해주세요.

principal component analysis 를 했다면 이걸 다른 방법으로 바꿔보세요. (Maximum likelihood)

회전 방법 역시 Varimax로 했다면 다른 방법으로 해보세요. (Promax)

만약 여전히 제거해야 할 문항이 있다면 한 번에 많은 문항을 제거하지 말고, 문항 하나를 제거한 후 다시 분석해보세요. 그리고 여전히 다른 문항을 제거해야 한다면 다른 문항을 제거하고 바로 전에 제거한 문항은 다시 넣어주세요. 이런식으로 최대한 많은 경우의 수를 살펴보세요.

결론적으로는 통계 수치에 기대지 마세요. 이론을 바탕으로, 해당 문항을 제거해도 되는 타당한 이유가 있는지 생각해보세요. 가장 핵심적인 문항의 요인 적재량이 낮다고 제거해버리면 안돼요. 이 말은 만약 적재량이 0.2일지라도 이론적으로 필요한 문항이라면 들어가야 해요. 

 

2) 적재값이 마이너스 값으로 높은 문항도 포함해야 하나? 

 

적재값은 쉽게 생각하면 상관계수예요. 즉, 이 측정 항목의 값이 높아질수록 잠재 요인의 값이 떨어지는거죠. 

이럴 경우에는 reverse coding이 도움이 될 수도 있어요. 적재값이 마이너스 방향으로 높은 문항의 반대를 생각해보세요.

이게 다른 문항들과 비슷한 의미를 갖으면 하나의 요인으로 볼 수도 있을거예요. (실수로 reverse coding을 안했을 때 이런 경우가 많이 생겨요.)

 

3) 3개의 요인으로 나뉠 거라고 기대했는데 훨씬 많은 요인으로 나뉘네요. 어떻게 해야하죠?

 

3개의 요인으로 나뉠 거라고 기대했다는 말은 선행 연구를 바탕으로 설문 문항을 구성 했을 가능성이 높아요.

따라서 이 경우에는 탐색적 요인분석이 궂이 필요하지 않다고 생각해요. 그냥 신뢰도 분석을 한 후 선행연구에 따라서 잠재 요인을 구성하면 될 것 같아요. 요인분석을 하고 싶다면 확인적 요인분석이 적합한 것 같고요. 

 

이 외에도 다른 질문이 있다면 댓글 남겨주세요. 언제든 환영이예요!

 

 

 

도움이 됐다면 커피 한 잔 사주시면 감사하겠습니다^^

 

EPIK is 어려운 지식을 가능한 한 쉽게 공유하는 곳이예요 :)

Hey 👋 I just created a page here. You can now buy me a coffee!

www.buymeacoffee.com

 

반응형

'통계 이야기 > 탐색적요인분석(EFA)' 카테고리의 다른 글

탐색적 요인분석 실전 2  (0) 2020.05.10
탐색적 요인분석 실전 1  (2) 2020.05.10
탐색적 요인분석 개괄  (0) 2020.05.10
댓글