티스토리 뷰

반응형

[통계 이야기/SEM 기초 및 AMOS] - 구조방정식 적합도 ◁ 현재 포스팅

[통계 이야기/SEM 기초 및 AMOS] - SEM 적합도 올리기

[통계 이야기/SEM 기초 및 AMOS] - AVE 이해하기

[통계 이야기/SEM 기초 및 AMOS] - CR (Composite/Construct Reliability) 이해하기

 

오늘은 적합도에 대해 포스팅 하려고 해요.

 

어떠한 적합도를 선택하느냐?!

논문의 중요한 속성 중 하나는 간결함이예요. 비록 많은 분들이 간결성을 간과하지만 개인적으로는 중요하다고 생각해요. 만약 A 라는 적합도가 B라는 적합도를 포함하고 있으면, B는 필요가 없겠죠. 다른 논문들이 A와 B 모두를 보여줬기 때문에, 그게 관례여서 등 다양한 이유로(혹은 이유 없이) A와 B 모두 리포팅 하곤 해요. 어떤 경우는 제 아무리 모든 논문에서 사용하고 있더라도 필요 없는 경우가 있어요.

 

RMSEA를 예로 들어보면, 이 값은 자유도가 극히 낮은 경우 값이 확 커져요.

자유도도 낮고, 표본도 적은 모델이라면 RMSEA는 옳은 지표가 아닐지도 몰라요. 자유도에 의해 값이 급변한다는 의미는 자유도에 의해 biased 됐다는 의미니깐요.

이 외에도 적합도에 대한 논쟁이 많아요.

그냥 cherry picking 하거나 입맛에 맞게 잘 나온 값 골라쓰기, 아니면 그냥 쓰던 적합도 계속 쓰기 이런 행태는 빨리 바뀌면 좋겠어요.

 

Indice

가장 먼저, 적합도는 카이스퀘어를 제외하고 범주를 나눌 수 있어요.

 

Absolute Fit Index (A Index 라고 할께요.)

이 범주는 0을 기준으로 하는 적합도들이예요. 즉, 0에 가까울수록 좋은 적합도들인거죠.

 

Comparative Fit Index (C Index 라고 할께요.)

이 범주는 두 개의 모델을 비교할 때 보는 적합도들이예요.

 

Incremental Fit Index (I Index 라고 할께요.)

이 범주는 설명력과 비슷한 의미를 지닌 적합도들을 말해요.

 

모형을 비교한다면 C Index가 가장 적합하겠죠?

모형 비교가 아니면 A 와 I index를 이용하면 되고요.

 

카이스퀘어

자 그럼 먼저 카이스퀘어. AMOS에서는 CMIN이라고 나오죠?

통계에서는 아주 유명한 분포들이 있어요. t 분포, f분포, 카이스퀘어 분포, ...  그 유명한 분포 중 하나예요.

구조방정식으로만 한정해서 설명할게요.

만약 표본 수가 적다고 해봐요. 한.. 200개 이하 정도예요. 그러면 카이스퀘어는 아주 강력한 적합도 검증 방법 중 하나예요. 유의하실 점은, 이 카이스퀘어는 유의하면 안돼요! 유의하지 않아야 모델이 적합하다고 할 수 있어요.

하지만, 표본 수가 늘어날수록 카이스퀘어가 유의하게 되버리죠. 또한 모델 안의 상관관계가 높을수록 카이스퀘어 값도 커져요. 아이러니하지 않나요? 결국 구조방정식은 영향관계를 보려고 하는거고, 영향관계는 상관관계가 있다는 건데, 상관관계가 크다면 적합하지 않아진다니.

 

그래서 다양한 대안 방법들이 생겨났어요. 그중 손 쉽게 쓸 수 있는 값이 카이스퀘어를 자유도로 나눈 값이죠. 이 값은 AMOS 결과 값 상에 계산되어 나오기 때문에(CMIN/df) 이용하기 쉬운 장점이 있기도 해요.

그리고 보통 3이하일 때, 모형이 적합하다고 얘기하는데, 아직 이에 대한 연구가 부족한 것 같아요. 보조 적합도 정도로 생각하면 될 것 같아요. 

 

Tucker Lewis index/Non-Normed Fit Index 

그리고 이 카이스퀘어 값과 자유도를 이용해서 계산되는 값이 있어요.

바로 TLI. NNFI 라고도 하죠.

이 값은 NFI (=Bentler-Bonett Index)값을 대신해서 나왔어요. 그렇다는건 NFI, NNFI 둘 다 결과에 쓰는건 지면 낭비겠죠? 좀 더 깊은 설명을 원하시는 분은 말씀해주세요. 수식이라던가...

아 많은 학자들이 0.9 이상이 좋은 값이라고 인정하고 있고, I Index에 속해요.

 

Comparative Fit Index 

그리고 CFI도 많이 쓰시죠? 이 값 역시 I Index!

CFI 역시 카이스퀘어 값과 자유도를 이용해서 계산해요.

TLI는 카이스퀘어를 자유도로 나눈 값을 이용하는 반면, CFI는 카이스퀘어를 자유도로 뺀 값을 이용하죠.

두 적합도는 상관관계가 상당히 높고, 따라서 두 값중 하나만 적어도 충분해요. 뭔가 하나가 이상하게 높거나 낮은 경우를 제외하고요. 이 값 역시 기준은 보통 0.9 이상으로 봅니다!

 

Root Mean Square Error of Approximation

이번에는 RMSEA 입니다. 이 값은 A Index.

이 값은 카이스퀘어, 자유도, 표본 수를 이용하여 계산해요. 만약 자유도 값이 낮거나 표본 수가 적다면 위험한 적합도가 될 수 있어요.

이 값은 거의 모든 학자들이 사용하고 있고, 기준 값은 약간의 의견 불일치가 있긴 해요.

.08 혹은 .05 이하 까지만 인정하는 학자가 다수인 것 같아요.

 

(Adjusted) Goodness of Fit 

그 다음은 GFIAGFI.

위의 두 값은 이제 거의 쓰지 않아요. 예전에 LISREL을 주로 사용하던 시절, 위의 값을 많이 사용했지만 샘플 사이즈에 민감한 지표라 현재는 거의 사용하지 않아요.

 

Akaike Information Criterion
Bayesian Information Criterion
The Sample-Size Adjusted BIC

C Index에 속하는 적합도들은 AIC, BIC, SABIC 등이 있어요.

AIC는 값이 낮을 수록 더 좋은 모델이라는 뜻이예요. 따라서 모델을 비교할 때, AIC 값이 낮은 모델을 선택하면 되겠죠?

참고로 카이스퀘어, 변수의 개수, 자유도를 이용하여 계산해요.

BIC 역시 AIC와 비슷해요. 하지만 BIC는 샘플 수 를 고려했어요. 즉, 샘플 수가 커지면 BIC 값은 올라가요.

SABIC는 BIC가 샘플 수에 주는 패널티가 너무 심하다고 생각되서 나왔어요. 여전히 샘플 수에 의해 영향을 받긴 하지만 그 정도가 줄었죠. 이 지표는 Amos에서는 제공되지 않아요. (최신 버전에서 업데이트 됐다면 댓글 부탁해요^^)

근데!! 왜!! 모델을 비교할 때, 이 값들을 쓰지 않는걸까요?

 

이 정도면 설명이 좀 되었을까요? 이 외에도 궁금한 적합도 종류가 있으면 말씀하세요. 아는 한도내에서 말씀드릴게요

 

도움이 되었길 바래요!

 

 

도움이 됐다면 커피 한 잔 사주시면 감사하겠습니다^^

 

EPIK is 어려운 지식을 가능한 한 쉽게 공유하는 곳이예요 :)

Hey 👋 I just created a page here. You can now buy me a coffee!

www.buymeacoffee.com

 

반응형

'통계 이야기 > SEM 기초 및 Amos' 카테고리의 다른 글

AVE 이해하기  (6) 2020.05.18
SEM 적합도 올리기  (0) 2020.05.18
구조방정식(SEM) 이론 기초 4  (0) 2020.05.18
구조방정식(SEM) 이론 기초 3  (2) 2020.05.18
구조방정식(SEM) 이론 기초 2  (1) 2020.05.17
댓글