티스토리 뷰

반응형

[통계 이야기/SEM 기초 및 AMOS] - 구조방정식 적합도

[통계 이야기/SEM 기초 및 AMOS] - SEM 적합도 올리기

[통계 이야기/SEM 기초 및 AMOS] - AVE 이해하기 ◁ 현재 포스팅

[통계 이야기/SEM 기초 및 AMOS] - CR (Composite/Construct Reliability) 이해하기

 

오늘은 AVE에 대해서 포스팅 해볼까해요.

 

AVE가 뭐지?

AVE는 Average Variance Extracted의 약자예요.

 

먼저 AVE 값은 convergent validity를 확인하기 위해서 사용해요. AVE 값 계산은 간단해요. 국내 책에 나온 수식을 잠깐 봤었는데, 참 어렵게 설명해놨더라고요. 

 

AVE는 쉽게 말하면 평균 설명력이예요.

이 포스팅을 보시는 분은 기본적으로 설명력이 뭔지 알고, CFA와 관련된 값을 읽을 줄 안다는 가정하에 설명드릴게요.

CFA를 돌리신 후 표준계수 혹은 요인적재량이 나오죠? 요인적재량은 기본적으로 상관관계를 나타내요.

설명력은 보통 r제곱으로 표시하죠? 상관관계는 r로 표시해요. 즉, 상관관계의 제곱은 곧 설명력이예요.

따라서 각 요인적재량의 제곱은 각 측정문항에 대한 설명력을 나타내요.

 

AVE 계산을 어떻게 하지?

AVE값을 제가 뭐라고했죠? 평균 설명력이라고 했죠? 즉, 각 요인적재량에 제곱을 한 후 평균을 내면 AVE값이 돼요.

 

더 쉬운 방법이 있어요.

CFA를 돌리기 전에 Squared Multiple Correlations 이던가? 거기에 체크를 한 후 돌려주세요. 줄여서 SMC라고 하는데 이게 요인적재량의 제곱값이예요. 따라서 SMC에 나오는 값을 모두 더한 후 문항 수로 나눠주면 AVE값이예요. 오차항을 건들 필요 없어요.

 

혹시 제 설명이 헷갈리실 수 있으니 다음과 같이 표현해볼게요.

[(문항1의 요인적재량)*(문항1의 요인적재량)+(문항2의 요인적재량)*(문항2의 요인적재량)+ .... +(문항10의 요인적재량)*(문항10의 요인적재량)]/10 = AVE

혹은

[(문항1의 SMC값)+(문항2의 SMC값)+ ... +(문항10의 SMC값)]/10 = AVE

쉽죠? 

 

AVE값 기준(convergent validity)

제가 위에서 AVE 값은 convergent validity를 확인하기 위해서 사용한다고 했어요. 

그렇다면 convergent validity는 뭘까요?

 

AVE는 평균 설명력인데, 과연 어느정도 설명력이 좋은 걸까요? Convergent validity 측정문항들이 잠재변수를 잘 설명하고 있나? 를 나타내요. 간단히 말해서 측정문항들이 한 잠재변수에 대한 요인적재량이 평균적으로 높으면 convergent validity가 높은거예요. 

보통 AVE값이 0.5 이상이면 괜찮다고 해요. AVE값이 0.5 이상 이라는건 설명력이 50% 이상이라는 거예요.

 

이해 되시나요? 다시 예를 들어볼게요.

만약 CFA 결과 요인적재량이 다음과 같다고 쳐요.

문항1=0.6, 문항2=0.7, 문항3=0.8, 문항4=0.9, 문항5=0.7

자, 그럼 문항1의 설명력은 몇일까요? 0.36이예요. 문항2는 0.49, 3은 0.64, 4는 0.81, 5는 0.49

그럼 모든 문항의 설명력 평균은? (0.36+0.49+0.64+0.81+0.49)/5= ...... 0.55 정도 되네요.

평균적으로 측정문항이 잠재변수를 55%만큼 설명해주고 있는 모델이 되요. 즉, 어느 정도의 convergent validity를 확보했다고 할 수 있죠.

SMC에는 저 제곱값이 나와요. 그러니 SMC를 가지고 계산하면 더 쉽게 할 수 있어요. 이젠 이해 되시나요?

 

자 여기서 얻을 수 있는 교훈은?

요인적재량이 평균 0.7 이상은 되야 최소한의 AVE값을 맞출 수 있어요. 0.7의 제곱은 0.49로 거의 0.5니깐요!

그러니 요인적재량이 0.3, 0.4이러면 AVE값은 갑자기 쭈욱 떨어져요.

 

AVE값 기준(discriminant validity)

자, 그리고 AVE값으로 convergent validity 뿐만 아니라, discriminant validity라는 것도 확인할 수 있어요.

discriminant validity는 서로 다른 잠재변수들이 정말 다른 변수인가?를 확인하는 거예요.

만약 두 개의 잠재변수간의 상관관계가 굉장히 높아요. 그러면 두 가지의 가능성이 있어요.

 

1. 두 변수는 같은 변수로 봐도 무방하다.

즉, discriminant validity가 무너진거예요.

 

2. 두 변수는 강한 인과관계를 가지고 있다.

 

자 그럼 이 타당도를 어떻게 확인할까요?

먼저 AVE값은 이미 구했어요. 이제 변수들끼리의 상관관계를 봐야해요.

측정문항들의 상관관계가 아니예요. 잠재변수들끼리의 상관관계예요.

각각의 잠재변수들끼리의 상관계수들을 각각 제곱해주세요.

 

예를 들어 볼게요.

B의 AVE = 0.55,

A와 B 잠재변수간의 상관계수는 = 0.5, 제곱값 = 0.25 .......(1)

B와 C 잠재변수간의 상관계수는 = 0.6, 제곱값 = 0.36 .......(2)

A와 C 잠재변수간의 상관계수는 = 0.8, 제곱값 = 0.64 .......(3)

 

자 이제 AVE값과 각 변수간의 상관관계 제곱값을 비교해봐요.

(1)과 (2)의 상관계수 제곱값은 AVE 값보다 낮아요. 이런 경우 discriminant validity가 있다고 할 수 있어요. 다시 말하면, 잠재변수B는 A와 다른 변수이고, C와도 다른 변수라고 할 수 있어요.

 

(3)의 경우는 A와 C간의 상관계수가 꽤 높은 편이죠? A와 C의 AVE값을 모르기 때문이 discriminant validity를 판단하지는 못해요. AVE값과 상관없이 만약에 A가 독립변수고, C가 종속변수예요. 그러면 두 변수간의 상관관계는 당연히 높겠죠? 그렇지 않으면 가설이 틀린거고요. 따라서 (3)은 당연한 결과일 수도 있어요.

책에서 본 건 아니지만, 제 의견으로는 discriminant validity는 서로 인과관계 가정이 없는 변수들끼리만 봐야 한다고 생각해요. 독립변수들끼리만 본다던가, 서로 영향관계가 없는 변수들끼리만 보는거죠. 당연한 거라고 생각하는데 어디서도 읽은적은 없네요. 공부가 부족한건지 너무 당연한건지... 어쨌든 변수간의 상관계수 제곱값과 AVE값을 비교해서 discriminant validity를 확인한다는거 알아두세요.

 

오늘도 도움이 됐기를 바라면서, 국내 구조방정식 책에는 어렵게 나온 AVE 설명은 무시하세요.

책에 나온 수식대로 하시려면 비표준화 오차가 아닌 표준화 오차를 가지고 계산해야 한다는 점 명심하세요.

어떤 책은 잘 못 나온 책도 있고, 어떤 책은 잘 나왔는데 연구하시는 분들이 비표준화 오차를 가지고 계산하는 바람에 요인적재량에 비해 너무 낮은 AVE값이 나오는 경우도 있어요. 반대로 요인적재량에 비해 너무 높은 AVE값이 나오기도 하고요. 잘못 계산된 논문을 한 두편 본게 아니예요.

 

부디 점차 개선되기를 바라며. 열논문 하세요!

 

 

도움이 됐다면 커피 한 잔 사주시면 감사하겠습니다^^

 

EPIK is 어려운 지식을 가능한 한 쉽게 공유하는 곳이예요 :)

Hey 👋 I just created a page here. You can now buy me a coffee!

www.buymeacoffee.com

 

반응형

'통계 이야기 > SEM 기초 및 Amos' 카테고리의 다른 글

AMOS 실전 기초 소개  (0) 2020.05.19
CR (Composite/Construct Reliability) 이해하기  (21) 2020.05.19
SEM 적합도 올리기  (0) 2020.05.18
구조방정식 적합도  (0) 2020.05.18
구조방정식(SEM) 이론 기초 4  (0) 2020.05.18
댓글