티스토리 뷰

반응형

이번 가을 학기 강의하면서 통계의 기초에 대한 공부를 다시 해봤어요.

이미 기초를 넘어선 분들이 많겠지만, 언제나 새롭게 시작하시는 분들이 있으니 이번에는 기초적인 부분을 끄적여볼게요.

 

Descriptive Statistics (기술 통계)?

기술통계(띄는게 맞는걸까요? 흠..)는 영어를 보면 쉬워요. Descriptive, 즉 어떤 데이터를 describe, 묘사하는 거예요. 현재 내가 갖고 있는 데이터를 요약하는 거라고 생각하면 돼요. 예를 들어, 100명의 응답을 모은 후 얼마나 많은 사람들이 현재 정권을 지지하는지 본다면 이건 기술 통계예요.

 

Inferential Statistics (추리 통계)?

추리통계는 추론을 하는거예요. 한국인 전체가 현재 정권을 얼마나 지지하는지 보려면 엄청난 돈과 시간이 들겠죠? 그래서 한국인 중 예를 들어 100명만 추려서 조사를 해요. 그리고 이 100명의 데이터를 이용해서 한국인 전체에 대한 태도를 추론 하는게 추리통계예요. 

 

이 두 통계 방법을 구분하는데 있어서 가장 중요한 건 population (모집단)sample (표본집단)을 구분하는 거예요. 위의 예에서 한국인 전체가 우리의 모집단이고 한국인을 대표할 수 있는 100명의 집단이 표본집단이예요.

 

그리고 모집단에 대한 값을 parameter (모수)라고 하고, 표본집단에 대한 값을 statistic (통계량)이라고 해요. 

 

다시 위로 돌아가서, 기술통계는 이 통계량을 구하는 것을 말하고 추리통계는 통계량을 통해서 모수를 추정하는 것을 말해요. 100명 중 50%가 현재 정권을 지지한다는 것은 통계량이며 여기까지는 기술통계 과정이예요. 100명 중 50%가 현재 정권을 지지하니 한국인 전체 인구 중 45%~55%는 95% 확률로 현재 정권을 지지할꺼야 라고 추정하는게 추리통계고요. 

 

너무 한번에 깊게 들어가지 말고 기본 개념부터 차근차근 해나가보세요. 기술통계와 추리통계를 구분할 수 있고, 모집단/표본집단, 모수/통계량을 구분할 수 있다면 다음 스텝으로 넘어가보세요!

 

도움이 됐다면 커피 한 잔 사주시면 감사하겠습니다^^

 

EPIK is 어려운 지식을 가능한 한 쉽게 공유하는 곳이예요 :)

Hey 👋 I just created a page here. You can now buy me a coffee!

www.buymeacoffee.com

 

반응형
댓글