본문 바로가기
카테고리 없음

카이제곱 검정 (Chi-Squared Test)

by 자몽먹은토끼 2024. 11. 11.
728x90
반응형

카이제곱 검정 이란?

두 범주형 변수에 대한 분석방법으로, 데이터 수집 방법과 가설에 따라 적합도 검정(goodness of fit), 동질성 검정(Test of Homogeneity), 독립성 검정(Test for Independence) 으로 3가지 종류가 있다.

 

 

적합도 검정 (Goodness of Fit Test)

 

: 한 범주형 변수의 각 그룹 별 비율이 특정 상수비와 같은지 검정하는 방법

 

 

  • 변수의 수 : 1
  • 기존에 알려진 기준이 존재해야 함
  • 관찰된 비율 값이 기대값과 유의하게 다른지를 검증

 

 

 

 

 

 

동질성 검정 (Test of Homogeneity)

 

: 두 범주형 변수의 분포가 동일한지 검정하는 방법

 

 

  • 변수의 수 : 2
  • 동질성 검정은 행변수를 고정?
  • 각 집단이 서로 유사한 성향을 가지는가

 

 

 

 

 

 

독립성 검정 (Test for Independence)

 

: 두 범주형 변수가 서로 독립인지를 검정하는 방법

 

 

  • 변수의 수 : 2
  • 독립성 검정은 전체 표본수(N)를 고정?
  • 전체 조사대상을 고정한 뒤, 조사 결과를 바탕으로 두 범주형 변수 간 연관관계가 유의한지 검정
  • 귀무가설 : 두 변수는 연관성이 없음 (= 독립)
  • 대립가설 : 두 변수는 연관성이 있음 (= 독립x)

 

 

 

import pandas as pd

obs= pd.DataFrame({'당뇨': [10,15], '정상': [10,65]})
obs.index= ['비만체중', '정상체중']

from scipy.stats import chi2_contingency

chi_result= chi2_contingency(obs, correction= False)
print('Chi square: {}'.format(chi_result[0]))
print('p-value: {}'.format(chi_result[1]))

> p-value값이 0.05보다 작으면, 귀무가설을 기각 (= 독립x)

728x90
반응형