1. t검정
가. 개요
- 평균에 대한 가설검정을 수행
- 두 집단 간 평균의 차이가 통계적으로 유의한지를 판단하는 통계 기법
- 표본평균이 모집단평균과 동일한지 여부는 t값을 검정통계량으로 사용하여 검정
- 모집단의 분산이나 표준편차를 알지 못할 때 모집단을 대표하는 표본으로부터 추정된 분산이나 표준편차를 가지고 검정하는 방법
나. 사용 조건
- 표본이 정규분포를 따른다고 가정
- 데이터가 연속형
- 관측값들이 독립적
- 표본의 크기가 작을 때(n < 30) 사용하기 적합
다. 종류
- 단일 표본 t-test (One-sample t-test)
- 하나의 표본 평균이 특정 값과 다른지를 검정
- 예시: 어떤 반의 평균 수학 성적이 전국 평균(70점)과 유의하게 다른가?
- 독립 표본 t-test (Independent two-sample t-test)
- 두 독립된 그룹 간 평균 비교
- 예시: 남학생과 여학생의 시험 성적이 유의하게 다른가?
- 대응 표본 t-test (Paired t-test)
- 한 그룹의 전후 변화 또는 쌍으로 묶인 데이터 비교
- 예시: 다이어트 전후 체중 변화, 수술 전후 통증 수치 비교 등
라. 기본 가정
정규성 | 표본이 정규 분포를 따라야 함 |
등분산성 | 독립표본 t-test에서는 두 집단의 분산이 같아야 함 (Levene's test로 확인) |
독립성 | 각 관측치는 서로 독립적이어야 함 |
연속형 데이터 | 종속변수는 숫자형(연속형)이어야 함 |
2. t분포
- t분포는 정규분포와 유사한 종 모양의 형태이며 정규분포에 비해 양쪽 꼬리부분의 면적이 두터움
- 표본크기에 따라 t분포의 종 모양이 변화
- 표본크기가 클수록 t분포의 종 모양이 뾰족해지며, 표본 크기가 작을수록 정점이 낮아지면서 꼬리 부분 면적이 커짐
- 표분크기가 충분히 커지면 t분포와 정규분포(z분포)는 거의 구별되지 않음