본문 바로가기
빅데이터분석기사

t-test

by 아마도개발자 2025. 5. 25.

 

1. t검정

가. 개요

  • 평균에 대한 가설검정을 수행
  • 두 집단 간 평균의 차이가 통계적으로 유의한지를 판단하는 통계 기법
  • 표본평균이 모집단평균과 동일한지 여부는 t값을 검정통계량으로 사용하여 검정
  • 모집단의 분산이나 표준편차를 알지 못할 때 모집단을 대표하는 표본으로부터 추정된 분산이나 표준편차를 가지고 검정하는 방법

나. 사용 조건

 

  • 표본이 정규분포를 따른다고 가정
  • 데이터가 연속형
  • 관측값들이 독립적
  • 표본의 크기가 작을 때(n < 30) 사용하기 적합

다. 종류

  • 단일 표본 t-test (One-sample t-test)
    • 하나의 표본 평균이 특정 값과 다른지를 검정
    • 예시: 어떤 반의 평균 수학 성적이 전국 평균(70점)과 유의하게 다른가?
  • 독립 표본 t-test (Independent two-sample t-test)
    • 두 독립된 그룹 간 평균 비교
    • 예시: 남학생과 여학생의 시험 성적이 유의하게 다른가?
  • 대응 표본 t-test (Paired t-test)
    • 한 그룹의 전후 변화 또는 쌍으로 묶인 데이터 비교
    • 예시: 다이어트 전후 체중 변화, 수술 전후 통증 수치 비교 등

라. 기본 가정

정규성 표본이 정규 분포를 따라야 함
등분산성 독립표본 t-test에서는 두 집단의 분산이 같아야 함 (Levene's test로 확인)
독립성 각 관측치는 서로 독립적이어야 함
연속형 데이터 종속변수는 숫자형(연속형)이어야 함

 

 

2. t분포

  • t분포는 정규분포와 유사한 종 모양의 형태이며 정규분포에 비해 양쪽 꼬리부분의 면적이 두터움
  • 표본크기에 따라 t분포의 종 모양이 변화
  • 표본크기가 클수록 t분포의 종 모양이 뾰족해지며, 표본 크기가 작을수록 정점이 낮아지면서 꼬리 부분 면적이 커짐
  • 표분크기가 충분히 커지면 t분포와 정규분포(z분포)는 거의 구별되지 않음

 

'빅데이터분석기사' 카테고리의 다른 글

데이터 수집  (0) 2025.05.27
시계열 분석  (0) 2025.05.21
추정과 가설검정  (0) 2025.05.19
확률분포  (0) 2025.05.06
[빅데이터분석기사 필기] 4-2 분석결과 해석 및 활용  (0) 2024.08.18