본문 바로가기
빅데이터분석기사

시계열 분석

by 아마도개발자 2025. 5. 21.

 

1. 시계열 자료

 

가. 개요

  • 시간의 흐름에 따라 관찰된 값
  • 시계열 데이터의 분석을 통해 미래의 값을 예측, 경향, 주기, 계절성 등을 파악하여 활용

나. 시계열 자료의 종류

  • 비정상성 시계열 자료: 시계열 분석을 실시할 때 다루기 어려운 자료로 대부분의 시계열자료가 해당
  • 정상성 시계열 자료: 비정상 시계열을 핸들링해 다루기 쉬운 시계열 자료로 변환한 자료

 

2. 정상성

 

가. 평균이 일정한 경우

  • 모든 시점에 대해 일정한 평균을 가짐
  • 평균이 일정하지 않은 시계열은 차분을 통해 정상화

*차분 현시점 자료에서 전 시점 자료를 빼는 것

 

나. 분산이 일정

  • 분산도 시점에 의존하지 않고 일정해야함
  • 분산이 일정하지 않은 경우 변환을 통해 정상

다. 공분산도 단지 시차에만 의존, 실제 특정 시점 t,s에는 의존하지 않는다.

라. 정상 시계열의 특징

  • 어떤 시점에서 평균과 분산 그리고 특정한 시차의 길이를 갖는 자기공분산을 측정하더라도 동일한 값을 가짐
  • 항상 그 평균값으로 회귀하려는 경향이 있음. 평균값 주변에서의 변동은 대체로 일정한 폭을 가짐
  • 정상 시계열이 아닌 경우 특정 기간의 시계열 자료로부터 얻은 정보를 다른 시기로 일반화 할 수 없음

 

3. 시계열자료 분석방법

가. 분석방법

  • 회귀분석 방법
  • Box-Jenkins 방법
  • 지수평활법
  • 시계열 분해법

나. 자료 형태에 따른 분석방법

  • 일변량 시계열분석:Box-Jenkins(ARMA), 지수 평활법, 시계열 분해법, 시간(t)을 설명변수로 한 회귀모형주가, 소매물가지수 등 하나의 변수에 관심을 갖는 시계열 분석
  • 다중 시계열분석: 계량경제 모형, 전이함수 모형, 개입분석, 상태공간 분석, 다변량 ARIMA 등 여러 개의 시간에 따른 변수들을 활용하는 시계열 분석

다. 이동평균법

  • 과거로부터 현재까지의 시계열 자료를 대상으로 일정기간별 이동평균을 계산하고, 이들의 추세를 파악하여 다음 기간을 예측하는 방법
  • 시계열 자료에서 계절변동과 불규칙변동을 제거하여 추세변동과 순환변동만 가진 시계열로 변환하는 방법으로도 사용
  • n개의 시계열 데이터를 m 기간 이동평균하면 n-m+1개의 이동평균 데이터 생성
  • 간단하고 쉽게 미래를 예측, 자료의 수가 많고 안정된 패턴을 보이는 경우 예측의 품질이 높음
  • 특정 기간 안에 속하는 시계열에 대해서 동일한 가중치 부여
  • 적절한 기간을 사용하는 것이 가장 중요. 즉, 적절한 m의 개수를 결정하는 것이 중요

라. 지수평활법

  • 이동평균법과 달리 모든 시계열 자료를 사용하여 평균을 구하며, 최근 시계열에 더 많은 가중치를 부여하여 미래 예측
  • 단기간에 발생하는 불규칙변동을 평활하는 방법
  • 자료의 수가 많고, 안정된 패턴을 보일수록 예측 품질 높음
  • 지수평활계수는 과거로 갈수록 지속 감소
  • 중기 예측 이상에 주로 사용

 

4. 시계열 모형

가. 자기회귀 모형(AR모형)

  • p시점 전의 자료가 현재 자료에 여향을 주는 특성을 자기상관성이라 하며, 자기회귀 모형이란 자기 상관성을 시계열 모형으로 구성한 것

나. 이동평균 모형(MR모형)

  • 이동평균 모형이란 시간이 지날수록 관측치의 평균값이 지속적으로 증가하거나 감소하는 경향을 표현한 시계열 모형
  • 현시점의 자료를 유한한 개수의 백색잡음의 결합으로 표현하기 때문에 언제나 정상성을 만족

다. 자기회귀누적이동평균 모형(ARIMA(p,d,q) 모형)

  • 자기회귀와 이동평균을 모두 고려하는 모형, 과거값과 과거 예측오차를 통해 현재값을 설명
  • ARIMA 모형은 비정상 시계열 모형이므로 차분이나 변환을 통해 AR 모형이나 MA모형, 이 둘을 합친 ARMA모형으로 정상화
  • ARIMA 모형은 p,d,q의 세가지 차수가 있다. d는 차분의 횟수, p는 AR모형, q는 MA모형과 관련
  • 정상성 시계열에 한해 사용

라. 분해 시계열

  • 시계열에 영향을 주는 요인을 시계열에서 분리해 분석하는 방법. 회귀분석적 방법을 주로 사용 
구분 요인 설명
추세 장기 변동 요인 어떠한 경제, 이유의 영향으로 앞으로 나아갈 방향성 반영
계절 단기 변동요인  요일, 월, 사계절, 분기 등 일정한 기간에 따라 자료가 변화
순환 중장기 변동 요인 경제적이나 자연적인 이유 없이 알려지지 않은 주기를 가지고 변화하는 자료
불규칙 설명 불가 요인 어떠한 규칙 없이 예측 불가능한 변동

 

 

'빅데이터분석기사' 카테고리의 다른 글

데이터 수집  (0) 2025.05.27
t-test  (2) 2025.05.25
추정과 가설검정  (0) 2025.05.19
확률분포  (0) 2025.05.06
[빅데이터분석기사 필기] 4-2 분석결과 해석 및 활용  (0) 2024.08.18