<aside>
</aside>
지금까지 우리는 특정 시점의 결과를 예측하는 분류, 회귀, 군집 분석을 배웠습니다. 이제 머신러닝의 또 다른 매력적인 분야, 바로 '미래'를 예측하는 **시계열 분석(Time Series Analysis)**의 세계로 떠납니다! 이번 시간에는 우리의 마지막 프로젝트인 '항공 승객 수 예측'을 시작하며, 시계열 데이터만이 가진 독특한 특징과 핵심 개념들에 대해 알아보겠습니다. 과거의 데이터 속에 숨겨진 시간의 패턴을 찾아 미래를 엿보는 흥미진진한 여정, 지금 시작합니다!
fh
)**의 중요성을 이해합니다.plotly
와 같은 시각화 도구를 사용하여 시계열 데이터의 패턴을 직접 탐색할 수 있습니다.💡 get_data('airline')은 PeriodIndex를 가진 특별한 형태로 데이터를 반환합니다. 이 구조에 맞춰 plotly 코드를 수정하여 시간의 흐름에 따른 패턴을 정확히 시각화합니다.
# 1. 라이브러리 준비
from pycaret.datasets import get_data
import plotly.express as px # 인터랙티브 시각화를 위한 라이브러리
# 2. 데이터 불러오기 ('airline' 데이터셋)
# airline 데이터는 날짜(Period)가 인덱스, 승객 수가 값인 Series 형태입니다.
s = get_data('airline')
# 3. 데이터 시각화
# x축에는 인덱스(시간), y축에는 값(승객 수)을 직접 지정합니다.
fig = px.line(x=s.index.to_timestamp(), y=s.values,
labels={'x': '기간', 'y': '승객 수'},
title='월별 항공 승객 수 (1949-1960)')
fig.show()
fig.show()
실행 결과그래프를 통해 시간이 지남에 따라 승객 수가 꾸준히 증가하는 추세와, 매년 여름에 승객 수가 급증했다가 겨울에 감소하는 주기적인 계절성 패턴을 명확하게 확인할 수 있습니다.
graph TD
A(시계열 데이터) --> B(추세 Trend);
A --> C(계절성 Seasonality);
A --> D(불규칙 요소 Noise);
subgraph "시간의 패턴"
B & C
end