📖 챕터 소개

11강에서 우리는 가장 뛰어난 단일 모델들을 찾아냈습니다. 하지만 최고의 선수 한 명으로 팀을 꾸리는 것보다, 각기 다른 강점을 가진 선수들로 '드림팀'을 만들면 더 좋은 성과를 낼 수 있지 않을까요? 이번 시간에는 개별 모델들을 먼저 최적의 상태로 튜닝한 뒤, 이들을 결합하여 성능을 극대화하는 전문가 수준의 앙상블(Ensemble) 워크플로우를 배워보겠습니다. 또한 모델이 내놓는 예측 '확률'의 신뢰도를 높이는 **모델 보정(Calibration)**까지 다뤄보겠습니다. 모델의 성능을 한계까지 끌어올릴 준비, 되셨나요?

🎯 챕터 목표

개별 모델을 먼저 튜닝한 후 앙상블하는 전문가의 워크플로우를 이해합니다.
blend_models() (soft voting)를 사용하여 여러 튜닝된 모델을 효과적으로 결합할 수 있습니다.
stack_models() (stacking)를 사용하여 튜닝된 모델들 위에 메타 모델을 학습시켜 성능을 극대화할 수 있습니다.
calibrate_model() 함수를 사용하여 모델의 예측 확률값의 신뢰도를 높일 수 있습니다.

💻 이번 챕터의 전체 코드 및 프로젝트 구조

이번 챕터의 핵심 코드

💡 [튜닝 후 앙상블]: 상위 모델들을 각각 튜닝하여 개별 성능을 먼저 끌어올린 뒤, 이 최적화된 모델들을 앙상블하여 시너지를 만듭니다.

# 1. 라이브러리 준비
from pycaret.datasets import get_data
from pycaret.classification import setup, compare_models, tune_model
from pycaret.classification import blend_models, stack_models, create_model, calibrate_model, predict_model

# 2. 실험 환경 설정
df = get_data('juice')
setup(data=df, target='Purchase', session_id=786, fold_shuffle=True)

# 3. F1 기준 상위 3개 모델 선택 (확률 예측을 지원하지 않는 모델 제외)
top3 = compare_models(sort='F1', n_select=3, exclude=['ridge','svm'])

# 4. 상위 모델 각각 튜닝
tuned_top3 = [tune_model(m, optimize='F1', choose_better=True) for m in top3]

# 5. 튜닝된 모델들로 앙상블 수행 및 최종 성능 검증
print("\\n--- 1. 블렌딩(Blending) 모델 성능 ---")
blended_model = blend_models(estimator_list=tuned_top3, method='soft')
print("\\n[Holdout] Blending")
predict_model(blended_model)

print("\\n--- 2. 스태킹(Stacking) 모델 성능 ---")
stacked_model = stack_models(estimator_list=tuned_top3, meta_model=create_model('lr'))
print("\\n[Holdout] Stacking")
predict_model(stacked_model)

# (참고) 단일 모델 보정
print("\\n--- 3. 모델 보정(Calibration) 성능 ---")
calibrated_lda = calibrate_model(create_model('lda'))
print("\\n[Holdout] Calibrated LDA")
predict_model(calibrated_lda)

코드 실행 결과 미리보기

성능 향상 요약

앙상블 기법들이 단일 모델의 성능을 뛰어넘는 것을 확인할 수 있습니다. 특히 스태킹 모델이 홀드아웃 테스트에서 가장 높은 F1 점수를 기록했습니다.

모델	교차 검증 (CV) Mean F1	홀드아웃 (Test) F1
`lr` (단일 모델)	0.8193	-
`lr` (튜닝 후)	0.8274	-
블렌딩 모델	0.8209	0.8260
스태킹 모델	0.8240	0.8342 ✨