📖 챕터 소개

15강에서 우리는 R² 점수가 높은, 아주 훌륭한 회귀 모델을 만들었습니다. 하지만 높은 점수 하나만으로 이 모델을 완전히 신뢰할 수 있을까요? 마치 건강검진에서 혈압이 정상이라고 해서 몸 전체가 건강하다고 단정할 수 없는 것처럼, 모델도 다각도로 '진단'해 봐야 합니다. 이번 시간에는 plot_model을 사용하여 우리 모델의 숨겨진 문제점은 없는지, 예측은 편향되지 않았는지, 어떤 데이터에 특히 영향을 많이 받는지 등을 살펴보는 '모델 의사'가 되어보겠습니다.

🎯 챕터 목표

높은 R² 점수 너머에 있는 모델의 잠재적 문제점을 진단하기 위해 시각화를 활용할 수 있습니다.
**잔차 플롯 (residuals)**을 해석하여 모델 오차의 등분산성(Homoscedasticity)을 확인할 수 있습니다.
**예측 에러 플롯 (error)**을 통해 모델의 예측이 실제 값과 얼마나 차이 나는지 시각적으로 파악할 수 있습니다.
**쿡 거리 플롯 (cooks)**을 사용하여 모델 전체에 큰 영향을 미치는 '영향점(influential points)'을 식별할 수 있습니다.

💻 이번 챕터의 전체 코드 및 프로젝트 구조

이번 챕터의 핵심 코드

💡 15강에서 최종적으로 튜닝한 tuned_best_model을 사용하여, 회귀 모델 진단에 필수적인 세 가지 핵심 플롯을 생성하고 분석합니다.

# 1. 라이브러리 및 튜닝된 모델 준비 (1~15강 내용)
from pycaret.datasets import get_data
from pycaret.regression import setup, compare_models, tune_model, plot_model

# 데이터 로드, 설정, 모델 비교 및 튜닝
insurance_df = get_data('insurance')
setup(
    data=insurance_df, target='charges', session_id=123,
    transform_target=True, transform_target_method='quantile',
    fold_shuffle=True
)
best_model = compare_models(sort='R2')
tuned_best_model = tune_model(best_model, optimize='R2', n_iter=100)

# 2. 모델 진단을 위한 핵심 플롯 생성
# 잔차 플롯 (Residuals Plot) - 오차의 패턴 확인
print("--- 1. 잔차 플롯 (오차의 무작위성 확인) ---")
plot_model(tuned_best_model, plot='residuals')

# 예측 에러 플롯 (Prediction Error Plot) - 예측값 vs 실제값 비교
print("\\n--- 2. 예측 에러 플롯 (예측값 vs 실제값 비교) ---")
plot_model(tuned_best_model, plot='error')

# 쿡 거리 플롯 (Cook's Distance Plot) - 영향력 있는 데이터 확인
print("\\n--- 3. 쿡 거리 플롯 (영향력 있는 데이터 확인) ---")
plot_model(tuned_best_model, plot='cooks')

📖 챕터 소개

🎯 챕터 목표

💻 이번 챕터의 전체 코드 및 프로젝트 구조

이번 챕터의 핵심 코드

코드 실행 결과 미리보기

1. 잔차 플롯 (`residuals`) 실행 결과

2. 예측 에러 플롯 (`error`) 실행 결과

📖 챕터 소개

🎯 챕터 목표

💻 이번 챕터의 전체 코드 및 프로젝트 구조

이번 챕터의 핵심 코드

코드 실행 결과 미리보기

1. 잔차 플롯 (residuals) 실행 결과

2. 예측 에러 플롯 (error) 실행 결과

1. 잔차 플롯 (`residuals`) 실행 결과

2. 예측 에러 플롯 (`error`) 실행 결과