<aside>

</aside>


πŸ“– 챕터 μ†Œκ°œ

μ•žμ„  두 ν”„λ‘œμ νŠΈμ—μ„œ μš°λ¦¬λŠ” 'μ •λ‹΅'이 μžˆλŠ” 데이터λ₯Ό κ°€μ§€κ³  미래λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” **지도 ν•™μŠ΅(Supervised Learning)**의 세계λ₯Ό νƒν—˜ν–ˆμŠ΅λ‹ˆλ‹€. ν•˜μ§€λ§Œ λ§Œμ•½ μš°λ¦¬μ—κ²Œ μ •λ‹΅μ§€κ°€ μ—†λ‹€λ©΄ μ–΄λ–¨κΉŒμš”? 데이터 속에 μˆ¨κ²¨μ§„ 보물을 직접 μ°Ύμ•„λ‚΄μ•Ό ν•œλ‹€λ©΄μš”? 이번 μ‹œκ°„λΆ€ν„° μš°λ¦¬λŠ” **비지도 ν•™μŠ΅(Unsupervised Learning)**μ΄λΌλŠ” μƒˆλ‘œμš΄ μ˜μ—­μ— λ„μ „ν•©λ‹ˆλ‹€. 첫 번째 κ³Όμ œλŠ” λ„λ§€μ—…μžμ˜ 고객 데이터λ₯Ό λ°”νƒ•μœΌλ‘œ, λΉ„μŠ·ν•œ ꡬ맀 νŒ¨ν„΄μ„ κ°€μ§„ 고객 그룹을 μ°Ύμ•„λ‚΄λŠ” '고객 μ„ΈλΆ„ν™”(Customer Segmentation)' ν”„λ‘œμ νŠΈμž…λ‹ˆλ‹€. μ •λ‹΅ μ—†λŠ” 데이터 μ†μ—μ„œ μˆ¨κ²¨μ§„ μ§ˆμ„œλ₯Ό λ°œκ²¬ν•˜λŠ” ν₯미둜운 여정을 μ‹œμž‘ν•΄ λ΄…μ‹œλ‹€!


🎯 챕터 λͺ©ν‘œ


πŸ’» 이번 μ±•ν„°μ˜ 전체 μ½”λ“œ 및 ν”„λ‘œμ νŠΈ ꡬ쑰

이번 μ±•ν„°μ˜ 핡심 μ½”λ“œ

πŸ’‘ 이번 μ‹œκ°„μ€ κ°œλ… 이해가 μ€‘μš”ν•˜λ―€λ‘œ μ½”λ“œλŠ” κ°„λ‹¨ν•©λ‹ˆλ‹€. 데이터λ₯Ό λΆˆλŸ¬μ™€ ꡬ쑰λ₯Ό μ‚΄νŽ΄λ³΄λ©°, κ°€μž₯ μ€‘μš”ν•œ νŠΉμ§•μΈ **'νƒ€κ²Ÿ λ³€μˆ˜μ˜ λΆ€μž¬'**λ₯Ό 직접 ν™•μΈν•©λ‹ˆλ‹€.

# 1. 라이브러리 μ€€λΉ„
from pycaret.datasets import get_data
# μ΄λ²ˆμ—” κ΅°μ§‘ λΆ„μ„μ΄λ―€λ‘œ clustering λͺ¨λ“ˆμ„ μ‚¬μš©ν•©λ‹ˆλ‹€.
from pycaret.clustering import *

# 2. 데이터 뢈러였기 ('wholesale' 데이터셋)
wholesale_df = get_data('wholesale')

# 3. 데이터 확인
# 'Channel', 'Region' μ™Έμ—λŠ” λͺ¨λ‘ μ œν’ˆ μΉ΄ν…Œκ³ λ¦¬λ³„ μ—°κ°„ μ§€μΆœμ•‘μž…λ‹ˆλ‹€.
# μš°λ¦¬κ°€ μ˜ˆμΈ‘ν•΄μ•Ό ν•  'μ •λ‹΅(Target)' 컬럼이 μ‘΄μž¬ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€!
print(wholesale_df.head())

μ½”λ“œ μ‹€ν–‰ κ²°κ³Ό 미리보기

wholesale_df.head() μ‹€ν–‰ κ²°κ³Ό

Fresh, Milk, Grocery λ“± 각 고객이 μƒν’ˆ μΉ΄ν…Œκ³ λ¦¬λ³„λ‘œ μ–Όλ§ˆλ‚˜ μ§€μΆœν–ˆλŠ”μ§€μ— λŒ€ν•œ λ°μ΄ν„°λ§Œ μžˆμ„ 뿐, 이 고객이 '우수 고객'인지 'μ΄νƒˆ μœ„ν—˜ 고객'인지 μ•Œλ €μ£ΌλŠ” μ •λ‹΅ 컬럼이 μ—†μŠ΅λ‹ˆλ‹€.

   Channel  Region  Fresh  Milk  Grocery  Frozen  Detergents_Paper  Delicassen
0        2       3  12669  9656     7561     214              2674        1338
1        2       3   7057  9810     9568    1762              3293        1776
2        2       3   6353  8808     7684    2405              3516        7844
3        1       3  13265  1196     4221    6404               507        1788
4.       2       3  22615  5410     7198    3915              1777        5185

지도 ν•™μŠ΅ vs 비지도 ν•™μŠ΅

graph TD
    subgraph "지도 ν•™μŠ΅ (Supervised Learning) 🧠"
        A["μž…λ ₯ 데이터 (Features)"] -- μ •λ‹΅κ³Ό ν•¨κ»˜ --> C{λͺ¨λΈ ν•™μŠ΅};
        B["μ •λ‹΅ (Target)"] --> C;
        C --> D[예츑 λͺ¨λΈ];
    end

    subgraph "비지도 ν•™μŠ΅ (Unsupervised Learning) πŸ—ΊοΈ"
        E["μž…λ ₯ 데이터 (Features only)"] -- μ •λ‹΅ 없이 --> F{λͺ¨λΈ ν•™μŠ΅};
        F --> G["λ°μ΄ν„°μ˜ ꡬ쑰 발견 (예: 고객 κ·Έλ£Ή)"];
    end