<aside>

</aside>


πŸ“– 챕터 μ†Œκ°œ

17κ°•μ—μ„œ 비지도 ν•™μŠ΅κ³Ό κ΅°μ§‘ν™”μ˜ κ°œλ…μ„ ν™•μ‹€νžˆ μž‘μ•˜μœΌλ‹ˆ, 이제 직접 μ½”λ“œλ₯Ό μ‹€ν–‰ν•΄ λ³Ό μ‹œκ°„μž…λ‹ˆλ‹€! 이번 μ‹œκ°„μ—λŠ” PyCaret의 μ΅μˆ™ν•œ ν•¨μˆ˜λ“€μ΄ 'μ •λ‹΅ μ—†λŠ” 데이터'λ₯Ό λ§Œλ‚˜ μ–΄λ–»κ²Œ λ³€ν™”ν•˜λŠ”μ§€ 확인해 λ³Ό κ²λ‹ˆλ‹€. setup ν•¨μˆ˜λ₯Ό νƒ€κ²Ÿ λ³€μˆ˜ 없이 μ‹€ν–‰ν•˜κ³ , κ°€μž₯ λŒ€ν‘œμ μΈ κ΅°μ§‘ μ•Œκ³ λ¦¬μ¦˜μΈ K-Meansλ₯Ό create_model둜 μƒμ„±ν•˜μ—¬ 우리 고객 데이터에 μˆ¨κ²¨μ§„ 그룹을 μ°Ύμ•„λ³΄κ² μŠ΅λ‹ˆλ‹€. λ˜ν•œ, ꡰ집이 μ–Όλ§ˆλ‚˜ 잘 ν˜•μ„±λ˜μ—ˆλŠ”μ§€ ν‰κ°€ν•˜λŠ” μƒˆλ‘œμš΄ 'μ„±μ ν‘œ'λ₯Ό μ½λŠ” 법도 배우게 될 κ²λ‹ˆλ‹€!


🎯 챕터 λͺ©ν‘œ


πŸ’» 이번 μ±•ν„°μ˜ 전체 μ½”λ“œ 및 ν”„λ‘œμ νŠΈ ꡬ쑰

이번 μ±•ν„°μ˜ 핡심 μ½”λ“œ

πŸ’‘ 지도 ν•™μŠ΅κ³Ό 달리, setup에 target이 μ—†κ³  compare_models λŒ€μ‹  create_model을 λ°”λ‘œ μ‚¬μš©ν•©λ‹ˆλ‹€.

# 1. 라이브러리 μ€€λΉ„
from pycaret.datasets import get_data
from pycaret.clustering import setup, create_model

# 2. 데이터 뢈러였기
wholesale_df = get_data('wholesale')

# 3. κ΅°μ§‘ν™” μ‹€ν—˜ ν™˜κ²½ μ„€μ •
# Target λ³€μˆ˜κ°€ μ—†μœΌλ―€λ‘œ target νŒŒλΌλ―Έν„°λ₯Ό μ§€μ •ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€!
clu_experiment = setup(data=wholesale_df, session_id=123)

# 4. K-Means κ΅°μ§‘ λͺ¨λΈ 생성
# PyCaret의 κΈ°λ³Έ 섀정에 따라 4개의 κ΅°μ§‘(n_clusters=4)을 μƒμ„±ν•©λ‹ˆλ‹€.
kmeans_model = create_model('kmeans')

# 5. μƒμ„±λœ λͺ¨λΈ 확인
# create_model이 λ°˜ν™˜ν•˜λŠ” ν…Œμ΄λΈ”μ€ Jupyter Notebookμ—μ„œ μžλ™μœΌλ‘œ 좜λ ₯λ©λ‹ˆλ‹€.
# μ•„λž˜ μ½”λ“œλŠ” μƒμ„±λœ λͺ¨λΈ 객체 자체λ₯Ό ν™•μΈν•˜λŠ” μ½”λ“œμž…λ‹ˆλ‹€.
print(kmeans_model)

μ½”λ“œ μ‹€ν–‰ κ²°κ³Ό 미리보기

setup() μ‹€ν–‰ ν›„ λ‚˜νƒ€λ‚˜λŠ” 정보 ν…Œμ΄λΈ”

Target κ΄€λ ¨ ν•­λͺ©μ΄ μ—†κ³ , 데이터λ₯Ό ν•™μŠ΅/ν…ŒμŠ€νŠΈμš©μœΌλ‘œ λ‚˜λˆ„μ§€ μ•Šμ•„ train set shape ν•­λͺ©μ΄ μ—†λŠ” 것을 λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

Description Value
0 Session id 123
1 Original data shape (440, 8)
2 Transformed data shape (440, 8)
3 Numeric features 8
... ... ...
12 USI 0437

create_model('kmeans') μ‹€ν–‰ κ²°κ³Ό

K-Means λͺ¨λΈμ΄ μƒμ„±λœ ν›„, κ΅°μ§‘ λͺ¨λΈμ„ μœ„ν•œ μƒˆλ‘œμš΄ ν‰κ°€μ§€ν‘œλ“€μ΄ λ‹΄κΈ΄ ν…Œμ΄λΈ”μ΄ 좜λ ₯λ©λ‹ˆλ‹€.