<aside>
</aside>
17κ°μμ λΉμ§λ νμ΅κ³Ό κ΅°μ§νμ κ°λ
μ νμ€ν μ‘μμΌλ, μ΄μ μ§μ μ½λλ₯Ό μ€νν΄ λ³Ό μκ°μ
λλ€! μ΄λ² μκ°μλ PyCaretμ μ΅μν ν¨μλ€μ΄ 'μ λ΅ μλ λ°μ΄ν°'λ₯Ό λ§λ μ΄λ»κ² λ³ννλμ§ νμΈν΄ λ³Ό κ²λλ€. setup
ν¨μλ₯Ό νκ² λ³μ μμ΄ μ€ννκ³ , κ°μ₯ λνμ μΈ κ΅°μ§ μκ³ λ¦¬μ¦μΈ K-Meansλ₯Ό create_model
λ‘ μμ±νμ¬ μ°λ¦¬ κ³ κ° λ°μ΄ν°μ μ¨κ²¨μ§ κ·Έλ£Ήμ μ°Ύμλ³΄κ² μ΅λλ€. λν, κ΅°μ§μ΄ μΌλ§λ μ νμ±λμλμ§ νκ°νλ μλ‘μ΄ 'μ±μ ν'λ₯Ό μ½λ λ²λ λ°°μ°κ² λ κ²λλ€!
target
νλΌλ―Έν° μμ΄ setup()
ν¨μλ₯Ό μ¬μ©νμ¬ κ΅°μ§ν μ€ν νκ²½μ μ΄κΈ°νν μ μμ΅λλ€.create_model()
ν¨μλ₯Ό μ¬μ©νμ¬ K-Means(kmeans
) κ΅°μ§ λͺ¨λΈμ μμ±ν μ μμ΅λλ€.π‘ μ§λ νμ΅κ³Ό λ¬λ¦¬, setupμ targetμ΄ μκ³ compare_models λμ create_modelμ λ°λ‘ μ¬μ©ν©λλ€.
# 1. λΌμ΄λΈλ¬λ¦¬ μ€λΉ
from pycaret.datasets import get_data
from pycaret.clustering import setup, create_model
# 2. λ°μ΄ν° λΆλ¬μ€κΈ°
wholesale_df = get_data('wholesale')
# 3. κ΅°μ§ν μ€ν νκ²½ μ€μ
# Target λ³μκ° μμΌλ―λ‘ target νλΌλ―Έν°λ₯Ό μ§μ νμ§ μμ΅λλ€!
clu_experiment = setup(data=wholesale_df, session_id=123)
# 4. K-Means κ΅°μ§ λͺ¨λΈ μμ±
# PyCaretμ κΈ°λ³Έ μ€μ μ λ°λΌ 4κ°μ κ΅°μ§(n_clusters=4)μ μμ±ν©λλ€.
kmeans_model = create_model('kmeans')
# 5. μμ±λ λͺ¨λΈ νμΈ
# create_modelμ΄ λ°ννλ ν
μ΄λΈμ Jupyter Notebookμμ μλμΌλ‘ μΆλ ₯λ©λλ€.
# μλ μ½λλ μμ±λ λͺ¨λΈ κ°μ²΄ μ체λ₯Ό νμΈνλ μ½λμ
λλ€.
print(kmeans_model)
setup()
μ€ν ν λνλλ μ 보 ν
μ΄λΈTarget κ΄λ ¨ νλͺ©μ΄ μκ³ , λ°μ΄ν°λ₯Ό νμ΅/ν μ€νΈμ©μΌλ‘ λλμ§ μμ train set shape νλͺ©μ΄ μλ κ²μ λ³Ό μ μμ΅λλ€.
Description | Value | |
---|---|---|
0 | Session id | 123 |
1 | Original data shape | (440, 8) |
2 | Transformed data shape | (440, 8) |
3 | Numeric features | 8 |
... | ... | ... |
12 | USI | 0437 |
create_model('kmeans')
μ€ν κ²°κ³ΌK-Means λͺ¨λΈμ΄ μμ±λ ν, κ΅°μ§ λͺ¨λΈμ μν μλ‘μ΄ νκ°μ§νλ€μ΄ λ΄κΈ΄ ν μ΄λΈμ΄ μΆλ ₯λ©λλ€.