<aside>

</aside>


πŸ“– 챕터 μ†Œκ°œ

10κ°•μ—μ„œ μš°λ¦¬λŠ” λΉ„μ¦ˆλ‹ˆμŠ€ 문제λ₯Ό μ •μ˜ν•˜κ³ , 데이터에 λŒ€ν•œ κΉŠμ€ 이해λ₯Ό μ–»μ—ˆμŠ΅λ‹ˆλ‹€. 이제 λ“œλ””μ–΄, μš°λ¦¬κ°€ Part 2μ—μ„œ κ°ˆκ³ λ‹¦μ€ 핡심 μ›Œν¬ν”Œλ‘œμš°(setup -> compare_models)λ₯Ό μ‹€μ œ λΆ„λ₯˜ ν”„λ‘œμ νŠΈμ— μ μš©ν•΄ λ³Ό μ‹œκ°„μž…λ‹ˆλ‹€! νšŒκ·€ 뢄석 λ•Œμ™€ λ™μΌν•œ μ›Œν¬ν”Œλ‘œμš°λ₯Ό μ‚¬μš©ν•˜μ§€λ§Œ, μ΄λ²ˆμ—λŠ” 'λΆ„λ₯˜ 문제'의 μ„±λŠ₯을 ν‰κ°€ν•˜λŠ” μƒˆλ‘œμš΄ μ§€ν‘œλ“€μ„ λ§Œλ‚˜κ²Œ 될 κ²λ‹ˆλ‹€. 이 μ§€ν‘œλ“€μ„ μ΄ν•΄ν•˜λŠ” 것이 이번 κ°•μ˜μ˜ ν•΅μ‹¬μž…λ‹ˆλ‹€. μ€€λΉ„λ˜μ…¨λ‚˜μš”? λ‹€μ‹œ ν•œλ²ˆ λ§ˆλ²• 같은 μžλ™ν™”μ˜ νž˜μ„ κ²½ν—˜ν•΄ λ΄…μ‹œλ‹€!


🎯 챕터 λͺ©ν‘œ


πŸ’» 이번 μ±•ν„°μ˜ 전체 μ½”λ“œ 및 ν”„λ‘œμ νŠΈ ꡬ쑰

이번 μ±•ν„°μ˜ 핡심 μ½”λ“œ

πŸ’‘ Part 2μ—μ„œ 배운 μ›Œν¬ν”Œλ‘œμš°μ™€ 거의 λ™μΌν•©λ‹ˆλ‹€. 단, 이제 pycaret.classification λͺ¨λ“ˆμ„ μ‚¬μš©ν•˜κ³ , sort의 기쀀이 λΆ„λ₯˜ ν‰κ°€μ§€ν‘œλ‘œ 바뀐 점을 μ£Όλͺ©ν•˜μ„Έμš”.

# 1. 라이브러리 μ€€λΉ„
from pycaret.datasets import get_data
from pycaret.classification import setup, compare_models

# 2. 데이터 뢈러였기
juice_df = get_data('juice')

# 3. λΆ„λ₯˜ μ‹€ν—˜ ν™˜κ²½ μ„€μ •
# target='Purchase'λŠ” ν…μŠ€νŠΈ(CH/MM)μ΄λ―€λ‘œ PyCaret이 μžλ™μœΌλ‘œ 'λΆ„λ₯˜' 문제둜 μΈμ‹ν•©λ‹ˆλ‹€.
clf_experiment = setup(data=juice_df, target='Purchase', session_id=786)

# 4. λͺ¨λ“  λΆ„λ₯˜ λͺ¨λΈ ν•™μŠ΅ 및 비ꡐ
# Precisionκ³Ό Recall의 쑰화평균인 F1 Scoreλ₯Ό κΈ°μ€€μœΌλ‘œ μ •λ ¬ν•˜μ—¬ 졜적 λͺ¨λΈμ„ μ°ΎμŠ΅λ‹ˆλ‹€.
best_model = compare_models(sort='F1')

μ½”λ“œ μ‹€ν–‰ κ²°κ³Ό 미리보기

setup() μ‹€ν–‰ ν›„ λ‚˜νƒ€λ‚˜λŠ” 정보 ν…Œμ΄λΈ”

λ‹€λ₯Έ 것은 νšŒκ·€ λ•Œμ™€ λΉ„μŠ·ν•˜μ§€λ§Œ, Target Type이 Binary둜 μ„€μ •λœ 것을 확인할 수 μžˆμŠ΅λ‹ˆλ‹€.

Description Value
0 Session id 786
1 Target Purchase
2 Target type Binary
3 Target mapping CH: 0, MM: 1
4 Original data shape (1070, 19)
5 Transformed data shape (1070, 19)
6 Transformed train set shape (749, 19)
7 Transformed test set shape (321, 19)
... ... ...
22 USI 6510

compare_models() μ‹€ν–‰ ν›„ λ‚˜νƒ€λ‚˜λŠ” μ„±λŠ₯ 비ꡐ κ·Έλ¦¬λ“œ