Veri Biliminde Çapraz Doğrulama (Cross Validation) Ne İşe Yarar
Giriş: Model Performansını Doğru Ölçmek Neden Önemlidir
1. Çapraz Doğrulama Nedir
2. Çapraz Doğrulama Çeşitleri
1. Holdout (Ayrılmış Veri Seti Yöntemi)
2. K-Fold Çapraz Doğrulama
3. Stratified K-Fold Çapraz Doğrulama
4. Leave-One-Out Cross Validation (LOO-CV)
3. Çapraz Doğrulama Neden Önemlidir
- Modelin bilinmeyen veriler üzerinde nasıl çalıştığını test eder.
- Modelin sadece eğitim verisini ezberlemesini engeller.
- Veri yetersizliği durumlarında bile daha güvenilir sonuçlar üretir.
- Modelin en iyi ayarlarını belirlemek için çapraz doğrulama sonuçları kullanılır.
4. Çapraz Doğrulama Makine Öğreniminde Nasıl Kullanılır
from sklearn.model_selection import cross_val_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
# Veri setini yükle
iris = load_iris()
X, y = iris.data, iris.target
# Modeli tanımla
model = RandomForestClassifier()
# K-Fold Çapraz Doğrulama
scores = cross_val_score(model, X, y, cv=5)
print("Çapraz doğrulama skorları:", scores)
print("Ortalama doğruluk:", scores.mean())
Sonuç: Çapraz Doğrulama Ne İşe Yarar
Son düzenleme: