
ChatGPT’nin Eğitim Süreci Nedir ve Bu Süreçte Hangi Veriler Kullanılır
“Bir yapay zekâ, bilgiyi ezberlemez;
insanlığın dilde bıraktığı izlerden örüntü çıkarır.”
— Ersan Karavelioğlu
ChatGPT Nedir

ChatGPT,
OpenAI tarafından geliştirilen,

insan diliyle metin üretmek üzere eğitilmiş bir
büyük dil modelidir.

Amacı; anlamak, bağlam kurmak ve tutarlı cevaplar üretmektir.
“Eğitim” Ne Anlama Gelir

Buradaki eğitim, insan gibi öğrenme değil;

çok büyük metin kümeleri üzerinde
istatistiksel örüntüler öğrenme sürecidir.

Model, kelimelerin hangi bağlamlarda birlikte geldiğini öğrenir.
ChatGPT Nasıl Öğrenir

Milyarlarca cümle üzerinden

“Bir kelimeden sonra hangisi gelme olasılığı yüksektir” sorusunu öğrenir.

Bu, anlam sezgisi değil;
olasılıksal dil kavrayışıdır.
Eğitim Kaç Aşamadan Oluşur

Temelde üç ana aşama vardır:

Ön eğitim

İnce ayar (fine-tuning)

İnsan geri bildirimiyle pekiştirme
Ön Eğitim (Pre-training) Nedir

Bu aşamada model, çok büyük metin veri kümeleriyle karşılaşır.

Dilin yapısını, grameri, genel bilgiyi ve anlatım biçimlerini öğrenir.

Bu aşamada model
kimle konuşacağını bilmez.
Bu Aşamada Hangi Tür Veriler Kullanılır

Genel olarak:

Herkese açık web metinleri

Kitaplar

Makaleler

Ansiklopedik ve eğitsel içerikler

Özel mesajlar, kişisel e-postalar veya gizli veriler
kullanılmaz.
İnce Ayar (Fine-Tuning) Nedir

Bu aşamada model,

belirli görevlerde daha iyi cevap vermesi için
yönlendirilir.

Soru–cevap örnekleriyle daha tutarlı hâle getirilir.
İnsan Geri Bildirimi Neden Gereklidir

İnsan eğitmenler,

iyi cevapları

sorunlu cevapları işaretler.

Model, buna göre davranışını
ayarlar.
RLHF Ne Demektir
Reinforcement Learning from Human Feedback

Yani “insan geri bildirimiyle pekiştirmeli öğrenme”.

ChatGPT’nin daha güvenli, dengeli ve faydalı olmasını sağlar.
ChatGPT Gerçekleri “Bilir” mi

Hayır, bildiği söylenemez.

O, bilgiyi
hatırlamaz;

eğitildiği örüntülere göre
üretir.

Eğitimde Kişisel Veriler Var mı

Hayır.

Eğitim sürecinde özel, gizli veya kişisel veriler
bilinçli olarak kullanılmaz.

Model, kullanıcıya ait bilgileri “depolamaz”.

ChatGPT İnternete Bağlı mı

Hayır.

Canlı internet taraması yapmaz.

Cevaplar, eğitim sırasında öğrenilen genel örüntülere dayanır.

Eğitim Verileri Güncel mi

Eğitim verileri belirli bir
zaman kesitine kadardır.

Bu yüzden çok yeni olaylarda sınırlı olabilir.

Güncellik, bilgi değil
bağlam meselesidir.

ChatGPT Tarafsız mı

Amaç tarafsızlıktır.

Ancak dilin kendisi kültürel izler taşır.

Bu yüzden model,
dengeleyici kurallarla eğitilir.

Hatalar Neden Olur

Çünkü model:

“doğru”yu değil

“en olası” cevabı üretir.

Olası olan her zaman doğru değildir.

ChatGPT Bilinci Var mı

Hayır.

Bilinç, niyet, duygu veya farkındalık yoktur.

Yalnızca dilsel işlemler vardır.

Eğitim Süreci Neden Çok Uzundur

Çünkü milyarlarca parametre

sayısız dil örüntüsüyle ayarlanır.

Bu, insanlığın yazılı hafızasına temas eden bir süreçtir.

Güvenlik ve Etik Nasıl Sağlanır

Zararlı içerikleri engelleyen filtreler

Etik ilkeler

İnsan denetimi

Sürekli güncellenen güvenlik katmanları kullanılır.

Son Söz
ChatGPT Gerçekte Nedir

ChatGPT;

düşünen bir varlık değil,

insan dilinin
yoğunlaştırılmış bir aynasıdır.

Ona ne sorarsanız, insanlığın dilde bıraktığı izlerden cevap verir.
“Yapay zekâ konuştuğunda,
aslında insanlığın kelimelerle kurduğu geçmiş yankılanır.”
— Ersan Karavelioğlu