Makine Öğrenmesi Aslında Nedir?
Makine öğrenmesi çoğu zaman çok karmaşık bir teknoloji gibi anlatılır.
Algoritmalar, modeller, yapay sinir ağları…
Ama işin özüne indiğimizde oldukça basit bir fikre dayanır:
Pattern (örüntü) bulmak.
Makine öğrenmesi sistemleri verinin içindeki tekrar eden yapıları, ilişkileri ve kalıpları keşfetmeye çalışır.
Pattern Bulma Makinesi
Bir makine öğrenmesi modeli eğitildiğinde yaptığı şey şudur:
- Veriye bakar
- İçindeki kalıpları öğrenir
- Bu kalıplara göre tahmin yapar
Örneğin bir sistem binlerce kedi fotoğrafı görürse, şu patternleri öğrenmeye başlar:
- kulak şekli
- göz yapısı
- yüz oranları
- tüy dokusu
Sonra yeni bir fotoğraf gördüğünde şöyle düşünür:
“Bu görüntü öğrendiğim kedi patternlerine ne kadar benziyor?”
Benzerlik yüksekse kedi tahmini yapar.
Tahmin Oyunu
Makine öğrenmesinin temel amacı aslında tek bir şeydir:
tahmin yapmak.
- Bir e-postanın spam olup olmadığını tahmin etmek
- Bir müşterinin ürünü satın alıp almayacağını tahmin etmek
- Bir görüntüde ne olduğunu tahmin etmek
- Bir cümlenin devamını tahmin etmek
Farklı problemler gibi görünseler de hepsi aynı mantıkla çalışır.
Veri Neden Bu Kadar Önemli?
Makine öğrenmesinde en kritik faktörlerden biri veri miktarıdır.
Çünkü bir sistem ne kadar çok örnek görürse:
- patternleri daha iyi öğrenir
- istatistiksel hataları azalır
- tahminleri daha doğru olur
Bu yüzden genellikle şu kural geçerlidir:
Ne kadar veri, o kadar iyi tahmin.
Ama Veri Tek Başına Yetmez
Tabii ki veri tek başına sihirli bir çözüm değildir.
Verinin:
- kaliteli olması
- doğru etiketlenmesi
- çeşitli olması
da önemlidir.
Yanlış veya eksik veriyle eğitilen bir model yanlış patternler öğrenebilir.
Bu da kötü tahminlere yol açar.
Sonuç
Makine öğrenmesi çoğu zaman gizemli bir teknoloji gibi anlatılır.
Ama temelinde oldukça basit bir fikir vardır:
Verideki patternleri bul ve bu patternlere göre tahmin yap.
Ve çoğu durumda sistemin performansını belirleyen en büyük faktör de şudur:
Ne kadar veri varsa, tahmin o kadar iyi olur.