Python ile Veri Bilimi ve Makine Öğrenmesi

Türkmen GÖKSEL, Uğur AKKOÇ

Dersin temel amacıyapay zekânın alt branşları olan makine öğrenimi ve derin öğrenme algoritmalarını kullanılarak veri analizi yapabilmekte yetkinlik kazanmaktır. Ders boyunca bu algoritmalar Python programı ile çalıştırılacaktır. 

Dersin ilk kısmında veri bilimine giriş ele alınacaktır. Bu kısımda makine öğrenimi ve derin öğrenme nedir, bu alanlarda nasıl bir terminoloji kullanılır, hangi soruları cevaplamak için kullanılır, türleri nelerdir ve bilinen istatistiki yöntemlerden farkı nelerdir gibi temel sorulara yanıt verilecektir.

İkinci kısımda ise makine ve derin öğrenme algoritmalarında faydalı olacak bazı temel istatistiksel ve matematiksel alt yapı sunulacaktır. 

Üçüncü kısımda ise Python programlama dilinde kodlama sıfırdan ileri düzeye kadar anlatılacaktır. 

Dersin temel ve dördüncü kısmında ise her bir algoritmanın sırasıyla öncelikle matematiksel ve istatistiksel alt yapısı anlatılıp, daha sonra Python uygulaması yapılacaktır Bu sayede makinenin her bir algoritma için arka planda ne yaptığı anlaşılmış olacaktır. Daha sonra her bir algoritmanın çeşitli veri setleri ile uygulaması yapılacaktır. Her veri setinin yapısına göre (büyük veri dahil) veri temizleme yöntemleri de dersin kapsamı içinde olacaktır.

Ders aşağıdaki bu alanda en yaygın ve popüler olarak kullanılan şu algoritmaları kapsayacaktır:

A-Denetimli Öğrenme 

1-Doğrusal Regresyon

2-Polinom Regresyonu

3-Lojistik Regresyon

4- Cezalandırmalı Regresyonlar (Ridge, Lasso vb.)

5- Model Performans Ölçütlerinin Hesaplanması ve Değerlendirilmesi

6- Karar Ağaçları ve Rassal Orman 

7- Naive Bayes Algoritması

8- K-En Yakın Komşuluk

9-Destek Vektör Makinesi

10-Derin Öğrenme (Yapay Sinir Ağları ve Tekrarlanan Sinir Ağları)

Yukarıdaki algoritmalar ile makine ve derin öğrenmede hedeflenen temel amaç güçlü bir öngörü yapmaktır. Bu öngörü sürekli değişkenler için yapılabileceği gibi (regresyon) kategorik değişkenler için de (sınıflandırma) yapılabilmektedir. Ders boyunca her iki analiz türünü de yer verilecektir. Ayrıca, kesit veriler ile çalışmanın yanı sıra zaman serileri öngörüleri de yapılacaktır. 

B-Denetimsiz Öğrenme 

1-K-Merkezli Kümeleme 

2-Hiyerarşik Kümeleme 

3- Apriori Algoritması 

Denetimsiz öğrenmede ise bir çıktı değişken olmadan sadece girdi değişkenler ile veri hakkında çıkarım yapılmaktadır.

*Bu modülde öncü Python bilgisi gerekmeyecek, modül içerisinde bilgisayar uygulamaları en temel seviyeden itibaren anlatılacaktır.



Menü