
Python ile Veri Bilimi ve Makine Öğrenmesi
Türkmen GÖKSEL, Uğur AKKOÇ
Dersin temel amacıyapay
zekânın alt branşları olan makine öğrenimi ve derin öğrenme
algoritmalarını kullanılarak veri analizi yapabilmekte yetkinlik
kazanmaktır. Ders boyunca bu algoritmalar Python programı ile
çalıştırılacaktır.
Dersin
ilk kısmında veri bilimine giriş ele alınacaktır. Bu kısımda makine
öğrenimi ve derin öğrenme nedir, bu alanlarda nasıl bir terminoloji
kullanılır, hangi soruları cevaplamak için kullanılır, türleri nelerdir
ve bilinen istatistiki yöntemlerden farkı nelerdir gibi temel sorulara
yanıt verilecektir.
İkinci
kısımda ise makine ve derin öğrenme algoritmalarında faydalı olacak
bazı temel istatistiksel ve matematiksel alt yapı sunulacaktır.
Üçüncü kısımda ise Python programlama dilinde kodlama sıfırdan ileri düzeye kadar anlatılacaktır.
Dersin
temel ve dördüncü kısmında ise her bir algoritmanın sırasıyla öncelikle
matematiksel ve istatistiksel alt yapısı anlatılıp, daha sonra Python
uygulaması yapılacaktır Bu sayede makinenin her bir algoritma için arka
planda ne yaptığı anlaşılmış olacaktır. Daha sonra her bir algoritmanın
çeşitli veri setleri ile uygulaması yapılacaktır. Her veri setinin
yapısına göre (büyük veri dahil) veri temizleme yöntemleri de dersin
kapsamı içinde olacaktır.
Ders aşağıdaki bu alanda en yaygın ve popüler olarak kullanılan şu algoritmaları kapsayacaktır:
A-Denetimli Öğrenme
1-Doğrusal Regresyon
2-Polinom Regresyonu
3-Lojistik Regresyon
4- Cezalandırmalı Regresyonlar (Ridge, Lasso vb.)
5- Model Performans Ölçütlerinin Hesaplanması ve Değerlendirilmesi
6- Karar Ağaçları ve Rassal Orman
7- Naive Bayes Algoritması
8- K-En Yakın Komşuluk
9-Destek Vektör Makinesi
10-Derin Öğrenme (Yapay Sinir Ağları ve Tekrarlanan Sinir Ağları)
Yukarıdaki
algoritmalar ile makine ve derin öğrenmede hedeflenen temel amaç güçlü
bir öngörü yapmaktır. Bu öngörü sürekli değişkenler için yapılabileceği
gibi (regresyon) kategorik değişkenler için de (sınıflandırma)
yapılabilmektedir. Ders boyunca her iki analiz türünü de yer
verilecektir. Ayrıca, kesit veriler ile çalışmanın yanı sıra zaman
serileri öngörüleri de yapılacaktır.
B-Denetimsiz Öğrenme
1-K-Merkezli Kümeleme
2-Hiyerarşik Kümeleme
3- Apriori Algoritması
Denetimsiz öğrenmede ise bir çıktı değişken olmadan sadece girdi değişkenler ile veri hakkında çıkarım yapılmaktadır.
*Bu modülde öncü Python bilgisi gerekmeyecek, modül içerisinde bilgisayar uygulamaları en temel seviyeden itibaren anlatılacaktır.