1. Gün
23 Temmuz |
NLP Temelleri & Finansal Metin Hazırlama |
- Tokenizasyon (WordPiece, SentencePiece) + özel finans sözlükleri
- Embedding’ler: Word2Vec, GloVe, fastText, FinBERT
|
Lab #1: SEC 10-K raporlarından özel tokenizer + vektör uzayı oluşturma;
benzer şirket raporlarını kümeleme
|
Embedding görselleştirme
|
2. Gün
24 Temmuz |
Duygu Analizi & Metin Sınıflandırma |
- Klasik ML vs transformer tabanlı yaklaşım
- Sınıf dengesizliği & cost-sensitive training
- Domain-adaptation (financial sentiment)
|
Lab #2: Reddit r/WallStreetBets mesajlarında FinBERT vs Mixtral 8×22B fine-tune —
abnormal getiri olay çalışması
|
ROC-AUC ≥ 0.85 raporu
|
3. Gün
25 Temmuz |
İleri NLP: Konu Modellemesi, Özetleme, Bilgi Çıkarma |
- BERTopic ile konu modellemesi
- Extractive-vs-abstractive özetleme (PEGASUS-finetune)
- NER & ilişki çıkarımı (ABD Reg-S4 uyumluluğu)
|
Lab #3: Mixtral 8×22B ile çeyrek rapor özetleme + risk anahtar kelimesi çıkarımı;
Takımlar Mini-Proje sonuçlarını 10 dk sunar
|
Proje sunumu + geri bildirim
|