BÜYÜK VERİDE NASIL PRATİK YAPABİLİRİM?
Büyük veri alanında pratik yapmanın birkaç yolu var. Bunları en basitten ileri seviyeye doğru kısa bir şekilde sıralayayım:
1- Kendi Oluşturduğun CSV Dosyalarıyla Pratik Yapmak
Mesela 50–100 satırlık ogrenci_not_listesi.csv veya icecek_fiyatlari.csv gibi,
günlük hayatta az çok bildiğin verilerden küçük dosyalar oluşturabilirsin. Excel’de bu dosyaları analiz
ederken hem veri düzenleme alışkanlığı kazanırsın hem de Excel’de ufak bir pratik yapmış olursun. Sonra aynı
dosyayı Python’a aktarıp analiz edip sonuçları karşılaştırabilirsin.
Bu aşamayı bitirdikten sonra verinin yüzde 20’sini silip eksik veri doldurma tekniklerini uygulayabilir, tekrar analiz edip grafiklerini karşılaştırarak küçük bir rapor hazırlayabilirsin.
Bu Sana Ne Kazandırır?
- Hem Excel’de hem Python’da temel veri analizi pratikleri edinmiş olursun.
- Ayrıca basit de olsa bir analiz raporu hazırlama deneyimi kazanırsın.
2- Kaggle Veri Setleriyle Pratik Yapmak
Kaggle, veri setleri ve yarışmalar açısından muazzam bir kaynak. Projelerim sekmesindeki Araştırma Yazılarım kısmında Kaggle’ın kullanım arayüzü, yarışmalar ve bilmen gereken temel bilgilerle ilgili bir yazım var. Kaggle’da pratik yapmak veya ödüllü yarışmalara katılmak istiyorsan onu okumanı öneririm.
Veri Analizi Sürecinde Yapabileceğin Bazı Adımlar:
- Excel dosyasını Python ortamına aktar
- İlk 5 satırı görüntüle
- Kaç satır ve sütun olduğuna bak
- Tekrarlayan satır var mı kontrol et
- Eksik veri olup olmadığına bak
- Varsa eksik verileri doldur
- Sayısal sütunların ortalama, medyan, mod, varyans, standart sapma gibi değerlerini hesapla
- Veriyi görselleştir
- Grafiklerini raporla
- Kaggle yarışmasına katılıyorsan, senden istenen adımları uygulamaya çalış
Kısaca, ufak veri setleriyle başlayıp Kaggle’a geçmek güzel bir ilerleme yolu sunuyor.