Kısa Pandas Alıştırmaları

Pandas; python dilinde yazılmış NumPy üzerine kurulu açık kaynaklı bir veri düzenleme aracıdır.

DataFrame; Pandas içerisindeki ana veri saklama yapısıdır, veriyi satırlar ve kolonlar şeklinde tutabilirsiniz.
Series: Pandas içinde başka bir veri yapısı, DataFrame’den en belirgin farkı tek kolonlu bir yapısı olması.

Pandas aracı, eğer Anaconda kullanıyorsanız kurulu gelen ortamınızda(environment) hazır bulunması gerekir, eğer yok ise Anaconda arayüzü ile kurabilir, Anaconda kullanmıyorsanız pip install pandas komutu ile kurulumu yapabilirsiniz.

Bir dictionary ile DataFrame’imizi oluşturalım.

Yukarıda birkaç şehir bilgisi ile oluşturulan bir python dictionary’sini pandas Dataframe’ine çeviriyoruz. Çıktı olarak bir excel tablosu gibi bize verilerimizi matris halde verecektir. Burada pandas her satır için sıfırdan başlayarak bir index değeri oluşturdu ve her kolon için dictionary anahtar kelimelerini kullandı.

Daha genel olarak kullanılan DataFrame oluşturma metodu ise bir csv dosyasını kullanmaktır. Yukarıdaki verileri uygun bir şekilde bir csv dosyasında tuttuğumuzu varsayarak, aşağıdaki tek bir satır ile yine aynı DataFrame’i elde etmiş oluruz. Bu metot, ayrım karakteri, başlıklar, index kolonu gibi pek çok parametre alır, dökümantasyona şuradan ulaşabilirsiniz.

Verilere Erişim
DataFrame içinde tutulan verilere erişim için ihtiyacınıza göre pek çok yol var. En basitinden bir kaç örnek;

loc ve iloc
loc ve iloc kullanılarak da verilere erişilebilir. Burada iloc, bir integer kullanarak değerlere erişmemizi sağlıyor, loc ise index etiketi(örneğimizde atadığımız plaka değerleri) kullanarak erişmemizi sağlıyor.

Aşağıdaki iki komut da aynı veriyi döndürecek. Fakat timeit ile kontrol ettiğimde iloc yaklaşık 100µs daha hızlı.

Veri Arama
Berlirli bir değerin olduğu satırları aramak istiyorsak ne yapacağız. Onun için de biraz daha kompleksleşmiş bir loc metodu kullanabiliriz.

Burada örneğin sehirler[“plaka”] == “12” komutu boolean bir liste döndürecektir. Bu listede koşulu sağlayan satırlarımız True diğerleri False olacak. Bu listeyi loc metoduna vererek True olan kayıtları döndürmesini sağlıyoruz.

Yaralı linkler;

Pandas dökümantasyonu.

Cheat Sheet

Aracı oluşturan Wes McKinney’in hazırladığı 10 dakikalık tur burada (çok eski, çoğu konsept değişmiş olabilir).

Şu sitede, etkileşimli bir arayüz ile deneyebilirsiniz.

“Kısa Pandas Alıştırmaları” üzerine 2 yorum

  1. Hocam notasyonlar için birkaç örnek daha yapabilir misiniz? ilk 3 satır, son 2 satır ya da 1 den 4. satıra kadar gibi. Teşekkür eder çalışmalarınızda başarılar dilerim.

Bir Cevap Yazın