- Yazıda yazar, en sevdiği API'den, yani Avrupa Merkez Bankası web sitesindeki
zipfiledan söz ediyor; bu zipfile, euronun diğer para birimleri karşısındaki tarihsel konumuna dair veriler sağlıyor.
- Yazar,
curl, gunzip, sqlite3, pandas gibi çeşitli araçları kullanarak zipfile içindeki verilerin nasıl indirileceğini, sıkıştırmasının nasıl açılacağını ve nasıl sorgulanacağını gösteriyor.
zipfiledan elde edilen veriler, bir tarih sütunu ve her para birimi için ek sütunlar içeren "wide" biçiminde; bu da filtreleme ve toplulaştırma için ideal değil.
- Yazar,
pandas kullanarak verileri "wide" biçiminden "long" biçimine dönüştürme sürecini, yani "melting" işlemini gösteriyor.
- Yazar ayrıca veride bir sorun olduğuna dikkat çekiyor: her satırın sonundaki trailing comma, melting sürecini engelliyor. Bu sorun,
pandas method chain'ine .iloc[:, :-1] eklenerek çözülüyor.
- Yazar, bu verilerle çalışmanın "veri hazırlama" işi gerektirdiğini kabul ediyor; ancak ECB döviz verilerinin, diğer açık veri yayımlarına kıyasla görece daha kolay işlenebildiğini belirtiyor.
- Ardından yazar, temizlenmiş verilerin bir
csvbase tablosuna nasıl yükleneceğini ve gnuplot kullanılarak bu verilerin grafiğinin nasıl çizileceğini gösteriyor.
- Yazar ayrıca,
sqlite'a benzeyen ancak sütun odaklı olan DuckDB adlı bir aracı tanıtıyor ve bununla CSV'nin doğrudan HTTP üzerinden bir tablo dosyasına nasıl yükleneceğini gösteriyor.
- Yazar, açık verinin açık API gibi çalışabildiğini vurguluyor ve ECB'nin
zipfile yapısının bir veri değişim biçimi olarak sadeliğini övüyor.
- Yazar ayrıca euronun kısa bir tarihçesini veriyor ve ilk kez piyasaya sürüldüğü 2000 yılında neden dolar karşısında zayıf olduğunu açıklıyor.
Henüz yorum yok.