Veri bilimciler için 100 sorguyla SQL öğrenin
(gvwilson.github.io)SQL for the Weary
- Hedef kitle: Hücre biyolojisi alanında yüksek lisans derecesine sahip Rachel, bir araştırma hastanesinde hücre analizi üzerinde çalışıyor ve veri bilimci olmak istiyor.
- Gerekli ön bilgi: Temel Unix komutları ve tablo biçimindeki verileri analiz etme becerisi.
- Öğrenme çıktıları: Veritabanı ile veritabanı yöneticisi arasındaki farkı açıklama, SQL yazma, tablo tanımlama ve veri işleme, join türlerini açıklama, bitişik satırlarla çalışmak için pencere fonksiyonlarını kullanma, transaction ve trigger kavramlarını anlama, SQL kullanarak JSON verisini işleme, Python aracılığıyla veritabanı etkileşimi.
Kurulum
- En son sürümü indirme: SQLite veritabanı örnekleri, SQL sorguları, Python betikleri ve daha fazlasını içeren dosyaları geçici bir dizine açın.
Arka plan kavramları
- Veritabanı: Aranabilen ve erişilebilen veri koleksiyonu.
- Veritabanı yönetim sistemi (DBMS): Belirli bir veritabanı türünü yöneten program.
- SQLite: Veritabanını tek bir dosyada saklar; PostgreSQL ise daha yüksek performans için bilgiyi birden fazla dosyaya dağıtır.
- İlişkisel veritabanı yönetim sistemi (RDBMS): Veriyi tablolarda saklar ve SQL kullanarak sorgular.
- NoSQL veritabanı: MongoDB gibi tablo kullanmayan veritabanları da vardır.
Veritabanına bağlanma
- Veritabanı bağlantısı: Gerçek bir sorgu değildir, ancak başka işlemler yapmadan önce gerekli bir adımdır.
Yönetim komutları
- SQLite yönetim komutları: Standart SQL'in bir parçası değildir; PostgreSQL'in özel komutları
\ile başlar. - Çıktı biçimi: Sonuçları okunabilir şekilde göstermek için
.headers onve.mode markdownkullanın.
Tablo işlemleri
- Tablo oluşturma:
create tablekomutuyla tabloları ve sütunları tanımlayın. - Veri ekleme:
insert intokomutuyla tabloya veri ekleyin. - Satır güncelleme:
updatekomutuyla belirli koşulları sağlayan satırlardaki veriyi değiştirin. - Satır silme:
delete fromkomutuyla belirli koşulları sağlayan satırları kaldırın.
Join işlemleri
- Join: İki tablodaki bilgileri birleştirme işlemi.
- Inner join:
inner joinkullanarak yalnızca iki tabloda eşleşen satırları birleştirir. - Left join:
left joinkullanarak sol tablodaki tüm satırları korur ve sağ tablodaki eksik değerlerinullile doldurur.
Toplulaştırma fonksiyonları
- Toplulaştırma: Birden fazla değeri tek bir değerde birleştirme işlemi.
- Yaygın toplulaştırma fonksiyonları: Veriyi toplulaştırmak için
sum,max,min,avgvb. kullanılır. - Gruplama:
group bykullanarak satırları belirli sütunların benzersiz kombinasyonlarına göre gruplar ve her grup için toplulaştırma yapar.
GN⁺ görüşü
- Bu yazı, veritabanları ve SQL hakkında temel bir anlayış kazandırmaya yönelik bir kaynak olup, başlangıç seviyesindeki yazılım mühendisleri veya veri bilimine ilgi duyanlar için faydalıdır.
- SQL'in çeşitli özelliklerini gerçek örneklerle açıklayarak veritabanı yönetimi ve veri işleme konusunda pratik bilgi sunar.
- Özellikle veritabanı join'leri, toplulaştırma fonksiyonları ve tablo işlemleri veri analiziyle ilgili çalışmalarda çok önemlidir; bu yazı bu kavramları net biçimde anlamaya yardımcı olur.
1 yorum
Hacker News görüşleri
left joinhakkında yanlış bir algı oluşturabilir. Bu tür açıklamalar çok yaygın, ancak yanıltıcı olabilir.