2 puan yazan GN⁺ 2025-09-29 | 1 yorum | WhatsApp'ta paylaş
  • Bayesçi Veri Analizi, istatistik ve veri bilimi alanlarında yaygın olarak kullanılan bir ders kitabıdır
  • Bu kitap, olasılıksal modelleme ve Bayesçi çıkarım üzerine odaklanarak, pratikte uygulanabilecek çeşitli analiz yöntemlerini ele alır
  • MCMC gibi gerçek vakalara dayalı hesaplama tekniklerini ve bunların uygulanışını geniş kapsamlı biçimde işler
  • Yeni başlayanlardan uzmanlara kadar herkesin anlayabilmesi için teori ve uygulama örneklerini dengeli şekilde sunar
  • Makine öğrenimi, tıp ve sosyal bilimler alanlarında da kullanım değeri yüksektir

Giriş

  • Bayesçi Veri Analizi, 3. Baskı, istatistik, bilgisayar bilimi ve mühendislik alanlarında Bayesçi çıkarımı sistematik biçimde tanıtan temel bir ders kitabıdır
  • Olasılıksal düşünmeyi ve belirsizlik altında veri analizini vurgular

Bayesçi modelleme kavramları

  • Kitap, önsel olasılık (prior) ve sonsal olasılık (posterior) kavramlarından başlayarak, gerçek verilere dayalı çıkarım yöntemlerini ayrıntılı biçimde açıklar
  • Çeşitli olasılık dağılımları, parametre tahmini ve tahmin problemlerini ele alan temel kuramı sunar

Gerçek veri analizi uygulamaları

  • Gerçek veri kümelerini kullanan çeşitli vaka çalışmaları ve uygulama örnekleri içerir
  • Model tasarımı, veri ön işleme ve hesaplama için MCMC (Markov Chain Monte Carlo) gibi pratik teknikleri de derinlemesine ele alır
  • R ve Python gibi uygulama ortamlarında kullanılabilecek kod parçacıkları sunar

İleri düzey konular

  • Hiyerarşik modeller, çok değişkenli analiz ve parametrik olmayan Bayesçi yöntemler gibi ileri düzey istatistiksel modelleri de geniş kapsamlı biçimde işler
  • Pratik model tanılama ve optimizasyon yöntemlerini de birlikte açıklar

Kullanım ve etkisi

  • Bu kitap, makine öğrenimi, biyoenformatik, tıbbi istatistik, işletme ve sosyal bilimler gibi geniş bir alan yelpazesinde sürekli başvurulan bir kaynak olarak kullanılır
  • Gerçek iş ortamında uygulanabilecek Bayesçi analiz araçları ve süreçlerini sistematik biçimde öğrenmeyi sağlar

1 yorum

 
GN⁺ 2025-09-29
Hacker News görüşleri
  • Bu benim en sevdiğim istatistik kitabı. Yazar Andrew Gelman, hiyerarşik Bayesyen modeller üzerine teorik çalışmalarıyla yeni Bayesyen istatistiğin bir alt alanının oluşmasına katkıda bulundu ve pratik uygulamalar için Stan'ı da yayımladı. Bu kitabı ekler dahil yaklaşık 1 yıl boyunca aralıklarla çalışmıştım. Sonrasında hiyerarşik Bayesyen model araştırmalarım için temel oluşturdu ve çok faydalı oldu. Bir giriş kitabından ziyade, istatistik yetkinliğini bir seviye yukarı taşımak isteyenlere güçlü şekilde tavsiye ederim. Önce 1~5. bölümleri okuyarak Gelman'ın modelleme felsefesini iyi kavrayabilirsiniz; ilginç gelen konuları da içindekilere bakıp seçerek okumanızı öneririm.
    • Gelman'ı gerçekten çok seviyorum ama "yeni Bayesyen istatistiğin bir alt alanını kurdu" ifadesi biraz abartılı.
    • Bu kitabı anlamadan önce okunabilecek istatistik kitapları ya da dersler varsa öneri rica ediliyor.
    • Tıbbi araştırma, optimizasyon, üretim gibi gerçek testlerde kullanılan istatistiğe odaklanan iyi kitaplar olup olmadığı merak ediliyor.
  • Gelman'ı ilk kez Linear Regression için harika bir görsel açıklama sayesinde tanıdım. Orada Regression and Other Stories'e de atıf vardı; Bayesyen bölümler ele alınmadığı için onları ayrıca okumak istedim.
  • Bayesyen analizin ne kadar faydalı olduğunu bizzat gördüm. Ekibimiz bir ara, yüz milyonlarca öğe arasından kalite doğrulaması yapabilmek için ne kadar örnekleme gerektiğini düşünüyordu ve bu sırada Bayesyen analizle çok zarif bir çözüm bulduk. Matematiğin kendisi zor değildi ama mühendislerin böyle temel bir tekniği öğrenmeye çok muhafazakâr yaklaşmasına şaşırdım. Sonuçta hepsi üniversitenin ilk yılında matematik gördü.
    • Mühendislerin neye direndiği ve bunu neden öğrenmeleri gerektiği merak ediliyor. Birçok mühendis giriş düzeyi istatistik dersi alır ama neden özellikle Bayesyen istatistik öğrenmeleri gerektiği açık değil. Hatta p-value, regresyon katsayılarının yorumu, etkileşim etkileri gibi şeyleri doğru yorumlamak daha zor ve pratikte daha az faydalı olabilir. Öte yandan bir veri bilimcinin de dağıtım otomasyon pipeline'ları, Kubernetes pod'ları, pytorch model dağıtık eğitimi gibi tüm mühendislik işlerini bilmesi gerekmez; sonuçta iş bölümü diye bir şey var.
  • BDA, Bayesyen modellemeyi sıkı ve derinlemesine öğrenmek için en iyi kitap. Bunun dışında Richard McElreath'in Statistical Rethinking'i ve Gelman ile Aki'nin yazdığı Regression and other stories gibi farklı yaklaşımlar da var. Ben de kod ve örnek odaklı anlatan bir kitap yazdım ve açık erişimle ücretsiz yayımlanıyor.
  • İlgili ders materyallerinin bağlantıları burada bulunabilir.
  • Columbia'da Gelman'ın öncülük ettiği istatistik blogunu seviyorum. statmodeling.stat.columbia.edu adresinde çeşitli istatistik tartışmaları yapılıyor.
    • Paylaşım için teşekkür ediliyor; özellikle etkileyici bulduğunuz yazılar varsa öneri isteniyor.
  • Yeni başlayanlar için John Kruschke'nin Doing Bayesian Data Analysis kitabı çok daha anlaşılır ve okunması kolay geldi.
    • BDA yüksek lisans öğrencilerine yönelik bir kitap; matematik özellikle zor olmasa da en azından matematiksel istatistikte ilk dersi almış bir okuru varsayıyor.
  • Çok ilgim var ama bu ders kitabı bana ağır geliyor. Sistem performans mühendisleri için yalnızca Bayesyen teknikleri hızlıca öğreten bir hızlandırılmış kurs olsa keşke. Her iki alanı da bilen biri varsa, içinde hangi konuların olması gerektiği ve bireysel çalışma için hangi kaynakların önerilebileceği merak ediliyor.
    • İstatistik öğretirken mutlaka kullandığım kitap Statistical Rethinking. Esasen modellemeyi nasıl düşündüğümüze, yani hipotezleri analiz etme ve modelin ima ettiği hipotezleri anlama sürecine odaklanıyor. Zor tarafları var ama işin eğlenceli kısmı da bu ve kitap bunu çok iyi anlatıyor. Dezavantajı ücretsiz olmaması (ama yazarın dersleri YouTube'da ücretsiz olduğu için kitap olmadan da dersleri kesinlikle öneririm). Ayrıca Gelman'ın ortak yazarı olduğu Regression and Other Stories de bu konuyu daha erişilebilir biçimde anlatıyor. Think Bayes ve Bayesian Methods for Hackers da programlama geçmişi olan başlangıç seviyesindekiler için önerilir. Makine öğrenmesinde olasılıksal (Bayesyen) yöntemlerin avantajlarına odaklanan bir kitap olarak Kevin Murphy'nin Probabilistic Machine Learning'ini öneririm. Ben sadece eski baskısını okudum ama yeni baskı hakkında da çok iyi yorumlar duydum.
    • Bayesian Methods for Hackers (GitHub) ve O'Reilly Bayesian Methods for Hackers çevrimiçi materyalleri de faydalı olabilir.
  • Temel nicel düşünme ve istatistiksel sezgi hâlâ önemli. Bunu Bayes'ten öğrenmeseniz bile bir yerden mutlaka öğrenmeniz gerekir. "n'in karekökü kuralı"na göre sinyal-gürültü oranı, ölçüm sayısının kareköküyle orantılı olarak iyileşir. Ama babamın dediği gibi, "kötü veriyi ne kadar çok ortalarsan, giderek yanlış cevaba yaklaşma ihtimalin de artar"; o yüzden dikkatli olmak lazım.
  • foundation model, bir tür sonradan olasılık yaklaşımı çıkarımcısı olarak görülebilir; burada belirsizlik çoğunlukla ihmal ediliyor. Daha Bayesyen bir yaklaşım kullanılsaydı performans daha iyi olabilirdi.
  • Veri setinin devasa olmadığı pek çok problem var; bu yüzden her durumda foundation model uygun değil ve göreve bağlı olarak Bayesyen yöntemler hâlâ çok geçerli.
  • Bayes kuralı olasılıksal çıkarımın temelidir; bu yüzden belirsizliği nicel olarak ele almak için Bayesyen yöntemler gerekir. Henüz derin öğrenme modellerinde verimli uygulama eksik olsa da ilke olarak daha iyi sonuçlar verebilir.
  • Büyük veri ve sinir ağları kullanılarak Bayesyen modellerin de (varyasyonel çıkarım vb.) yeterince iyi eğitilebildiği için konu hâlâ güncel.
  • Bayesian workflow kitabını bekliyorum.