1 puan yazan GN⁺ 2025-03-12 | 1 yorum | WhatsApp'ta paylaş

Olasılıksal Yapay Zeka

  • Yapay zeka, insan zekası gerektiren görevleri yerine getirebilen yapay sistemlerin bilimi ve mühendisliğini ifade eder. Son birkaç yılda, öğrenme temelli veri merkezli yaklaşımlarda dikkat çekici ilerlemeler yaşandı; makine öğrenimi ve derin öğrenme, bilgisayar sistemlerinin dünyayı algılaması için yeni yollar mümkün kıldı. Pekiştirmeli öğrenme, Go gibi karmaşık oyunlarda ve robotik görevlerde önemli atılımlar sağladı.

  • Zekanın temel yönlerinden biri, yalnızca tahmin yapmak değil, aynı zamanda bu tahminlerin belirsizliğini anlamak ve karar verirken bu belirsizliği dikkate almaktır. Bu makale, "olasılıksal yapay zeka" hakkındadır.

Olasılıksal yaklaşım

  • İlk bölüm, makine öğrenimine olasılıksal yaklaşımı ele alır. Veri eksikliğinden kaynaklanan "epistemik" belirsizlik ile, örneğin gürültülü gözlemlerden ve sonuçlardan doğan "alatorik" belirsizlik arasındaki farkı tartışır. Olasılıksal çıkarıma yönelik belirli yaklaşımlar ile verimli yaklaşık çıkarıma yönelik modern yaklaşımları inceler.

Sıralı karar görevlerinde belirsizliğin dikkate alınması

  • İkinci bölüm, sıralı karar görevlerinde belirsizliğin dikkate alınmasını ele alır. Etkin öğrenme ve Bayesyen optimizasyonu inceler; bunlar, epistemik belirsizliği azaltmak için bilgi sağlayan deneyler önererek veri toplamaya yönelik yaklaşımlardır. Pekiştirmeli öğrenmeyi ve sinir ağı fonksiyon yaklaşımı kullanan modern derin RL yaklaşımlarını ele alır. Epistemik ve alatorik belirsizliği keşfi yönlendirmek ve güvenliği dikkate almak için kullanan model tabanlı RL'ye yönelik modern yaklaşımları tartışır.

1 yorum

 
GN⁺ 2025-03-12
Hacker News görüşleri
  • Metinde harika açıklayıcı diyagramlar var ve olasılık perspektifinden makine öğrenmesine yüksek kaliteli bir genel bakış sunuyor gibi görünüyor

    • Yakın zamanda Zhao'nun "Mathematical Foundation of Reinforcement Learning" adlı ücretsiz ders kitabı ve YouTube derslerinden çok etkilendim
    • Çok vaktiniz yoksa, Zhao'nun özet içerik diyagramlarına hızlıca göz atmanızı öneririm. Bunlar, alanın tamamı için iyi bir kavramsal harita sunuyor
    • Ayrıca giriş videosunu izlemeyi de tavsiye ederim
  • Bu materyali birkaç gün önce keşfettim ve Andreas Krause'nin Gaussian Processes ve Bandits üzerine derin ve ilgi çekici araştırmalar yaptığını bildiğim için ciddi biçimde incelemek adına bahane arıyordum

  • Varoluşsal gerçeklik, durumların bir dizisi değil, potansiyel dağılımdır

    • Potansiyel vardır ve olasılık, onun dağılımının matematiksel açıklamasıdır. Tüm özellikler birer boyuttur (vektör)
    • Durum, sadece çözülmenin anlık ölçümüdür. Potansiyeller yapıcı ve yıkıcı girişim yoluyla etkileşir
    • Yapıcı ve yıkıcı girişim, anlık ölçümün "şimdi" denilen durumuna çözülür
  • LLM'lerin (yani sinir ağlarının) az önce verdiği yanıtın olasılığını söyleyip söyleyemeyeceğine dair bir soru

    • Üniversitede uzun zaman önce bu tür konuları çalıştım ve her terim için olasılık ve güven katsayısı içeren bir Prolog yorumlayıcısı yapmıştım
  • Model yorumlanabilirliğini demokratikleştirmek ve oyuncuların da keşfedebilmesi için bir GUI gerektiğini düşünüyorum

    • Temelde bu, LLM'yi 3D bir forma dönüştürüp insanların anlayabileceği 3D bir dünyaya yerleştiren başka bir modeli eğitmek anlamına geliyor
    • Basit bir örnek olarak, LLM'yi yeşil bir çayır ve nesneler olarak temsil edip insanı tek ajan olarak ayarlamak mümkün
  • Uygun kernel'lere sahip Gaussian Processes'in, sadece birkaç veri noktası ve küçük bir parametre setiyle bile çok güçlü olabildiğini düşünüyorum

    • Bunu bilgisayarlı görü görevlerinde girdileri ayarlayan öngörülebilir doğrusal olmayan bir süreç olarak kullandım ve sonuçlar çok iyiydi
  • Bunun, konuyla ilgili en iyi referanslardan biriyle kısmen örtüştüğünü düşünüyorum. Gareth James ve diğerlerinin "An Introduction to Statistical Learning" kitabından bahsediliyor

    • Bunun daha erişilebilir olup olmayacağını merak ediyorum; R/Python örnekleri yardımcı olacaktır
  • Kevin Murphy, Probabilistic Machine Learning serisinin adını değiştiriyor

  • Gemini 2.0 Experimental 02-05 bunu "yalnızca" 107K token ile ele aldı

    • Bunu parçalarına ayırmak için yardıma ihtiyacınız varsa faydalı olabilir
  • Laplace Approximation, karmaşık olasılık dağılımlarını basit bir Gaussian'a (çan eğrisi) dönüştürmenin "hızlı ve basit" bir yoludur

    • Zirve noktasını bulup o noktadaki eğriliği eşleştirerek çalışır
    • Hızlı ve kolaydır, ancak gerçek dağılım çan eğrisinden farklıysa çok hatalı ve aşırı özgüvenli olabilir
  • Bu dersi ETH Zurich'te aldım ve en sevdiğim derslerden biriydi

    • Özellikle belirsizliğin nasıl nicelleştirileceği ve pekiştirmeli öğrenmenin yapı taşlarının nasıl kurulacağı etkileyiciydi
    • Veri bilimciler ve ML mühendisleri için harika bir okuma. Bu belge ders notlarıdır