ProofOfThought: Z3 teorem ispatını kullanan LLM tabanlı akıl yürütme
(github.com/DebarghaG)- ProofOfThought, büyük dil modeli (LLM) ile Z3 teorem ispatlayıcısını birleştirerek güçlü ve yorumlanabilir akıl yürütmeyi destekler
- Bu proje, doğal dil sorguları için doğru ve yüksek güvenilirlikli akıl yürütme sonuçları sunar
- Yüksek seviyeli Python API sayesinde geliştiriciler karmaşık akıl yürütme görevlerini kolayca uygulayıp deneyebilir
- Z3DSL üzerinden JSON tabanlı düşük seviyeli DSL erişimi de sunularak esnek özelleştirme mümkün olur
- Sys2Reasoning Workshop NeurIPS 2024'te yayımlanması, güncel araştırma çıktılarının pratikleşme avantajını gösterir
ProofOfThought açık kaynak projesine giriş
ProofOfThought, büyük dil modelleri (LLM) ile Z3 teorem ispatlayıcısını birleştiren nörosembolik (sinirsel-sembolik) program sentezi yaklaşımını benimseyen açık kaynaklı bir akıl yürütme kütüphanesidir. Gerçek dünyadaki karmaşık problemler için sağlam ve yorumlanabilir akıl yürütme sonuçları sunması, hem pratik kullanım hem de araştırma açısından önemli bir anlam taşır.
Açık kaynak niteliği sayesinde herkes bunu araştırma, servis ve geliştirme gibi alanlarda serbestçe kullanabilir; mevcut basit LLM tabanlı akıl yürütme sistemlerine kıyasla akıl yürütme sürecini doğrulamak ve hataları yorumlamak daha kolaydır. Diğer akıl yürütme sistemleriyle karşılaştırıldığında, doğal dil girdisi → mantık programına otomatik dönüşüm → Z3 tabanlı akıl yürütme akışı şeklindeki yapısal şeffaflık en belirgin özelliklerinden biridir.
Sistem mimarisi ve ana bileşenler
-
Yüksek seviyeli API (
z3dsl.reasoning) :- Doğal dil tabanlı akıl yürütme sorgularını yürütme
- Yeni başlayanların da kolayca kullanabileceği bir Python arayüzü sunma
-
Düşük seviyeli DSL (
z3dsl) :- JSON tabanlı Z3 teorem ispatlayıcısı erişimi
- Karmaşık özelleştirmeler ve otomasyon pipeline'ları kurmak için avantajlıdır
Başlıca özellik örnekleri
-
LLM, verilen sorguyu mantık ifadesine (sembolik programa) dönüştürür
-
Z3 ispatlayıcısı aracılığıyla doğru/yanlış (yes/no) ya da koşul tabanlı yorumlama sonuçları üretir
-
Örnek:
- Sorgu: "Nancy Pelosi kürtajı kamuoyu önünde kınar mı?"
- Sonuç: False (hayır)
-
Değerlendirme pipeline'ı (
EvaluationPipeline) sunulur:- Büyük veri kümeleri üzerinde toplu değerlendirme yapılabilir
- Doğruluk gibi metrikler otomatik raporlanır
Uygulama ve kullanım örnekleri
- Araştırma amaçlı akıl yürütme benchmark'larının otomasyonu
- LLM tabanlı bilgi grafiği veya yüksek dereceli mantık problemleri için otomatik ispat servisleri
- Karmaşık politika sorguları, doğal dil tartışmalarının otomatik sınıflandırılması gibi çeşitli yapay zeka servislerine uygulanma potansiyeli
Araştırma açısından önemi ve özellikleri
- NeurIPS 2024'ün Sys2Reasoning workshop'unda sunuldu
- Mevcut LLM sınırlamalarını (akıl yürütme belirsizliği) tamamlayan sembolik yorumlama tabanlı güvenilirlik
- Akıl yürütme sonuçları ile dayanaklarının şeffaflığı ve yorumlanabilirliği, gerçek servis geliştirmede büyük bir avantajdır
Sonuç
ProofOfThought, LLM ile Z3 teorem ispatlayıcısının güçlü yanlarını birleştirerek sağlam ve yorumlanabilir yapay zeka akıl yürütme altyapısı kurmak isteyen geliştiriciler ve araştırmacılar için somut değer sunar. Projenin lisansı ve yapısı açık kaynak ekosistemine uygun biçimde tasarlandığından, hem akademik araştırma hem de endüstriyel kullanım açısından çekicidir.
1 yorum
Hacker News görüşleri
sympypaketini kullanarak yaptığını açıklamış. Belirsiz çalışan LLM'lerle katı araçların birleşiminin güçlü bir etki yaratabileceği izlenimini paylaşıyor