Temel iddia: LLM'den mümkün olduğunca çabuk çıkın ve içinde uzun süre kalmayın
- LLM'e karar verme ya da iş mantığını emanet etmemelisiniz → doğruluk ve kararlılık yetersizdir
- Çoğu durumda LLM, yalnızca kullanıcı ile uygulama API'si arasındaki arayüz rolünü üstlenmelidir
- Temel mantık özel sistemler veya motorlar tarafından yürütülmeli; LLM ise sadece kullanıcı isteğini API çağrısına dönüştürmeli ve sonucu yeniden doğal dile çevirmelidir
Neden?
-
Satranç botu örneği: Kullanıcı WhatsApp üzerinden "filimle atı al" diye gönderir → LLM satranç tahtasının durumunu koruyup oyunu oynayabilir, ancak güvenilirlik, performans ve bakım açısından pek çok sorun vardır
-
Performans: LLM'in satranç oynama becerisi etkileyici olsa da, yine de uzman bir satranç motoruna (ör. Stockfish) kıyasla daha yavaştır ve doğruluğu daha düşüktür
-
Hata ayıklama ve ayar zorluğu: Neden böyle bir karar verdiğini anlamak zordur; bu yüzden istenen şekilde çalışacak biçimde düzeltmek güçtür
-
Diğer sorunlar:
- LLM çıktısını test etmek zordur
- Matematikte veya rastgele sayı üretiminde performansı düşüktür
- Sürüm yönetimi ve denetim zordur
- Durumu doğal dilde tutma yaklaşımı kırılgandır
- API ücretleri, hız sınırları gibi sorunlar ortaya çıkar
- Güvenlik sınırları belirsizleşir
Farklı örneklerle doğru rol ayrımı
- Oyunda "oyuncu X'e vorpal kılıcıyla saldırmak istiyorum" → LLM yalnızca bunu
attack(player=X, weapon="vorpal_sword")biçimine çevirip oyun mantığına iletmelidir - Müzakere ajanı → LLM müzakere kararını vermez; kullanıcının girdisini paketleyip müzakere motoruna iletir ve sonucu aktarır
- Rastgele yanıt üretimi → Seçimi LLM yapmamalı, dışarıdaki bir rastgele fonksiyon tarafından ele alınmalıdır
LLM'in iyi yaptığı işler
- LLM'ler dönüştürme, yorumlama ve iletişim konusunda uzmanlaşmıştır
- Örnekler:
- "orka kılıçla vur" →
attack(target="orc", weapon="sword")biçimine dönüştürme { "error": "insufficient_funds" }→ "Yeterli altının yok" diye doğal biçimde açıklama- Kullanıcının girdisinin savaş komutu mu, envanter kontrolü mü, yoksa yardım isteği mi olduğunu sınıflandırabilme
- İnsan kavramlarını iyi anlama (ör. blade = sword, smash = attack)
- "orka kılıçla vur" →
- Esas nokta karmaşık muhakeme ya da durum yönetimi değildir → sadece kullanıcının niyetini sisteme bağlayan bir köprü görevi görmesidir
Gelecek görünümü ve değişmeyen ilke
- Teknoloji çok hızlı gelişiyor; bugün mümkün olmayan şeyler yakında mümkün hâle gelebilir
- Ancak LLM'in çözemeyeceği yapısal sorunların kalmaya devam etmesi muhtemeldir:
- LLM kullanılmayan mantık daha kolay anlaşılır; bakım ve sürüm yönetimi daha kolaydır
- Çalıştırma maliyeti de daha düşüktür
- Gelecekte de aynı şekilde, LLM arayüz rolüne odaklanmalı ve temel mantık özel sistemlere bırakılmalıdır
1 yorum
Hacker News görüşü
İki tür mantık vardır
1 numaralı tür; güvenlik, finans, matematik gibi alanlara karşılık gelir
2 numaralı türün AI tarafından ikame edilme olasılığı yüksektir
Aynı uygulamanın farklı bölümleri 1 veya 2 için uygun olabilir
Yakın zamanda bir hackathon'da eğitim amaçlı bir oyun geliştirdim
LLM'ler mantığı uygulamamalıdır
LLM'lerin yeteneklerini anlamak zordur
LLM yanıtlarının hızlı ve ucuz olması gerekiyorsa kısa prompt'lar ve küçük modeller kullanılmalıdır
Yalnızca LLM'lerle test yapmak zordur
LLM'leri iş mantığında kullanmak risklidir
AI ile üretilmiş görseller kullanılarak makaleler özetlenebilir