- Büyük dil modelleri (GPT modelleri olarak da bilinir) ile daha iyi sonuçlar elde etmek için strateji ve teknikler paylaşan bir rehber
- Burada açıklanan yöntemler bazen birleştirilerek daha büyük etki yaratabilir; en uygun yöntemi bulmak için denemeler yapılması önerilir
- Örnek prompt’ları inceleyerek modelin neler yapabildiği öğrenilebilir
Daha İyi Sonuçlar Elde Etmek İçin Altı Strateji
Açık talimatlar yazın
- Model zihin okuyamaz; bu yüzden ne istediğinizi açıkça istemeniz gerekir.
- Daha ilgili yanıtlar almak için ayrıntı ekleyin; modelden belirli bir kişiyi canlandırmasını isteyin veya girdinin farklı bölümlerini net biçimde göstermek için ayraçlar kullanın.
- Görevi tamamlamak için gereken adımları belirtin, örnekler verin ve çıktının istenen uzunluğunu tanımlayın.
Referans metin sağlayın
- Dil modelleri, özellikle zor konularda ya da alıntı ve URL istendiğinde, kendinden emin görünen uydurma yanıtlar üretebilir.
- Modele, yanıt verirken referans metni kullanmasını ya da referans metinden alıntı yaparak yanıt vermesini söyleyin.
Karmaşık görevleri basit alt görevlere bölün
- Yazılım mühendisliğinde karmaşık sistemleri modüler bileşenlere ayırmak iyi bir uygulama olduğu gibi, dil modellerine verilen görevler için de aynısı geçerlidir.
- Karmaşık görevlerde hata oranı yüksektir ve bunlar çoğu zaman basit görevlerden oluşan bir iş akışı olarak yeniden tanımlanabilir.
- Kullanıcı sorgusuyla en ilgili talimatları belirlemek için niyet sınıflandırması kullanın; çok uzun konuşmalar gerektiren sohbet uygulamalarında önceki konuşmaları özetleyin veya filtreleyin.
- Uzun belgeleri parça parça özetleyin ve özyinelemeli olarak genel özeti oluşturun.
Modele "düşünmesi için zaman" tanıyın
- Modeli aceleyle yanıt vermek yerine, yanıtı oluşturmadan önce bir "düşünce zinciri" üretmeye yönlendirmek daha güvenilir sonuçlar verebilir.
- Modelden önce kendi çözümünü oluşturmasını isteyin; modelin akıl yürütme sürecini gizlemek için iç monolog ya da bir dizi sorgu kullanın.
- Önceki geçişte gözden kaçan bir şey olup olmadığını modele sorun.
Harici araçlar kullanın
- Modelin zayıf yönlerini telafi etmek için diğer araçların çıktısını modele sağlayın.
- Verimli bilgi erişimi için embedding tabanlı arama kullanın; daha doğru hesaplamalar için kod çalıştırma veya harici API çağrıları yapın.
- Modele belirli işlevlere erişim izni verin.
Değişiklikleri sistematik olarak test edin
- Performansı iyileştirmek, ölçülebilir olduğunda daha kolaydır.
- Değişikliğin genel performans üzerinde olumlu etkisi olup olmadığını doğrulamak için kapsamlı bir test paketi (veya "eval") tanımlamak gerekir.
- Model çıktısını altın standart yanıtlarla karşılaştırarak değerlendirin.
GN⁺ Görüşü
- En önemli nokta: Prompt engineering, dil modeli performansını optimize etmenin temel yollarından biridir; kullanıcının niyetini doğru anlamak ve istenen sonucu elde etmek için somut yönergeler sağlar.
- Neden ilginç: Bu stratejiler, yapay zeka dil modellerinin kullanımını daha etkili hale getirir ve özellikle GPT-4 gibi güncel modellerde daha yüksek performans elde edilmesine yardımcı olur.
- Dikkat çeken nokta: Bu rehber, giriş seviyesindeki yazılım mühendislerinin dil modellerini kullanırken karşılaşabileceği yaygın sorunları çözmeye yardımcı olan somut örnekler ve stratejiler sunarak, modellerin gerçek işlerde daha etkili nasıl kullanılabileceğini gösterir.
2 yorum
OpenAI’nin GPT için en iyi uygulamaları: Genel bakış. Daha iyi yanıtlar almak için 6 prompt yazma stratejisi
Hacker News görüşleri
ChatGPT sistem prompt’u üzerine tartışma
İspanyolca cheeseburger siparişi verme deneyimi
LLM’lerin (Large Language Models) özellikleri üzerine tartışma
Prompt yazmayı öğrenme konusundaki tereddüt
Prompt engineering ile Google gelişmiş arama sorgularının karşılaştırılması
Google arama prompt’ları ile LLM prompt’larının karşılaştırılması
İnsanlar arası iletişimdeki başarısızlıklar ve LLM’lerin sınırları
"Prompt engineering" terimine yönelik eleştiri
LLM’lerin insanlara daha açık iletişim kurmayı öğretme rolü
LLM tabanlı chat app uygulamalarını hayata geçirmenin kolaylığı