- Anthropic tarafından sunulan prompt engineering eğitimi, Claude modellerine optimize edilmiş prompt yazımını etkileşimli olarak adım adım anlatır
- Kullanıcılar iyi bir promptun yapısını, başarısızlık örneklerini ve verimli iyileştirme tekniklerini doğrudan pratik ederek öğrenebilir
- Her bölümde uygulamalı örnekler ve açıklamalar yer alır; bu da gerçek kullanıma yakın bir deneyim sunar
- Başlangıç seviyesinden ileri seviyeye kadar 9 bölüm ve eklerden oluşur; kullanıcıların doğrudan prompt yazma ve problem çözme becerilerini geliştirmesine yardımcı olur
- Bu eğitim, erişilebilirliği ve kullanım kolaylığını artırmak için Google Sheets sürümüyle de sunulur
Anthropic'in İnteraktif Prompt Engineering Eğitimi
- Yapay zeka modeli Claude için optimize edilmiş prompt tasarımı bilgisi sunan açık kaynak bir öğrenme kaynağı
- OpenAI tabanlı chatbot öğrenme akışına benzer olsa da, Claude modelinin güçlü yönleri ve sınırlamalarını kavratması ve gerçek pratik odaklı yapısı sayesinde, diğer eğitimlere kıyasla gerçek iş akışlarına uygulanabilirliği ve pratik değeri daha yüksektir
- Özellikle prompt yazımı ile çıktı denemelerini eşzamanlı yürütebilme imkanı, yeni başlayan mühendisler için büyük avantaj sağlar
Kurs tanıtımı ve hedefleri
- Bu eğitim, Claude içinde en iyi promptları nasıl tasarlayıp kullanacağınızı adım adım açıklar
- Kurs tamamlandığında kullanıcılar şunları kazanabilir
- Etkili prompt yapısını anlama
- Yaygın başarısızlık kalıplarını tanıma ve öncelikli iyileştirme yöntemleri (80/20 kuralı)
- Claude modelinin güçlü ve zayıf yönlerini kavrama
- Çeşitli genel işlerde kullanılabilecek prompt oluşturma becerisi
Kurs yapısı ve içerik
- 9 bölümden (başlangıç ~ ileri) ve derinlemesine eklerden oluşur
- Her bölüm, teorik açıklamalar ile doğrudan uygulamayı birlikte sunar
- Her kısmın sonunda, "Example Playground" içinde promptu doğrudan girip yanıttaki değişimleri deneyebileceğiniz bir alan bulunur
- Tüm örnekler için açıklama anahtarı dahildir
- Eğitimin varsayılan modeli, en hafif, hızlı ve uygun maliyetli model olan Claude 3 Haiku'dur. Gerektiğinde daha yüksek zekaya sahip Sonnet ve Opus için de atıflar yer alır
- Google Sheets genişletilmiş sürümüyle de kullanılabildiği için öğrenmeye erişim yüksektir
Müfredat içeriği
- Başlangıç
- Chapter 1: Temel prompt yapısı
- Chapter 2: Açık ve doğrudan talimat yazma
- Chapter 3: Rol atama
- Orta seviye
- Chapter 4: Veri ile talimatı ayırma
- Chapter 5: Çıktı formatını belirleme ve Claude için konuşma biçimine dönüştürme
- Chapter 6: Ön düşünme (adım adım düşünce çıkarımı)
- Chapter 7: Örneklerden yararlanma
- İleri seviye
- Chapter 8: Halüsinasyonları (Hallucination) önleme
- Chapter 9: Karmaşık promptlar oluşturma (sektöre göre örnekler)
- Örnek: chatbot, hukuk hizmetleri, finansal hizmetler, kodlama gibi farklı iş alanlarına yönelik pratik uygulama problemleri ele alınır
- Ekler
- Standart promptların ötesine geçen yöntemler
- Prompt chaining, araç kullanımı, arama/arama sonuçlarını birleştirme gibi ileri teknikler
Kullanım rehberi
- Eğitimin, her bölümü sırayla ilerleyerek tamamlanması özellikle önerilir
- Gerçek kullanım odaklı alıştırmalar ve adım adım açıklamalar sayesinde, yeni başlayan mühendisler bile gerçekten kullanılabilir prompt tasarımı yetkinliğini doğal şekilde edinebilir
- Tüm ürün ve model adları özgün halleriyle yazılır; bu sayede İngilizce tabanlı iş ortamlarında da doğrudan kullanılabilir
Ek özellikler ve açık kaynak bilgisi
- Github üzerinde 19.400'den fazla Stars ve 1.900 Fork kaydına ulaşmış durumda
- Ana geliştirme dili Jupyter Notebook olup, bir miktar Python kodu da içerir
- Ayrı bir dağıtım paketi yoktur; tüm materyaller açık kaynak olarak serbestçe incelenebilir
1 yorum
Hacker News görüşleri
Bu bağlamda "engineering" kelimesinin kullanılmasını çok rahatsız edici buluyorum; bunun gerçekten mühendislik sayılabileceğini düşünmüyorum. Mühendislik, uzun yıllar boyunca birikmiş bilgiye, fizik yasalarına ve kurallara dayanarak öngörülebilir şekilde tasarlayıp üretmektir; şu anda yapılan şey ise sonuç çıkana kadar rastgele denemekten ibaret.
Her kelimenin birden fazla anlamı olduğunu düşünüyorum. "Prompt engineering" içindeki "engineering", "social engineering"deki kullanıma benzer ama farklı bir nüans taşıyor. Örneğin Google'ın engineering tanımı 2. maddede "hileyle bir amacı gerçekleştirme eylemi" anlamını veriyor. Merriam-Webster sözlüğündeki 3. tanımda da, collins dictionary ve yourdictionary gibi kaynaklarda da “ustaca yönlendirme, plan kurma” gibi teknik olmayan anlamların açıkça bulunduğu görülüyor; bu, kelimenin yerleşik ikincil anlamlarından biri.
Ben mısır gevreği yerken kutusunun teknik özelliklerini inceliyorum, her sabah bunu yapıyorum ve otobüse binme mühendisliği becerilerimi de uyguluyorum; çünkü ben geçimini prompt engineering ile sağlayan biriyim. Bu günlerde çok fazla kelimenin asıl anlamını yitirdiğini düşünüyorum, bu yüzden buna sinir olan tek kişinin ben olmadığını görmek sevindirici.
Kanada'nın yaklaşımını, yani mühendis unvanını kullanmak için her eyaletin teknik meslek düzenleyicisinden lisans alma sistemini hâlâ tercih ediyorum. ABD'de her yazılım geliştiriciye, tamirciye, HVAC kurulumcusuna, tesisatçıya kadar herkese mühendis denmesi bana fazla geliyor.
Bence bu tartışma aslında birçok "engineering team"in yaptığı işe de aynı şekilde uygulanabilir. Altta yatan örtük varsayım, bir işi mühendis yapıyorsa o işin otomatik olarak mühendislik olduğu ve daha da derinde, yazılımın kendisinin "software engineering" olarak adlandırılmayı hak edip etmediğine dair önemli bir varsayım bulunuyor.
Bence "Engineering" kelimesi, insanlara bunun sadece cümle yazmak olmadığını düşündürmek için kullanılan retorik bir araç. Açıkçası buna "prompt writing" dense biraz hafif kaçabilirdi; bu yüzden "soft" skill ifadesinden hoşlanmayanlar için daha da rahatsız edici olabilir.
Bugünün "yeni başlayanlar için simya" bölümü gibi hissettiriyor. Benchmark setinde rastgele seed olarak 7 verildiğinde algoritma hızının %30 arttığı vakayı hatırlatıyor; 8 değil, 6 değil, özellikle 7.
Bu yazıyı okurken benim için önemli olan çıkarım, çıktının sırasını nasıl düzenleyeceğini düşünmek oldu. Örneğin, cevap vermeden önce kanıtları veya göstergeleri çıkarmasını istemek. LLM'lerin olasılıksal otomatik tamamlama yaptığını biliyordum ama bu şekilde bir ön hazırlama fikrini düşünmemiştim.
Bu yöntem reasoning modelleri için geçerli olmayabilir. Reasoning modelleri, cevabı vermeden önce istendiği biçimde düşünme sürecinden geçtiği için çıktı sırasının doğruluk üzerindeki etkisi daha az oluyor. Belki de OpenAI'ın reasoning'i zorlamaya çalışmasının nedeni budur.
Ben genelde çevrimiçi bulduğu kaynaklardan kısa alıntılar çıkarmasını istiyorum (ilgili olduğunda). Bu, bilginin güvenilirliğini bir ölçüde destekliyor. Son zamanlarda kuruluşumuzda Cloudflare Zero Trust kurulumu yaparken çok ihtiyaç duyduğumuz bir yöntemdi.
Tersine, önce cevabı verip sonra gerekçe sunmasını istediğinizde model keyfî bir cevap uydurup ardından bunu inandırıcı göstermeye çalışan bir "saçmalama modu"na giriyor. Onun yerine önce nesnel artı ve eksileri çıkarmasını, sonra sonuca varmasını isterseniz çok daha dikkatli yanıt veriyor.
Bence bu gönderinin başlığına "(2024)" eklenmeli.
Zor problemler için bence en iyi prompt engineering tavsiyesi "açıp daraltmak". Yani önce problemi ve bağlamı net biçimde ortaya koyup, yapay zekadan mümkün olan tüm seçenekleri ve yaklaşımları analiz edip bulmasını isteyerek bilgi alanını olabildiğince genişletmek; ardından her yaklaşımın artılarını ve eksilerini listeletip en uygun çözümü seçtirmek. Kolay sorunlarda bunların hiçbirine gerek kalmadan doğrudan sorarak da cevap alınabilir ama zor sorunlarda baştan doğrudan cevap istenirse model genelde kulağa makul gelen şeyler uydurur, bu yüzden mutlaka gerçekçi temelden başlamak gerekir. Bu nedenle somut bağlam - seçenek analizi - artılar ve eksiler - nihai seçim akışı gerekli.
Başlığa 2024 eklenmesi gerektiği yönünde bir görüş.
Sanki kendi yaptığımız işi yapay zekaya öğretip sonra da aynı işi tekrar yapay zekaya etkili biçimde yaptırmayı öğreniyoruz. Eğer bu teknoloji ABD ekonomisinin tamamı tarafından desteklenmezse, bir sıcak hava balonu gibi yükselip sonra hızla sönüp inebilir.
Diğer yorumlara benzer şekilde, bu bana da klasik anlamda mühendislik gibi gelmiyor. Yine de Anthropic'in model yorumlanabilirliği alanında oldukça etkileyici araştırmalar yaptığını düşünüyorum. Eğer o araç public API olarak açılırsa, prompt'a göre modelin iç durumundaki farkları karşılaştırıp daha sistematik ayar yapmaya yarayan bir geri bildirim döngüsü kurulabilir.
Bu eğitim, üç model için yazılmış: Sonnet, Haiku ve Opus 3. Bugün de geçerli bazı dersler içeriyor ama daha akıllı RL modelleri için (Sonnet 4.5 gibi) o kadar önemli olmayan kısımlar da var. Bilgi olsun diye: Claude 3 Haiku en küçük, en hızlı ve en ucuz model; Sonnet ve Opus daha zeki, Opus ise en yeteneklisi.