Üretim düzeyinde LLM uygulamaları için geliştirici rehberi (çeviri yazı)

ninebow · 2023-11-24T13:10:09+09:00

Zapier'in AI ürün geliştiricisi Tal Peretz tarafından yazılan bu yazı, izin alınarak çevrilmiştir. Orijinal metne buradan ulaşabilirsiniz; ana başlıklar aşağıdaki gibidir. Prompt engineering - başlangıç aşaması Değerlendirmenin rolü: (navigasyonun ölçütü) Kutup Yıldızı Yapay zeka değerlendirmelerine sistematik yaklaşım / Systematic Approach to AI Evaluations Derinlemesine testler için veri kümelerinden yararlanma / Dataset Utilization for In-depth Testing Yapay zeka değerlendirmeleriyle değerlendirmeleri iyileştirme / Refining Evaluations with AI Assessments Değerlendirme için metrikler / Metrics to evaluate Altın standart olarak insan değerlendirmesi / Human Evaluation as the Gold Standard RAG: gerektiğinde bağlama uygun derinlemesine bilgi Denenebilecek teknikler / Techniques to Experiment With Fine-tuning: uzmanlaşma sanatı Eğitim verisinin yetersizliği: miktar-kalite dengesi sorunu / Insufficient Training Data: The Quantity-Quality Equilibrium Dengesiz eğitim veri setleri: önyargı ikilemi / Unbalanced Training Sets: The Bias Dilemma Açık veriyi yeniden kullanma: yeni sinyal zorunluluğu / Reusing Public Data: The New Signal Imperative Yetersiz prompt engineering: açıklık ilkesi / Poor Prompt Engineering: The Clarity Commandment Kademeli değerlendirme yapmamak: sürekli gözden kaçırma / Not Evaluating Incrementally: The Continuous Oversight Her şeye ihtiyaç duyulduğunda Kapanış

(discuss.pytorch.kr)

32 puan yazan ninebow 2023-11-24 | 3 yorum | WhatsApp'ta paylaş

Zapier'in AI ürün geliştiricisi Tal Peretz tarafından yazılan bu yazı, izin alınarak çevrilmiştir.
Orijinal metne buradan ulaşabilirsiniz; ana başlıklar aşağıdaki gibidir.

Prompt engineering - başlangıç aşaması
Değerlendirmenin rolü: (navigasyonun ölçütü) Kutup Yıldızı
- Yapay zeka değerlendirmelerine sistematik yaklaşım / Systematic Approach to AI Evaluations
- Derinlemesine testler için veri kümelerinden yararlanma / Dataset Utilization for In-depth Testing
- Yapay zeka değerlendirmeleriyle değerlendirmeleri iyileştirme / Refining Evaluations with AI Assessments
- Değerlendirme için metrikler / Metrics to evaluate
- Altın standart olarak insan değerlendirmesi / Human Evaluation as the Gold Standard
RAG: gerektiğinde bağlama uygun derinlemesine bilgi
- Denenebilecek teknikler / Techniques to Experiment With
Fine-tuning: uzmanlaşma sanatı
- Eğitim verisinin yetersizliği: miktar-kalite dengesi sorunu / Insufficient Training Data: The Quantity-Quality Equilibrium
- Dengesiz eğitim veri setleri: önyargı ikilemi / Unbalanced Training Sets: The Bias Dilemma
- Açık veriyi yeniden kullanma: yeni sinyal zorunluluğu / Reusing Public Data: The New Signal Imperative
- Yetersiz prompt engineering: açıklık ilkesi / Poor Prompt Engineering: The Clarity Commandment
- Kademeli değerlendirme yapmamak: sürekli gözden kaçırma / Not Evaluating Incrementally: The Continuous Oversight
Her şeye ihtiyaç duyulduğunda
Kapanış

3 yorum

cosine20 2023-11-27

Paylaşım için teşekkürler.

apkas 2023-11-24

OpenAI'ın yayımladığı A Survey of Techniques for Maximizing LLM Performance ile neredeyse aynı içerik gibi görünüyor, değil mi?

ninebow 2023-11-25

OpenAI DevDay videosunu izleyememiştim; bahsettiğiniz oturumun olduğunu ancak şimdi öğrendim. :)
Paylaştığınız için teşekkür ederim!

(+ diğerleri için, bulduğum YouTube bağlantısını da paylaşıyorum!)
https://www.youtube.com/watch?v=ahnGLM-RC1Y

Üretim düzeyinde LLM uygulamaları için geliştirici rehberi (çeviri yazı)

İlgili okumalar

3 yorum