DeepEval - LLM'ler için birim testi

xguru · 2023-08-19T10:03:01+09:00

Temel felsefesi "Pytest for LLM" Prodüksiyona geçiş için, LLM pipeline'ları üzerinde çevrimdışı değerlendirme çalıştırmaya yönelik Pythonvari bir yöntem sunuyor Python birim testleri yazar gibi LLM uygulamaları (RAG gibi) için testler yazmayı mümkün kılıyor assert_llm_output aracılığıyla yanıtları entailment / exact / bertscore gibi metriklerle değerlendiriyor Özel metrikler tanımlamak ve mevcut metrikleri değiştirmek de mümkün

(github.com/mr-gpt)

4 puan yazan xguru 2023-08-19 | Henüz yorum yok. | WhatsApp'ta paylaş

Temel felsefesi "Pytest for LLM"
Prodüksiyona geçiş için, LLM pipeline'ları üzerinde çevrimdışı değerlendirme çalıştırmaya yönelik Pythonvari bir yöntem sunuyor
Python birim testleri yazar gibi LLM uygulamaları (RAG gibi) için testler yazmayı mümkün kılıyor
assert_llm_output aracılığıyla yanıtları entailment / exact / bertscore gibi metriklerle değerlendiriyor
Özel metrikler tanımlamak ve mevcut metrikleri değiştirmek de mümkün

DeepEval - LLM'ler için birim testi

İlgili okumalar

Henüz yorum yok.