- 8192 token uzunluğunu destekleyen metin gömme modeli
jina-embeddings-v2
- OpenAI'nin
text-embedding-ada-002 modeliyle rekabet ediyor ve benchmark testlerinde sınıflandırma/yeniden sıralama/arama/özetleme gibi alanlarda daha iyi performans gösteriyor
- Baştan sona yeniden inşa edildi ve 8k bağlamla çeşitli alanlarda kullanılabiliyor: hukuk belgeleri analizi, tıbbi araştırma, edebiyat analizi, finansal tahmin, konuşmalı yapay zeka vb.
- HuggingFace üzerinden iki model indirilebiliyor
- Base Model (0.27G): akademik araştırma veya iş analizi gibi yüksek doğruluk gerektiren yoğun işler için uygun olacak şekilde tasarlandı
- Small Model (0.07G): mobil uygulamalar veya cihazlar gibi bilgi işlem kaynaklarının kısıtlı olduğu ortamlardaki hafif uygulamalar için geliştirildi
1 yorum
Hacker News görüşleri
text-embedding-ada-002modelinin yarısı büyüklüğünde (768’e karşı 1536); bu da veritabanı alanından tasarruf sağlayıp sorgulamaları hızlandırabilir.llm-embed-jinaeklentisi LLM aracına dağıtıldı; bu sayede yeni Jina modeline erişilebiliyor.