22 puan yazan sigridjineth 2025-01-06 | 4 yorum | WhatsApp'ta paylaş

Korece konusunda en başarılı RAG odaklı gömme modeli olan BGE-M3'ün, Huggingface'in sunduğu Python uygulamasının ötesine geçilerek, TensorFlow/Keras kullanımıyla kurumsal ortamlarda büyük ölçekli sunumu mümkün kılacak biçimde yeniden uygulandığını anlatan bir blog yazısı.

  1. Kurumsal sunum desteği
  • Java/Scala tabanlı Hadoop-Spark ortamında büyük ölçekli dağıtık işleme imkanı
  • Kotlin/Spring Boot ile yüksek performanslı sunucu geliştirme
  • TensorFlow Serving ile büyük ölçekli prodüksiyon ortamı desteği
  • TensorFlow Lite ile mobil/gömülü ortam desteği
  1. Model yapısının sadeleştirilmesi
  • Yalnızca Dense Layer ve LayerNorm ile çekirdek yapının uygulanması
  • Karmaşık Python bağımlılıklarının kaldırılması
  • Hafifletilmiş yapı sayesinde yüksek işlem hacmi
  1. Uygulama özellikleri
  • Word/Position/Token Type gömmelerinin temel Dense Layer ile uygulanması
  • 24 Transformer bloğunun saf TensorFlow işlemleriyle oluşturulması
  • Multi-Head Self-Attention'ın performans optimizasyonu için özel olarak uygulanması
  1. Gerçek kullanım örnekleri
  • Büyük ölçekli Hadoop ortamında dağıtık gömme işleme
  • Spring Boot tabanlı federated learning ve RAG hizmetleri
  • Apple Neural Engine kullanan mobil çıkarım
  • Kurumsal düzeyde TensorFlow Serving dağıtımı

Yazıda açıklanan uygulama yaklaşımının öne çıkan yanı, Python bağımlılıklarını kaldırıp yalnızca TensorFlow'un yerel yeteneklerini kullanarak büyük ölçekli kurumsal ortamlarda kararlı hizmet sunumunu mümkün kılmasıdır.

4 yorum

 
sigridjineth 2025-01-07
 
aer0700 2025-01-07

Yazının kendisi o kadar zor değil, ancak açıklamaya eklenen kodlar biraz eksik olduğu için, ilgili yöntemle uygulanmış tam kodun paylaşılması daha iyi olurdu diye düşünüyorum.

 
sigridjineth 2025-01-07
 
aer0700 2025-01-09

Teşekkürler
Yavaş yavaş tekrar bakmam gerekecek haha