- LlamaCloud: Yeni nesil bir yönetilen ayrıştırma, toplama ve arama hizmeti. LLM ve RAG uygulamalarına üretim odaklı Context-Augmentation sağlamaya yönelik olarak tasarlandı
- LlamaParse: Tablo/görsel gibi nesneler içeren karmaşık belgeleri ayrıştırmak için bir teknoloji. LlamaIndex ile entegre edilerek, karmaşık ve yarı yapılandırılmış belgeler için arama kurmayı sağlar
- Yönetilen toplama ve arama API'si: Veriyi kolayca yükleyip, işleyip depolayabilen ve herhangi bir programlama dilinden kullanılabilen bir API sunar. LlamaHub, LlamaParse ve entegre veri depoları üzerine kuruludur
RAG, verinin kalitesine bağlıdır
- LLM'nin özü, yapılandırılmamış veri kaynaklarında bilgi arama, sentezleme, çıkarım ve planlamayı otomatikleştirmektir
- Bunun için veriyi yükleyip, işleyip gömüp, vektör veritabanına yükleyen yeni bir veri yığını olan Retrieval-Augmented Generation (RAG) ortaya çıktı
- RAG yığını, klasik ETL yığınına kıyasla farklıdır ve LLM sistemlerinin doğruluğuna doğrudan etki eder
- Başlamak kolay olsa da üretim odaklı bir RAG kurmak zordur
- Tatmin edici sonuç üretemez
- Ayarlanması gereken parametre sayısı çok fazladır
- PDF'ler özellikle dağınık biçimlendirme nedeniyle ek sorun çıkarır
- Sürekli güncellenen verinin senkronizasyonu çok zordur
- LlamaCloud ve LlamaParse, RAG uygulamalarını daha hızlı bir şekilde üretime taşımak için veri hattı olarak inşa edildi
LlamaParse
- LlamaParse, karmaşık PDF belgelerinin içine gömülü tabloları ve grafikleri RAG ile yorumlayabilen en yeni nesil bir ayrıştırıcıdır
- Mevcut yaklaşımlarla mümkün olmayan, karmaşık belgelerle ilgili sorulara yanıt verebilmesini sağlar
Yönetilen toplama ve arama API'si
- LlamaCloud'un bir diğer önemli ürünü olarak, yüksek performanslı bir veri hattını kolayca tanımlamanızı ve LLM uygulamalarına temiz veri sağlamanızı mümkün kılar
- Mühendislik süresinden tasarruf, performans artışı ve sistem karmaşıklığını azaltma avantajı sağlar
Lansman ortakları ve iş ortakları
- LlamaParse, LLM ve yapay zeka ekosisteminde Datastack, MongoDB, Qdrant ve NVIDIA gibi depolama ve hesaplama ortaklıklarına sahip çeşitli ortaklarla iş birliği kuruyor
SSS
- LlamaCloud, vektör veritabanlarıyla rekabet etmez; odağı veri ayrıştırma ve toplama faaliyetlerindedir. 40'tan fazla popüler vektör veritabanıyla entegredir
- Arama katmanı, mevcut depolama sistemleri üzerine inşa edilmiş bir orkestrasyondur
Sonraki adımlar
- LlamaParse, bugün itibarıyla herkese açık önizleme olarak kullanılabilirken, LlamaCloud ise sınırlı sayıda kurumsal ortağa özel önizleme olarak sunuluyor
1 yorum
Hacker News Yorumları
LlamaParse geliştirme ekibinin bir parçası olarak, daha önce birçok PDF -A2 yapılandırılmış metin çıkarıcısı geliştirdim ve LlamaParse’ın diğer çıkarıcılara göre geliştirilmiş yönleri olduğunu gördüm. Karakter çıkarımı için OCR ile PDF metin çıkarımını birleştiriyor, belge yeniden yapımında ise sezgisel kurallarla makine öğrenmesi modellerini harmanlıyor. Özyinelemeli arama stratejisiyle beraber kullanıldığında karmaşık metinlerde soru-cevapta en iyi sonuçları verebiliyor.
LlamaParse, karmaşık tablolara sahip PDF dosyalarını iyi yapılandırılmış Markdown biçimine mükemmel şekilde ayrıştıran çok güçlü, kapalı bir ayrıştırma hizmeti geliştirdi. Bir açık kaynak projesi topluluk katkıları ve dikkat sayesinde ün kazandıktan sonra proje liderlerinin risk sermayesi alıp kapalı bir şey üretmesi sorun değil mi?
Medium’da yayınlanmasının sebebini anlamıyorum. Medium artık okunamayacak hale geliyor ve herkesin ulaşabileceği bir blog yazısı olması gerekir.
LlamaParse’ın unstructured.io ile doğrudan karşılaştırmasını merak ediyorum.
LlamaParse ile ilk deneyimim etkileyici değildi. E-posta ile kayıt olurken sonsuz yönlendirme sorunu, Google ile giriş yaptıktan sonra PDF ayrıştırıcıyla ilgili hayal kırıklığı. Zaten çok fazla alternatif varken bu servisin neden gerekli olduğu belirsiz.
LlamaParse, zor bir sorunu çözmeye çalışıyor gibi görünüyor. Birçok kurumsal kullanıcı PDF dosyalarını ayrıştırıp verileri doğru şekilde çıkarmaya ihtiyaç duyuyor. Arayüz biraz kafa karıştırıcı. LlamaParse tabloların sayılarını çıkarabiliyor ama çıktıyı tablo olarak sunmuyor; sayılara yalnızca soru-cevap yoluyla erişilebiliyor gibi görünüyor.
AWS Textract’ın yaptığı gibi değil mi? Tablolardan ve formlardan bilgi ayrıştırıp sorgulama yeteneği var. LI için iş akışı ve RAG için arama geçmişini kullanıcı için daha erişilebilir yapıyor, ama neden aynı şeyi yeniden icat ettiklerini anlamıyorum.
LLM'leri kullanarak en baştan en uygun biçimde veri çıkarımı yapmak mümkünken neden bunu kuruyorsunuz? Kısa vadede maliyet nedeniyle mantıklı olabilir ama uzun vadede bu, genelde LLM'ler tarafından çözülebilecek bir problem.
LlamaParse, RAG ile ilgili olarak defalarca karşılaştığım sorunu tam olarak çözüyor. Yapılandırılmamış veriden yapılandırılmış bilgi çıkarmak zordur.
Fiyatın nasıl olacağını merak ediyorum.