- Yapay zeka tabanlı web scraping için açık kaynaklı bir Python kütüphanesi
- LLM ve doğrudan grafik mantığını kullanarak web siteleri, belgeler ve XML dosyaları için scraping pipeline'ları oluşturur
- Hangi bilgiyi çıkarmak istediğinizi belirtmeniz yeterli; kütüphane gerisini otomatik olarak halleder
- Ollama, OpenAI, Groq, Azure, Gemini gibi çeşitli modelleri kullanabilir
- Sunulan düğümler
- Base düğümü, HTML Fetch düğümü, Image_to_text düğümü, Text_To-Speech düğümü, internet arama düğümü
- Conditional düğümü: grafikteki bir sonraki düğümü belirler
- Answer generation düğümü: LLM kullanarak sorunun yanıtını üretir
- generate_scraper düğümü: kullanıcı girdisine göre içerikten istenen bilgiyi çıkarır
- Get_probable_tags düğümü: içerikte istenen bilgiyi taşıyan HTML etiketlerini bulur
- Parse düğümü: HTML belgesinden bilgi çıkarır
- Rag düğümü: büyük belgelerden ilgili bilgiyi çıkarır
- Robots düğümü: robot erişimine izin verilip verilmediğini kontrol eder
1 yorum
CSR web uygulamalarında çok iyi veri çekemiyormuş gibi bir izlenim edindim; bu yüzden biraz hayal kırıklığı yarattı.
Buna karşılık SSR konusunda oldukça memnun kaldım.