- Doğal dil komutlarını tarayıcı etkileşimlerine (Selenium kodu) dönüştürerek tarayıcıyı otomatikleştirir
- Kullanıcı adına tekrar eden, çok zaman alan ve neredeyse hiç bilişsel çaba gerektirmeyen basit işleri otomatikleştirmeyi hedefler
- Doğal dil sorgularını Selenium koduna dönüştüren bir motor sunarak web iş akışlarını kolayca otomatikleştirmek ve bunları tarayıcıda çalıştırmak üzere tasarlanmıştır
Başlıca özellikler
- Doğal dil işleme: Doğal dildeki yönergeleri anlayarak tarayıcı etkileşimlerini gerçekleştirir
- Selenium entegrasyonu: Selenium ile sorunsuz şekilde entegre olarak web tarayıcılarını otomatikleştirir
- Açık kaynak:
transformers ve llama-index gibi açık kaynak projeleri üzerine kurulmuştur ve kullanıcı çıkarlarıyla uyumu sağlamak için şeffaflığı garanti eden açık kaynak modellerden yararlanır
- Gizlilik ve kontrol için yerel model desteği: Kullanıcının yapay zeka asistanı üzerinde tam kontrol sahibi olmasını ve gizliliğin korunmasını sağlamak için
Gemma-7b gibi yerel modelleri destekler
- Gelişmiş yapay zeka teknikleri: Yerel embedding (
bge-small-en-v1.5) kullanarak RAG gerçekleştirir, en alakalı HTML bölümlerini çıkarır; ardından Few-shot öğrenme ve Chain of Thought kullanarak, LLM'yi (Nous-Hermes-2-Mixtral-8x7B-DPO) kod üretimi için ince ayar yapmaya gerek kalmadan görevi yerine getirecek en alakalı Selenium kodunu türetir
Başlarken
- Colab not defterinde LaVague'u deneyebilirsiniz.
Yol haritası
- Erken aşamadaki bir proje olsa da, kullanıcılar adına internette eylem gerçekleştirebilen şeffaf ve uyumlu yapay zeka modellerini yaygınlaştıracak şekilde büyüyebilir.
- Text2Action alanında uzmanlaşabilmesi için yerel modelleri ince ayar yapmak, kod üretiminde yalnızca alakalı kod parçalarının kullanılmasını sağlamak için retrieval'ı geliştirmek ve diğer tarayıcı motorlarını (ör. playwright) veya başka otomasyon çerçevelerini desteklemek başlıca araştırma alanları olarak görülüyor.
GN⁺ görüşü
- LaVague, kullanıcının tekrar eden işlerini otomatikleştirerek zaman tasarrufu ve üretkenlik artışı sağlayabilecek bir potansiyele sahip. Bu özellikle tekrar eden veri girişi veya form doldurma gibi işler için faydalı olabilir.
- Açık kaynak temelli geliştirilmesi, hem kullanıcılara hem geliştiricilere şeffaflık ve değiştirilebilirlik sunar. Bu durum topluluk odaklı inovasyonu teşvik etmeye ve kullanıcı güveni oluşturmaya yardımcı olabilir.
- LaVague'un ele aldığı otomasyon teknolojisi, zaten birçok şirket ve geliştiricinin aşina olduğu Selenium gibi araçlarla entegre olduğundan mevcut iş akışlarına kolayca dahil edilebilir.
- Yapay zeka destekli otomasyon, yüksek doğruluk ve verimlilik gerektirir. LaVague'un sunduğu Few-shot öğrenme ve Chain of Thought gibi teknikler, karmaşık görevler işlenirken ortaya çıkabilecek hataları en aza indirmeye yardımcı olabilir.
- Bu tür teknolojilerin benimsenmesi, kullanıcı gizliliği ve veri güvenliği konusunda dikkatli değerlendirme gerektirir. Yerel model desteği bu kaygıları gidermenin bir yolu olabilir; ancak kullanıcıların yine de verilerinin nasıl işlendiğini dikkatle izlemesi gerekir.
2 yorum
Dizüstü ortamında test edilebilmesi gerçekten çok iyi görünüyor. Yol haritasında Playwright entegrasyonunun olması sevindirici,,
Hacker News yorumları
Yeni araç denemeleri hakkında görüş
Google Photos'u boşaltma deneyimi
TaxyAI gibi tarayıcı otomasyon araçları hakkında görüş
Selenium testleri deneyimi
Web sitelerine yönelik otomasyon talimatlarının yok sayılması endişesi
Otomasyonun potansiyel etkisi hakkında görüş
Model uyumluluğuna duyulan ilgi
Çevrimiçi oylamaya etkisi
Başarı oranını gösteren benchmark'ların önemi
Projeye ilgi