- Google'ın Gemma 4 modeli, WebGPU tabanlı olarak tamamen cihaz üzerinde çalıştırılır ve tarayıcı içinde yerleşik bir kişisel yapay zeka asistanı olarak kullanılabilir
- API anahtarı·bulut·harici veri aktarımı yok - tüm çıkarım işlemleri yerelde yürütülür ve veriler cihazın dışına çıkmaz
- Ziyaret edilen sayfayı okuma, düğmelere tıklama, form doldurma, JavaScript çalıştırma ve site hakkında soru-cevap yapma gibi ajan benzeri davranışlar desteklenir
- Gemma 4 E2B(~500MB) / E4B(~1.5GB) olmak üzere iki model arasından seçim yapılabilir ve ilk çalıştırmadan sonra önbelleğe alınarak yeniden kullanılır
- q4f16 nicemleme, 128K bağlam desteği (
onnx-community/gemma-4-E2B-it-ONNX, onnx-community/gemma-4-E4B-it-ONNX)
- 6 yerleşik araç sunulur
read_page_content: sayfa metnini/HTML'ini veya CSS selector ölçütüne göre okuma
take_screenshot: görünen sayfayı PNG olarak yakalama
click_element / type_text / scroll_page: CSS selector tabanlı DOM işlemleri
run_javascript: sayfa bağlamında DOM'un tamamına erişebilen JS çalıştırma
- Offscreen Document + Service Worker + Content Script biçiminde 3 katmanlı mimari
- Offscreen document,
@huggingface/transformers + WebGPU ile modeli barındırır ve ajan döngüsünü çalıştırır
- Service worker, mesaj yönlendirme ile ekran görüntüsü ve JS yürütmeyi üstlenir
- Content script, gem simgesini ve shadow DOM sohbet katmanını enjekte eder
- Ayarlarda model değiştirme, Thinking aç/kapat, araç çağrı döngüsü üst sınırı, konuşma geçmişini sıfırlama, site bazında devre dışı bırakma desteklenir
agent/ dizini sıfır bağımlılık ile gelir ve ModelBackend ile ToolExecutor arayüzleri temelinde bağımsız bir kütüphane haline getirilebilir
- WebGPU destekli Chrome gerekir / Apache-2.0 lisansı / TypeScript tabanlı uygulama
Henüz yorum yok.