Google DeepMind'in Project Mariner'ı - tarayıcı otomasyon aracı
(deepmind.google)- Tarayıcıyı kullanmanın yeni bir yolu
- Gemini 2.0 tabanlı güçlü multimodal anlama ve akıl yürütme yetenekleriyle tarayıcı görevlerini otomatikleştirir
- Tarayıcı ekranındaki pikseller, metin, kod, görseller, formlar ve diğer tüm unsurları anlayıp akıl yürütür
- Native Multimodality : tarayıcıdaki tüm içerikleri anlayıp akıl yürütme
- Web sitesindeki metin, kod, görsel gibi karmaşık unsurları analiz eder
- Sesli komutlara yanıt verir ve görev ilerlemesi hakkında görsel geri bildirim sunar
- Browser Interaction : karmaşık web sitelerini gerçek zamanlı olarak anlama ve gezinme
- Kullanıcı adına web siteleriyle etkileşime girer
- Tekrarlayan görevleri otomatikleştirerek zaman kazandırır
- Komutu anlayamazsa net bir açıklama ister
- Reasoning : karmaşık talimatları anlayıp bunları uygulanabilir adımlara bölerek yerine getirme
- Web unsurları arasındaki ilişkileri ve işlevleri kavrar
- Görev planlama ve yürütme sürecini şeffaf biçimde göstererek kullanıcının karar verme sürecini anlamasını sağlar
- Şu anda yalnızca küçük ölçekli bir güvenilir test grubunda kullanılabiliyor : Teste katılmak isteyenlerin bekleme listesine kaydolması gerekiyor
1 yorum
Yapay zekaya optimize edilmiş headless tarayıcılar çıkıyor…
Web sunucuları da o tarayıcılara optimize edilmiş yanıtlar döndürüyor…
Kendi aralarında konuşacakları gün çok da uzak değil…