8 puan yazan xguru 2024-12-18 | 1 yorum | WhatsApp'ta paylaş
  • Tarayıcıyı kullanmanın yeni bir yolu
  • Gemini 2.0 tabanlı güçlü multimodal anlama ve akıl yürütme yetenekleriyle tarayıcı görevlerini otomatikleştirir
  • Tarayıcı ekranındaki pikseller, metin, kod, görseller, formlar ve diğer tüm unsurları anlayıp akıl yürütür
  • Native Multimodality : tarayıcıdaki tüm içerikleri anlayıp akıl yürütme
    • Web sitesindeki metin, kod, görsel gibi karmaşık unsurları analiz eder
    • Sesli komutlara yanıt verir ve görev ilerlemesi hakkında görsel geri bildirim sunar
  • Browser Interaction : karmaşık web sitelerini gerçek zamanlı olarak anlama ve gezinme
    • Kullanıcı adına web siteleriyle etkileşime girer
    • Tekrarlayan görevleri otomatikleştirerek zaman kazandırır
    • Komutu anlayamazsa net bir açıklama ister
  • Reasoning : karmaşık talimatları anlayıp bunları uygulanabilir adımlara bölerek yerine getirme
    • Web unsurları arasındaki ilişkileri ve işlevleri kavrar
    • Görev planlama ve yürütme sürecini şeffaf biçimde göstererek kullanıcının karar verme sürecini anlamasını sağlar
  • Şu anda yalnızca küçük ölçekli bir güvenilir test grubunda kullanılabiliyor : Teste katılmak isteyenlerin bekleme listesine kaydolması gerekiyor

1 yorum

 
iolothebard 2024-12-18

Yapay zekaya optimize edilmiş headless tarayıcılar çıkıyor…
Web sunucuları da o tarayıcılara optimize edilmiş yanıtlar döndürüyor…
Kendi aralarında konuşacakları gün çok da uzak değil…