- Uçuş rezervasyonu neden AI ajanı demolarının "Hello World"ü haline geldi?
- Kullanıcılar, AI'nın kendileri adına uçuş ayırtmasındansa zaten tamamlanmış bir UX'i (ör. Google Flights) tercih ediyor
- Tek bir hata bile karmaşık bir müşteri hizmetleri cehennemini başlatabilir
- Sezgisel ve öngörülebilir sistemler aslında daha yenilikçidir
- AI hâlâ erken aşamada ve genel kullanıcılar tutarlılık ile öngörülebilirlik bekliyor
- Örnek: %80 doğrulukla bile tutarlı sonuçlar veriyorsa kabul edilebilir
Buna karşılık, düzensiz %90 doğruluk güveni sarsar
- Birçok AI projesi bunu gözden kaçırıp gösterişli demoların ve aşırı iddialı özelliklerin peşine düşüyor → sonuçta güven kaybı yaşanıyor
- Giderek daha fazla IDE şeffaflığını kaybediyor
- Kullanıcılar AI'nın ne yaptığını anlayamıyor
- Örnek: Reddit'te gündem olan Cursor'ın tüm çalışmayı sildiği olay
- Kullanıcının sürüm yönetimindeki yetersizliği de bir etken, ancak asıl neden UI/UX tasarımı
- İyi tasarım hataları önlemeli, AI'nın davranışını açıkça açıklamalı ve geri alma işlevi sunmalı
- Cursor başlangıçta:
- Sekmeyle tamamlama arayüzüyle şeffaf ve hafif bir etkileşim sunuyordu
- Kullanıcı güvenini yavaş yavaş inşa eden bir yaklaşımla popüler oldu
- Basit ve geri alınabilir tasarım, AI'ya duyulan güvensizliği azaltmada etkiliydi
- 200 milyon dolar yatırım alan Devin, "tam otonom ajan" olmayı hedefliyor
- Karmaşık sistem, yavaş tepki ve öngörülemez sonuçlar güvenin çökmesine yol açtı
- Aşırı iddialı yaklaşım kullanıcıların kafasını daha da karıştırdı
Hız vs. güvenilirlik: AI geliştirme ekiplerinin ikilemi
- AI geliştirme ekipleri şu ikisinden birini seçmek zorunda:
- Hızlı ilerleyip hataları göze almak mı
- Yoksa güvenilirlik ve istikrarı öncelemek mi
- Cevap, "dar bir kapsamda mükemmel sonuç" verebilen özelliklere odaklanmak ve istikrarlı biçimde yinelemeli iyileştirme yapmak
Temel ilke: karmaşıklıktan çok öngörülebilirlik
- Karmaşık sistemlerden ziyade iyi anlaşılan görevlere odaklanılmalı
- AI ajanları hâlâ dönüştürücü olsa da, şu üç unsur merkezde olmalı:
- Güvenilirlik
- Şeffaflık
- Öngörülebilirlik
İş akışları vs. ajanlar
- Anthropic'in çerçevesi: "Bir görev iş akışı olarak ifade edilebiliyorsa, ajan değil iş akışı oluşturun"
- İş akışları öngörülebilir, kontrol edilebilir ve basittir
- Ajanlar ise karmaşık ve kontrol edilmesi zor olduğundan yalnızca gerçekten dinamik durumlarda kullanılmalıdır
1 yorum
Hacker News görüşü
"Uçak rezervasyonu" ajanı artık bir şaka konusu oldu. Swyx'in yakın tarihli AI engineer etkinliği açılış konuşmasında da buna değinildi
Google Deepmind araştırmacıları ajanların güvenilirliğini artırmaya yönelik çalışmalar yürütüyor
Uçak rezervasyonu AI'a bırakılamayacak bir iştir
Çoğu durumda insanlar AI'ı mevcut iş akışlarına uydurmaya çalışma eğilimindedir
Cursor kullanım deneyimimden güvenilirliğin önemli olduğu sonucuna vardım
Son 20 yıldaki teknolojik gelişimde güvenilirliğin daha önemli olduğunu düşünüyorum
AI programlamasının mevcut durumuna dair bir Reddit başlığındaki yorum duygularımı özetliyor
AI kod yazdığında en azından o kodu anlayabilmek gerektiği ilkesine sahibim
İş akışının ajanlardan daha önemli olduğunu düşünüyorum
Google Flights zaten kusursuz bir UX sunuyor