- Bilgisayar kullanım biçimi uzun süre tıklama ve giriş odaklı mekanik etkileşim ile sınırlı kaldı, ancak mobil cihazların ve sesli asistanların ortaya çıkışıyla daha doğal etkileşimlere doğru genişledi
- Artık çok modluluk·duygusal zeka·kişiselleştirmeyi birleştiren AI avatarları/kopyaları, bir araçtan çok ekip arkadaşı ya da iş ortağına yakın bir rolü hedefliyor
- Gerçek zamanlı video altyapısı, 3D yüz yeniden üretimi, bilişsel sistemler, ses teknolojileri ve LLM'lerdeki gelişmeler, canlı ve zeki avatarların hayata geçirilmesini mümkün kılıyor
- Bunlar, kalıcı bellek, duygusal empati, entelektüel anlayış ve derin kişiselleştirme yoluyla insanlarla kurdukları ilişkiselliği güçlendiriyor ve farklı sektörlerde uygulanıyor
- Geleceğin arayüzleri basit ekranların ötesine geçerek bağlam anlayışı·davranışa uyum·duygusal zeka sahibi sistemlere dönüşecek ve bunun insan-bilgisayar ilişkisinin özünü değiştirmesi bekleniyor
Neden şimdi: insan-makine etkileşiminde yeni bir çağ
- İnsan-makine etkileşimi, mevcut tıklama, yazma ve ekran içinde gezinme biçimlerinden uzaklaşarak çok modluluk ve duygusal zeka merkezli şekilde gelişiyor
- Mobil cihazların yaygınlaşmasıyla ses tabanlı etkileşim devreye girdi ve Siri gibi asistanlar doğal konuşmanın mümkün olduğunu gösterdi
- Bugün ise AI avatarları ve AI kopyaları, araç olmanın ötesine geçerek ekip arkadaşı, iş ortağı ve yoldaş rolü üstlenen avatarlara evriliyor
- AI avatarları gerçek zamanlı olarak göz teması kuruyor, gülümsüyor, kullanıcının tercihlerini hatırlıyor ve duygulara tepki veriyor
- Statik avatarlar olmaktan çıkıp dinamik, ifade gücü yüksek ve canlılık hissi taşıyan varlıklara dönüşüyorlar
- Koçluk, sağlık hizmetleri, yaşlı bakımı, müşteri desteği gibi çeşitli sektörlerde kullanılıyorlar
Teknoloji ve davranış değişiminin kusursuz uyumu
- Metin tabanlı chatbotların ve sesli asistanların gelişimi, kişiselleştirilmiş gerçek zamanlı destek ile eller serbest etkileşimi mümkün kılıyor
- AI avatarları basit desteğin ötesine geçerek empati, bağlam ve kişilik sahibi iş ortakları gibi çalışıyor
- İnsanlar doğaları gereği bağlantı ve ilişki aradığı için, dijital araçların işlemsel etkileşimlerden ilişki odaklı etkileşimlere evrilmesini bekliyor
- Teknolojik ve davranışsal değişimlerin birleşmesi, AI avatarlarını ve kopyalarını hem mümkün hem de arzu edilir hale getiriyor
- Teknolojik yenilik ile toplumsal kabul aynı anda güç kazanırken, AI avatarlarına yönelik talep patlayıcı biçimde artıyor
Teknoloji yığınının dönüşümü
- Gerçek zamanlı video altyapısı: WebRTC gibi teknolojiler düşük gecikmeli video konferansı destekliyor ve dağıtık ortamlarda akıcı görsel etkileşim sağlıyor
- 3D yüz yeniden üretimi: Tavus, HeyGen gibi şirketler kısa videolardan yüksek kaliteli yüz klonları ve doğru lip-sync üretiyor
- Bilişsel sistemler: Jestleri, mikro mimikleri, göz temasını ve hareketleri gerçek zamanlı izleyerek görsel ipuçlarına tepki veriyor. Çevreyi anlayabiliyor ve bağlama uygun tepki verebiliyor
- Ses teknolojileri: Deepgram, ElevenLabs gibi şirketlerin TTS/STT çözümleri doğal ve anlık konuşmaları destekliyor
- Gecikmesiz gerçek zamanlı ses teknolojisi sayesinde esnek ve ifade gücü yüksek diyaloglar kurulabiliyor
- Dil modelleri: LLM'ler sayesinde zengin bağlam anlayışı ve akıllı yanıtlar mümkün oluyor; belirli alanlara özelleşmiş konuşmalar gerçekleştirilebiliyor
- Programlanmış sınırlı bilginin ötesine geçip düşünceli tepkiler verebiliyor
Kalıcı bellek
- Oturum içinde uzun konuşmaları izleyip bağlamı koruma yeteneğine sahip
- Oturumlar arasında da geçmiş hedefleri ve tercihleri hatırlayarak kişiselleştirilmiş konuşmalar sunuyor
- Tek seferlik tepkilerin ötesine geçerek uzun vadeli yol arkadaşlığı sunan AIya evriliyor
Kişilik ve duygusal zeka
- İlişki merkezli deneyimler için sıcaklık, empati ve teşvik gibi olumlu duyguları ifade ediyor
- İnce duygusal durumları ton·zamanlama·mimik yoluyla yansıtarak insani güven oluşturuyor
Entelektüel anlayış
- İnsanlar gibi bağlamı kavrayıp anlık çıkarım yapıyor
- Güncel bilgilere yanıt verebiliyor ve sağlık, finans, eğitim gibi uzmanlık alanı bilgisini yansıtıyor
Derin kişiselleştirme
- Basit UI özelleştirmesinin ötesine geçerek ses, görünüm ve tepki biçimini kişiye göre optimize ediyor
- Geçmiş konuşmalarla ve harici araçlar ile bilgi sistemleriyle bağlantı kurarak akıllı ve özelleştirilmiş etkileşimler sunuyor
- Character.AI, Delphi gibi platformlarda bunu şimdiden on milyonlarca kullanıcı deneyimliyor
Altyapı katmanı: yeni presence stack
- Tavus:
- Geliştirici odaklı, API tabanlı yapısıyla gerçek zamanlı kişiselleştirilmiş video iletişimini destekliyor
- Onboarding, uzaktan sağlık hizmeti ve asenkron satış gibi iş akışlarına konuşmalı videoyu entegre ediyor
- Synthesia:
- Metni 140'tan fazla dilde stüdyo kalitesinde videoya dönüştürerek AI avatar videoları üretiyor
- Zoom, Reuters, Heineken gibi büyük şirketler bunu satış, pazarlama, yerelleştirme, öğrenme ve gelişim alanlarında kullanıyor
- Diğerleri: Sieve, Descript, TwelveLabs, OpenAI'ın Sora modeli gibi çeşitli video AI altyapı araçları ortaya çıkıyor
- Son 2 yılda yaşanan patlayıcı büyüme ile üreticilerin·geliştiricilerin·şirketlerin hepsinin kullanabildiği bir ekosistem oluştu
İleriye bakış: daha insani bir dijital dünya
- Arayüzler piksel tabanlı ekranlardan uzaklaşıp bağlam anlayışı·duygusal zeka·bellek temelli uyarlanabilir sistemlere yöneliyor
- İyi bir AI, sadece yanıt vermekle kalmayıp sezgisel tepki ve duruma uygun karşılıklar da üretiyor
- Meta Glasses gibi giyilebilir cihazlar sayesinde gerçek dünyada da sürekli ve kişiselleştirilmiş etkileşim mümkün hale gelebilir
- Yeni nesil HCI'ın, sürükleyici·bedenselleşmiş·kişisel deneyimler etrafında insan-makine ilişkisinin kendisini yeniden tanımlaması bekleniyor
1 yorum
Bir bakıma zaten öyle oldu
Böyle teknolojiler geliştikçe insanlar arasındaki mesafe daha da artacak gibi görünüyor.