6 puan yazan GN⁺ 2025-08-29 | 1 yorum | WhatsApp'ta paylaş
  • Bilgisayar kullanım biçimi uzun süre tıklama ve giriş odaklı mekanik etkileşim ile sınırlı kaldı, ancak mobil cihazların ve sesli asistanların ortaya çıkışıyla daha doğal etkileşimlere doğru genişledi
  • Artık çok modluluk·duygusal zeka·kişiselleştirmeyi birleştiren AI avatarları/kopyaları, bir araçtan çok ekip arkadaşı ya da iş ortağına yakın bir rolü hedefliyor
  • Gerçek zamanlı video altyapısı, 3D yüz yeniden üretimi, bilişsel sistemler, ses teknolojileri ve LLM'lerdeki gelişmeler, canlı ve zeki avatarların hayata geçirilmesini mümkün kılıyor
  • Bunlar, kalıcı bellek, duygusal empati, entelektüel anlayış ve derin kişiselleştirme yoluyla insanlarla kurdukları ilişkiselliği güçlendiriyor ve farklı sektörlerde uygulanıyor
  • Geleceğin arayüzleri basit ekranların ötesine geçerek bağlam anlayışı·davranışa uyum·duygusal zeka sahibi sistemlere dönüşecek ve bunun insan-bilgisayar ilişkisinin özünü değiştirmesi bekleniyor

Neden şimdi: insan-makine etkileşiminde yeni bir çağ

  • İnsan-makine etkileşimi, mevcut tıklama, yazma ve ekran içinde gezinme biçimlerinden uzaklaşarak çok modluluk ve duygusal zeka merkezli şekilde gelişiyor
    • Mobil cihazların yaygınlaşmasıyla ses tabanlı etkileşim devreye girdi ve Siri gibi asistanlar doğal konuşmanın mümkün olduğunu gösterdi
    • Bugün ise AI avatarları ve AI kopyaları, araç olmanın ötesine geçerek ekip arkadaşı, iş ortağı ve yoldaş rolü üstlenen avatarlara evriliyor
  • AI avatarları gerçek zamanlı olarak göz teması kuruyor, gülümsüyor, kullanıcının tercihlerini hatırlıyor ve duygulara tepki veriyor
    • Statik avatarlar olmaktan çıkıp dinamik, ifade gücü yüksek ve canlılık hissi taşıyan varlıklara dönüşüyorlar
    • Koçluk, sağlık hizmetleri, yaşlı bakımı, müşteri desteği gibi çeşitli sektörlerde kullanılıyorlar

Teknoloji ve davranış değişiminin kusursuz uyumu

  • Metin tabanlı chatbotların ve sesli asistanların gelişimi, kişiselleştirilmiş gerçek zamanlı destek ile eller serbest etkileşimi mümkün kılıyor
    • AI avatarları basit desteğin ötesine geçerek empati, bağlam ve kişilik sahibi iş ortakları gibi çalışıyor
  • İnsanlar doğaları gereği bağlantı ve ilişki aradığı için, dijital araçların işlemsel etkileşimlerden ilişki odaklı etkileşimlere evrilmesini bekliyor
    • Teknolojik ve davranışsal değişimlerin birleşmesi, AI avatarlarını ve kopyalarını hem mümkün hem de arzu edilir hale getiriyor
  • Teknolojik yenilik ile toplumsal kabul aynı anda güç kazanırken, AI avatarlarına yönelik talep patlayıcı biçimde artıyor

Teknoloji yığınının dönüşümü

  • Gerçek zamanlı video altyapısı: WebRTC gibi teknolojiler düşük gecikmeli video konferansı destekliyor ve dağıtık ortamlarda akıcı görsel etkileşim sağlıyor
  • 3D yüz yeniden üretimi: Tavus, HeyGen gibi şirketler kısa videolardan yüksek kaliteli yüz klonları ve doğru lip-sync üretiyor
  • Bilişsel sistemler: Jestleri, mikro mimikleri, göz temasını ve hareketleri gerçek zamanlı izleyerek görsel ipuçlarına tepki veriyor. Çevreyi anlayabiliyor ve bağlama uygun tepki verebiliyor
  • Ses teknolojileri: Deepgram, ElevenLabs gibi şirketlerin TTS/STT çözümleri doğal ve anlık konuşmaları destekliyor
    • Gecikmesiz gerçek zamanlı ses teknolojisi sayesinde esnek ve ifade gücü yüksek diyaloglar kurulabiliyor
  • Dil modelleri: LLM'ler sayesinde zengin bağlam anlayışı ve akıllı yanıtlar mümkün oluyor; belirli alanlara özelleşmiş konuşmalar gerçekleştirilebiliyor
    • Programlanmış sınırlı bilginin ötesine geçip düşünceli tepkiler verebiliyor

Kalıcı bellek

  • Oturum içinde uzun konuşmaları izleyip bağlamı koruma yeteneğine sahip
  • Oturumlar arasında da geçmiş hedefleri ve tercihleri hatırlayarak kişiselleştirilmiş konuşmalar sunuyor
  • Tek seferlik tepkilerin ötesine geçerek uzun vadeli yol arkadaşlığı sunan AIya evriliyor

Kişilik ve duygusal zeka

  • İlişki merkezli deneyimler için sıcaklık, empati ve teşvik gibi olumlu duyguları ifade ediyor
  • İnce duygusal durumları ton·zamanlama·mimik yoluyla yansıtarak insani güven oluşturuyor

Entelektüel anlayış

  • İnsanlar gibi bağlamı kavrayıp anlık çıkarım yapıyor
  • Güncel bilgilere yanıt verebiliyor ve sağlık, finans, eğitim gibi uzmanlık alanı bilgisini yansıtıyor

Derin kişiselleştirme

  • Basit UI özelleştirmesinin ötesine geçerek ses, görünüm ve tepki biçimini kişiye göre optimize ediyor
  • Geçmiş konuşmalarla ve harici araçlar ile bilgi sistemleriyle bağlantı kurarak akıllı ve özelleştirilmiş etkileşimler sunuyor
  • Character.AI, Delphi gibi platformlarda bunu şimdiden on milyonlarca kullanıcı deneyimliyor

Altyapı katmanı: yeni presence stack

  • Tavus:
    • Geliştirici odaklı, API tabanlı yapısıyla gerçek zamanlı kişiselleştirilmiş video iletişimini destekliyor
    • Onboarding, uzaktan sağlık hizmeti ve asenkron satış gibi iş akışlarına konuşmalı videoyu entegre ediyor
  • Synthesia:
    • Metni 140'tan fazla dilde stüdyo kalitesinde videoya dönüştürerek AI avatar videoları üretiyor
    • Zoom, Reuters, Heineken gibi büyük şirketler bunu satış, pazarlama, yerelleştirme, öğrenme ve gelişim alanlarında kullanıyor
  • Diğerleri: Sieve, Descript, TwelveLabs, OpenAI'ın Sora modeli gibi çeşitli video AI altyapı araçları ortaya çıkıyor
  • Son 2 yılda yaşanan patlayıcı büyüme ile üreticilerin·geliştiricilerin·şirketlerin hepsinin kullanabildiği bir ekosistem oluştu

İleriye bakış: daha insani bir dijital dünya

  • Arayüzler piksel tabanlı ekranlardan uzaklaşıp bağlam anlayışı·duygusal zeka·bellek temelli uyarlanabilir sistemlere yöneliyor
  • İyi bir AI, sadece yanıt vermekle kalmayıp sezgisel tepki ve duruma uygun karşılıklar da üretiyor
  • Meta Glasses gibi giyilebilir cihazlar sayesinde gerçek dünyada da sürekli ve kişiselleştirilmiş etkileşim mümkün hale gelebilir
  • Yeni nesil HCI'ın, sürükleyici·bedenselleşmiş·kişisel deneyimler etrafında insan-makine ilişkisinin kendisini yeniden tanımlaması bekleniyor

1 yorum

 
bus710 2025-08-30

Bir bakıma zaten öyle oldu
Böyle teknolojiler geliştikçe insanlar arasındaki mesafe daha da artacak gibi görünüyor.