Prosumer’ın Geleceği: “AI Native” İş Akışlarının Yükselişi

xguru · 2024-02-19T11:05:01+09:00

İş için kullanılan yazılımları gerçekten beğenen insanlar neredeyse hiç yok En iyi ürünler bile gerçek işte uygulanınca çoğu zaman yeterince esnek veya yeterince sofistike değildir; öğrenme eğrisi dik ve erişimleri zordur Üretken yapay zeka, iş akışlarını tamamen yeniden icat etme fırsatı sunar ve en baştan tamamen yeni ürünler inşa etmeyi mümkün kılar AI Native iş akışları, kullanıcıların mevcut görevlerini daha verimli yapmasına yardımcı olur Bu tür platformlar, kullanıcının düşük seviyeli işleri bir AI yardımcıya devredip yüksek seviyeli düşünmeye daha fazla zaman ayırmasına olanak tanır Herkesin programcı, yapımcı, tasarımcı veya müzisyen olabilmesi için yeni teknik ve estetik yeteneklerin kilidini açmaya yardımcı olur Yaratıcılık ile teknik beceri arasındaki boşluk daralır AI tabanlı bir iş akışıyla, “uzman seviyesinde ama tüketici dostu” ürünleri kullanan herkes bir sonraki nesil “prosumer” olabilir (Prosumer: üretici ve tüketici rollerini aynı anda üstlenen kişi. Alvin Toffler’ın “Üçüncü Dalga” adlı eserinde kullandığı bir terim.) GenAI Native prosumer ürünleri nasıl olur? Tüm GenAI Native iş akışı ürünlerinin ortak bir özelliği, “en son modeli erişilebilir ve etkili bir arayüze dönüştürmesi”dir Kullanıcılar, ürünün arkasındaki altyapıyla uğraşmaktan çok, ürünün nasıl yardımcı olduğuyla ilgilenir GenAI ile sağlanan teknik sıçramalar şaşırtıcı olsa da başarılı ürünler hâlâ kullanıcıyı ve onun sorunlarını derinlemesine anlamaya dayanır Başarılı ürünler: Kullanıcının acı noktalarını derinlemesine anlar AI ile hangi alanların soyutlanabileceğini Onay gerektiren karar noktalarının neresi olduğunu En büyük etkiyi yaratacak “kaldıraç noktalarının” nereler olduğunu hedef alır GenAI Native prosumer ürünlerinin ana özellikleri “Boş sayfa” sorununu çözen üretim araçları Doğal dil promptundan medya üreterek ilk başlangıcı kolaylaştırır Özel bir modelle çalıştırılabilir veya birden fazla modeli birlikte kullanabilirsiniz Örn. Vizcom’ın render aracı, Durable’in web sitesi oluşturucusu Çok modlu (ve multimedya) kombinasyon Birçok yaratıcı projede iki veya daha fazla içerik türüne ihtiyaç vardır: görsel ve metin, müzik ve video, animasyon ve sesli anlatım gibi Ancak bugün tek bir model bu tür tüm varlıkları üretemiyor Bu, kullanıcının tek bir yerde farklı içerik türlerini üretip geliştirebildiği ve bir araya getirebildiği bir iş akışı ürünü için fırsat yaratıyor Örn. HeyGen avatarları (kendi avatarlarını ElevenLabs TTS ile birleştirerek gerçekçi şekilde konuşan avatarlar üretir) Daha fazla yinelemeye izin veren akıllı editör “Tek seferde alınan” sonuçlar neredeyse yoktur Özellikle rastgeleliği yüksek AI’de bu daha da belirgindir; ilk çalıştırmada istenen çıktıyı tam olarak almak mümkün olmaz Yeniden üret düğmesine basmak veya promptu güncellemek önemlidir ama çok zaman alır ve hayal kırıklığı yaratabilir AI ürünlerinin ilk dalgası neredeyse hiç yinelemeye izin vermiyordu. Aynı promptu tekrar çalıştırmak tamamen farklı bir sonuç veriyordu Artık kullanıcıların baştan başlamadan mevcut çıktıyı alıp üzerinde iyileştirme yapabilmesi görünmeye başladı Örn. Midjourney’in varyasyon ve yakınlaştırma/uzaklaştırma araçları, Pika’nın belirli bölge düzeltme özelliği Platform içi Refinement (İnce Ayar) Akıllı düzenlemenin bir diğer kritik unsuru da refinement’dir Parlatma işinin son %10’u çoğu zaman “iyi” olanla “harika” olan arasındaki farkı yaratır Ancak (1) iyileştirilecek noktayı bulmak ve (2) başka bir yere geçmeden iyileştirmek çoğu zaman oldukça zordur AI iş akışı ürünleri kullanıcıya geliştirebileceği alanları belirleyip bunların otomatik geliştirilmesine yardımcı olur Apple Photos’taki “otomatik retuş”a benzer ama her şey için geçerli olabilecek şekilde düşünebilirsiniz Örn. Krea’nın upscaling özelliği, ElevenLabs’in sesli kitap iş akışı Yeniden karıştırılabilen ve dönüştürülebilir çıktı Her içerik, başka bir yineleme için potansiyel bir “başlangıç noktası” olabilir Midjourney/ChatGPT’de birinin promptunu kopyalayıp düzenlediyseniz, işte bu noktada zaten yerinizde olursunuz Bu esnekliği iyi kullanan platformlar daha güçlü ve daha “tutkulu” ürünler yaratabilir İlk üreticiler için videoyu blog yazısına dönüştürmek ya da metin kılavuzunu kullanım animasyonuna çevirmek, farklı mecralarda çalışabilme anlamına geldiği için büyük değer taşır Örn. Gamma yayın platformunun temel özelliği: prompt veya yüklenen dosyadan deck, belge veya web sayfası üretmek ve gerekirse biçimi dönüştürmek Böyle ürünleri kullanarak iş akışını başkalarının da yeniden kullanabilmesi için açmak da mümkündür Bu bir dizi prompt veya model kombinasyonu olabilir; ayrıca teknik olarak daha az yetkin bir kullanıcının çıktı ve estetiği taklit edebileceği bir “kopyala” butonu olabilir Örn. profesyonel fotoğrafçılar için bir düzenleme platformu olan Imagen AI: Her fotoğrafçının kendi stiline göre modeli eğiterek toplu düzenleme yapmayı kolaylaştırır Ayrıca kullanıcılar, platformda profillerini paylaşan sektörün en iyi fotoğrafçılarının stiliyle de düzenleme yapabilir Prosumer ürünleri nasıl evrilecek? Geleceğin prosumer araçları henüz ilk aşamada Mevcut araçların temel içerik üretme fonksiyonu nihayet anlamlı iş akışları ekleyebilecek kadar güçlü olsa da çoğu ürün hâlâ sadece tek bir içerik türüne odaklanıyor ve özellikleri oldukça sınırlı Beklenen ürünler: Farklı içerik modlarını birleştiren düzenleme araçları Video en iyi örnek olabilir Bugün AI ile kısa film üretmek için önce Pika ya da Runway gibi ürünlerde birden fazla klip oluşturulup sonra düzenleme veya ses miksajı için Capcut veya Kapwing’e geçilir Tüm bu süreci tek bir platformda yapmak mümkün olsa nasıl olurdu? Bir sonraki nesil ürünlerin bir kısmı, daha fazla iş akışı işlevi ekleyerek, kendi modelini eğiterek, açık kaynaklı modelleri kullanarak veya diğer oyuncularla ortaklık kurarak farklı içerik üretimine yayılacaktır Ayrıca kullanıcıların farklı modelleri “eklentileştirebildiği” yeni bağımsız AI Native editörlerin çıkması da olası Farklı etkileşim modlarını kullanan ürünler Metin promptu AI ürünleriyle iletişim kurmanın her zaman en etkili yolu değildir İnsanla beyin fırtınası yaptığınız bir partnerde olduğu gibi ses, eskiz ve görsel paylaşımıyla da çalışıp, üretim araçlarıyla birlikte kullanabileceğimize inanıyoruz Özellikle, kullanıcının daha karmaşık ve nüanslı düşüncelerini paylaşabilmesi için (veya metinle zorlandığı anlarda) ses formatına güçlü beklenti var Sesli notu e-posta, blog yazısı veya tweete dönüştüren Oasis, TalkNotes, AudioPen gibi ürünler şimdiden ortaya çıkmaya başladı İleride daha fazla iş akışı ürününde ses ve video girdi kaynağı olarak kullanılacak ve kullanıcıların işleri nasıl ve ne zaman yaptığını değiştirecek İnsan ve AI tarafından üretilen içeriği eşit ölçüde ele alan ürünler İnsan ve AI içeriğini birlikte kullanmaya olanak sağlayan araçlar arzu edilir; bugün ürünlerin çoğu bunlardan birine odaklanıyor Örneğin, gerçek fotoğraf iyileştirmede iyi olup AI görselleriyle hiçbir şey yapamayan ürünler vardır Ya da yeni video üretebilen ancak iPhone’dan klipleri düzeltme ya da stili değiştirme yapamayan ürünler vardır İleride çoğu profesyonel içerik üreticisinin AI ve insan tarafından üretilen içerikleri harmanlayarak çalışacağını bekliyoruz Bu kullanıcıların ürünleri her iki içerik türünü de kabul edip daha kolay birleştirebilmelidir Runway’in düzenleme aracı bunu iyi örnekliyor Kendi oluşturduğu modelden klip ve görselleri alıp gerçek varlıkları yükleyerek aynı timeline’da kullanma Sonra inpainting ve green screen gibi şirketin “sihirli araçları” hem gerçek hem AI içeriğine uygulanabiliyor Burada odaklandığımız içerik iş akışı ürünleri, prosumer yazılımının geleceğini şekillendiren önemli bileşenlerden yalnızca biridir Yakında ikinci kritik bileşen olan üretkenlik araçlarını da, AI çağında da yeniden canlanabileceğine inandığımız şekilde, daha ayrıntılı inceleyeceğiz

(a16z.com)

9 puan yazan xguru 2024-02-19 | 2 yorum | WhatsApp'ta paylaş

İş için kullanılan yazılımları gerçekten beğenen insanlar neredeyse hiç yok
- En iyi ürünler bile gerçek işte uygulanınca çoğu zaman yeterince esnek veya yeterince sofistike değildir; öğrenme eğrisi dik ve erişimleri zordur
Üretken yapay zeka, iş akışlarını tamamen yeniden icat etme fırsatı sunar ve en baştan tamamen yeni ürünler inşa etmeyi mümkün kılar
AI Native iş akışları, kullanıcıların mevcut görevlerini daha verimli yapmasına yardımcı olur
Bu tür platformlar, kullanıcının düşük seviyeli işleri bir AI yardımcıya devredip yüksek seviyeli düşünmeye daha fazla zaman ayırmasına olanak tanır
Herkesin programcı, yapımcı, tasarımcı veya müzisyen olabilmesi için yeni teknik ve estetik yeteneklerin kilidini açmaya yardımcı olur
- Yaratıcılık ile teknik beceri arasındaki boşluk daralır
- AI tabanlı bir iş akışıyla, “uzman seviyesinde ama tüketici dostu” ürünleri kullanan herkes bir sonraki nesil “prosumer” olabilir
- (Prosumer: üretici ve tüketici rollerini aynı anda üstlenen kişi. Alvin Toffler’ın “Üçüncü Dalga” adlı eserinde kullandığı bir terim.)

GenAI Native prosumer ürünleri nasıl olur?

Tüm GenAI Native iş akışı ürünlerinin ortak bir özelliği, “en son modeli erişilebilir ve etkili bir arayüze dönüştürmesi”dir
Kullanıcılar, ürünün arkasındaki altyapıyla uğraşmaktan çok, ürünün nasıl yardımcı olduğuyla ilgilenir
GenAI ile sağlanan teknik sıçramalar şaşırtıcı olsa da başarılı ürünler hâlâ kullanıcıyı ve onun sorunlarını derinlemesine anlamaya dayanır
Başarılı ürünler:
- Kullanıcının acı noktalarını derinlemesine anlar
- AI ile hangi alanların soyutlanabileceğini
- Onay gerektiren karar noktalarının neresi olduğunu
- En büyük etkiyi yaratacak “kaldıraç noktalarının” nereler olduğunu hedef alır

GenAI Native prosumer ürünlerinin ana özellikleri

“Boş sayfa” sorununu çözen üretim araçları
- Doğal dil promptundan medya üreterek ilk başlangıcı kolaylaştırır
- Özel bir modelle çalıştırılabilir veya birden fazla modeli birlikte kullanabilirsiniz
- Örn. Vizcom’ın render aracı, Durable’in web sitesi oluşturucusu
Çok modlu (ve multimedya) kombinasyon
- Birçok yaratıcı projede iki veya daha fazla içerik türüne ihtiyaç vardır: görsel ve metin, müzik ve video, animasyon ve sesli anlatım gibi
- Ancak bugün tek bir model bu tür tüm varlıkları üretemiyor
- Bu, kullanıcının tek bir yerde farklı içerik türlerini üretip geliştirebildiği ve bir araya getirebildiği bir iş akışı ürünü için fırsat yaratıyor
- Örn. HeyGen avatarları (kendi avatarlarını ElevenLabs TTS ile birleştirerek gerçekçi şekilde konuşan avatarlar üretir)
Daha fazla yinelemeye izin veren akıllı editör
- “Tek seferde alınan” sonuçlar neredeyse yoktur
- Özellikle rastgeleliği yüksek AI’de bu daha da belirgindir; ilk çalıştırmada istenen çıktıyı tam olarak almak mümkün olmaz
- Yeniden üret düğmesine basmak veya promptu güncellemek önemlidir ama çok zaman alır ve hayal kırıklığı yaratabilir
- AI ürünlerinin ilk dalgası neredeyse hiç yinelemeye izin vermiyordu. Aynı promptu tekrar çalıştırmak tamamen farklı bir sonuç veriyordu
- Artık kullanıcıların baştan başlamadan mevcut çıktıyı alıp üzerinde iyileştirme yapabilmesi görünmeye başladı
- Örn. Midjourney’in varyasyon ve yakınlaştırma/uzaklaştırma araçları, Pika’nın belirli bölge düzeltme özelliği
Platform içi Refinement (İnce Ayar)
- Akıllı düzenlemenin bir diğer kritik unsuru da refinement’dir
- Parlatma işinin son %10’u çoğu zaman “iyi” olanla “harika” olan arasındaki farkı yaratır
- Ancak (1) iyileştirilecek noktayı bulmak ve (2) başka bir yere geçmeden iyileştirmek çoğu zaman oldukça zordur
- AI iş akışı ürünleri kullanıcıya geliştirebileceği alanları belirleyip bunların otomatik geliştirilmesine yardımcı olur
- Apple Photos’taki “otomatik retuş”a benzer ama her şey için geçerli olabilecek şekilde düşünebilirsiniz
- Örn. Krea’nın upscaling özelliği, ElevenLabs’in sesli kitap iş akışı
Yeniden karıştırılabilen ve dönüştürülebilir çıktı
- Her içerik, başka bir yineleme için potansiyel bir “başlangıç noktası” olabilir
- Midjourney/ChatGPT’de birinin promptunu kopyalayıp düzenlediyseniz, işte bu noktada zaten yerinizde olursunuz
- Bu esnekliği iyi kullanan platformlar daha güçlü ve daha “tutkulu” ürünler yaratabilir
- İlk üreticiler için videoyu blog yazısına dönüştürmek ya da metin kılavuzunu kullanım animasyonuna çevirmek, farklı mecralarda çalışabilme anlamına geldiği için büyük değer taşır
- Örn. Gamma yayın platformunun temel özelliği: prompt veya yüklenen dosyadan deck, belge veya web sayfası üretmek ve gerekirse biçimi dönüştürmek
- Böyle ürünleri kullanarak iş akışını başkalarının da yeniden kullanabilmesi için açmak da mümkündür
  - Bu bir dizi prompt veya model kombinasyonu olabilir; ayrıca teknik olarak daha az yetkin bir kullanıcının çıktı ve estetiği taklit edebileceği bir “kopyala” butonu olabilir
- Örn. profesyonel fotoğrafçılar için bir düzenleme platformu olan Imagen AI:
  - Her fotoğrafçının kendi stiline göre modeli eğiterek toplu düzenleme yapmayı kolaylaştırır
  - Ayrıca kullanıcılar, platformda profillerini paylaşan sektörün en iyi fotoğrafçılarının stiliyle de düzenleme yapabilir

Prosumer ürünleri nasıl evrilecek?

Geleceğin prosumer araçları henüz ilk aşamada
Mevcut araçların temel içerik üretme fonksiyonu nihayet anlamlı iş akışları ekleyebilecek kadar güçlü olsa da çoğu ürün hâlâ sadece tek bir içerik türüne odaklanıyor ve özellikleri oldukça sınırlı
Beklenen ürünler:
- Farklı içerik modlarını birleştiren düzenleme araçları
  - Video en iyi örnek olabilir
  - Bugün AI ile kısa film üretmek için önce Pika ya da Runway gibi ürünlerde birden fazla klip oluşturulup sonra düzenleme veya ses miksajı için Capcut veya Kapwing’e geçilir
  - Tüm bu süreci tek bir platformda yapmak mümkün olsa nasıl olurdu?
  - Bir sonraki nesil ürünlerin bir kısmı, daha fazla iş akışı işlevi ekleyerek, kendi modelini eğiterek, açık kaynaklı modelleri kullanarak veya diğer oyuncularla ortaklık kurarak farklı içerik üretimine yayılacaktır
  - Ayrıca kullanıcıların farklı modelleri “eklentileştirebildiği” yeni bağımsız AI Native editörlerin çıkması da olası
- Farklı etkileşim modlarını kullanan ürünler
  - Metin promptu AI ürünleriyle iletişim kurmanın her zaman en etkili yolu değildir
  - İnsanla beyin fırtınası yaptığınız bir partnerde olduğu gibi ses, eskiz ve görsel paylaşımıyla da çalışıp, üretim araçlarıyla birlikte kullanabileceğimize inanıyoruz
  - Özellikle, kullanıcının daha karmaşık ve nüanslı düşüncelerini paylaşabilmesi için (veya metinle zorlandığı anlarda) ses formatına güçlü beklenti var
  - Sesli notu e-posta, blog yazısı veya tweete dönüştüren Oasis, TalkNotes, AudioPen gibi ürünler şimdiden ortaya çıkmaya başladı
  - İleride daha fazla iş akışı ürününde ses ve video girdi kaynağı olarak kullanılacak ve kullanıcıların işleri nasıl ve ne zaman yaptığını değiştirecek
- İnsan ve AI tarafından üretilen içeriği eşit ölçüde ele alan ürünler
  - İnsan ve AI içeriğini birlikte kullanmaya olanak sağlayan araçlar arzu edilir; bugün ürünlerin çoğu bunlardan birine odaklanıyor
  - Örneğin, gerçek fotoğraf iyileştirmede iyi olup AI görselleriyle hiçbir şey yapamayan ürünler vardır
  - Ya da yeni video üretebilen ancak iPhone’dan klipleri düzeltme ya da stili değiştirme yapamayan ürünler vardır
  - İleride çoğu profesyonel içerik üreticisinin AI ve insan tarafından üretilen içerikleri harmanlayarak çalışacağını bekliyoruz
  - Bu kullanıcıların ürünleri her iki içerik türünü de kabul edip daha kolay birleştirebilmelidir
  - Runway’in düzenleme aracı bunu iyi örnekliyor
    - Kendi oluşturduğu modelden klip ve görselleri alıp gerçek varlıkları yükleyerek aynı timeline’da kullanma
    - Sonra inpainting ve green screen gibi şirketin “sihirli araçları” hem gerçek hem AI içeriğine uygulanabiliyor
Burada odaklandığımız içerik iş akışı ürünleri, prosumer yazılımının geleceğini şekillendiren önemli bileşenlerden yalnızca biridir
Yakında ikinci kritik bileşen olan üretkenlik araçlarını da, AI çağında da yeniden canlanabileceğine inandığımız şekilde, daha ayrıntılı inceleyeceğiz

2 yorum

savvykang 2024-02-19

AI prosumer ürünlerinde ayrıştırıcı özellik olarak iş akışı kombinasyonları öneriliyor; bu yaklaşımın, mevcut düşük kodlu (low-code) platformlarının sınırlarıyla aynı özü paylaştığını düşünüyorum.

Uzman personele verilen her görev, low-code ile kontrol edilebilecek düzeyde makul bir karmaşıklığa sahip değildir; bazen işin kendisinin karmaşıklığı o kadar yüksektir ki, low-code platformu ile çözmeye çalışmaktan ziyade, uzman programlama becerileriyle karmaşıklığı yönetmek daha doğru olabilir. Programlamayı bir elektronik devre montajına benzetirsek, low-code çözümü breadboard’a denktir. Breadboard ile bir süre çalışan bir elektronik devreyi çeşitli şekillerde bir araya getirip prototip oluşturabilirsiniz; ancak breadboard ile güvenilirlik gerektiren bir entegre devre üretmek mümkün değildir.