Yapay zeka çağının "atsız arabası"

(koomen.dev)

21 puan yazan GN⁺ 2025-04-24 | 2 yorum | WhatsApp'ta paylaş

Yapay zekayla yazılım üretmek eğlenceli ve verimliyken, çoğu yapay zeka uygulaması mevcut yaklaşımı taklit eden "atsız araba (horseless carriage)" gibi verimsiz kalıyor
Gmail’in yapay zeka e-posta yardımcısı, aşırı resmî çıktılar üretiyor ve kullanıcıya özel bir deneyim sunamıyor
Gerçekten faydalı yapay zeka uygulamaları, kullanıcıların System Prompt üzerinde değişiklik yapmasına izin vererek kişiselleştirilmiş ajanlar oluşturabilmesini sağlamalı
Yapay zeka çağındaki ideal uygulama, mevcut programları taklit eden değil; kullanıcının tekrar eden işlerini azaltan ve otomasyonla gerçek üretkenliği artıran AI-native yazılım olmalı
Yapay zekanın gerçek potansiyeli, kullanıcıların önemli ve yaratıcı işlere odaklanabilmesi için günlük işleri otomatikleştirmesinde yatıyor

Yapay zekayla yapılmış uygulamalardansa, yapay zekayı kullanarak yazılım üretmek neden daha keyifli?

Son dönemde ilginç bir şey fark ettim: çoğu yapay zeka tabanlı uygulamayı kullanmaktan ziyade, yapay zekayı kullanarak doğrudan yazılım üretmek daha keyifli ve daha verimli
Yapay zekayı geliştirme aracı olarak kullandığınızda, neredeyse hayal edebileceğiniz her şeyi hızla inşa edebiliyormuşsunuz gibi hissettiriyor
Buna karşılık birçok yapay zeka uygulaması, sadece üstüne yapay zeka eklenmiş ürünler gibi duruyor; pratikte faydası düşük ya da hatta kullanımı daha zahmetli olabiliyor

Yapay zeka çağının ‘atsız arabası’

Bugün birçok yapay zeka uygulaması özünde eski yazılım tasarım anlayışını aynen sürdürüyor
Bu da LLM gibi güçlü modellerin gereksiz yere kısıtlandığı bir yapı ortaya çıkarıyor
Bunu, yapay zeka çağının "atsız arabaları (horseless carriages)" olarak tanımlıyorum
- Bu, otomobillerin ilk tasarımlarının at arabası biçimini koruduğu ve bu yüzden verimsiz kaldığı tarihsel örneğe benziyor

Kötü tasarlanmış yapay zeka uygulamasına örnek: Gmail’in yapay zeka asistanı

Gmail kısa süre önce, Gemini modelini kullanarak e-posta taslağı oluşturan bir özelliği kullanıma sundu
Örnekte kullanıcıdan (yazardan) patronuna göndereceği bir e-posta taslağı isteniyor

Prompt: Patrona gönderilecek bir e-posta taslağı iste

Gemini’nin ürettiği taslak dilbilgisi açısından kusursuz olsa da, yazarın gerçekte yazacağı üslupla hiç örtüşmüyor
- Yazarın gerçek tarzı: "hey garry, my daughter woke up with the flu so I won't make it in today"
- Gemini’nin çıktısı ise aşırı resmî ve yapay
Sonuç olarak, e-postayı doğrudan yazmaktan daha fazla zaman alıyor
Yazar, bu özelliği "performansı düşük bir çalışanı yönetmek gibi" diye tanımlıyor
Milyonlarca Gmail kullanıcısı da benzer bir deneyim yaşamış olabilir ve bu yüzden yapay zekanın hâlâ e-posta yazmakta kötü olduğu gibi bir yanılgıya kapılabilir
Oysa sorun Gemini modelinin kendisinde değil, Gmail ekibinin uygulamayı tasarlama biçiminde

Daha iyi bir e-posta asistanı örneği

Gmail, e-posta asistanını aşağıdaki gibi tasarlasaydı çok daha kullanışlı olabilirdi

E-posta okuma ajanı örneği

Bu demo, e-posta yazmak yerine onları okuyup işleyerek çalışıyor
Kullanılan araçlar:
- labelEmail(label, color, priority) : e-postaya etiket atar
- archiveEmail() : e-postayı arşivler
- draftReply(body) : yanıt taslağı oluşturur
Gelen kutusundaki e-postalar şöyle sıralanıyor:
- TechCrunch Weekly
- Gustaf Alströmer - founder intro?
- HackerNews Digest
- The Verge Updates
- Garry Tan - reschedule
- ve toplam 12 adet
Her e-posta otomatik olarak sınıflandırılıyor ve önceliklendiriliyor; bazıları için otomatik yanıt taslağı oluşturuluyor ya da otomatik arşivleme yapılıyor
Her e-posta, kullanıcının tanımladığı System Prompt doğrultusunda ayrı ayrı işleniyor
Kullanıcı, System Prompt’u doğrudan düzenleyerek kendi etiketleme mantığını yansıtabiliyor

Bu yaklaşım çok daha güçlü, sezgisel ve üretken; peki Gmail ekibi neden böyle bir tasarım yapmadı?

Sorunun özü: "tipik ve tekdüze ton"
- Gmail’in tasarımından kaynaklanan en büyük sorunlardan biri, genel geçer ve kişiliksiz bir üslup

AI Slop: resmî ve tuhaf çıktılar

Gmail’de Gemini’nin ürettiği e-posta taslakları fazlasıyla uzun, resmî ve yazarın tarzından tamamen uzak
Bu tür çıktılar bazen oltalama e-postası gibi bile görünebilir
Çoğu LLM kullanıcısı buna benzer bir deneyim yaşamıştır ve bundan kaçınmak için doğal olarak prompt hacking denen stratejiye başvurur
- Örnek prompt:
  
  "let my boss garry know that my daughter woke up with the flu and that I won't be able to come in to the office today. Use no more than one line for the entire email body. Make it friendly but really concise. Don't worry about punctuation or capitalization. Sign off with “Pete” or “pete” and not “Best Regards, Pete” and certainly not “Love, Pete”"
Çıktının kalitesi artar ama prompt gereksiz yere uzar ve her seferinde aynı süreci tekrar etmek gerektiği için verimsizdir
Bu sorunun basit çözümü: kullanıcıya System Prompt’u düzenleme yetkisi vermek

System Prompt ile User Prompt ayrımı

LLM özünde, verilen kelimelere (prompt’a) bakarak bir sonraki kelimeyi tahmin eden bir sistemdir
Tüm giriş ve çıkışlar metin tabanlıdır
- Metin sadeleştirme amacıyla kullanılıyor; gerçekte ses ve video da giriş/çıkış olabilir
OpenAI, Anthropic ve diğerleri bunu basitleştirmek için prompt’u System Prompt ve User Prompt olarak ayıran bir yapı benimsedi
- System Prompt: ajanın karakterini ve davranış biçimini tanımlar (fonksiyona karşılık gelir)
- User Prompt: kullanıcıdan gelen belirli istek ya da soru (girdi değerine karşılık gelir)
- Modelin yanıtı: çıktı değeri

Örnek:

User Prompt: "Let my boss Garry know that my daughter woke up with the flu this morning and that I won't be able to come in to the office today."

Gmail’in tahmini System Prompt’u:

"You are a helpful email-writing assistant responsible for writing emails on behalf of a Gmail user. Follow the user’s instructions and use a formal, businessy tone and correct punctuation so that it’s obvious the user is smart and serious."

Sorun şu ki Gmail bu System Prompt’u göstermiyor ve kullanıcıya düzenleme izni de vermiyor

Pete’in özel System Prompt’u

Gmail, tek tip bir System Prompt yerine kullanıcıya bunu doğrudan yazma hakkı verseydi, muhtemelen şöyle olurdu:

You're Pete, a 43 year old husband, father, programmer, and YC Partner.
You're very busy and so is everyone you correspond with, so you do your best to keep your emails as short as possible and to the point. You avoid all unnecessary words and you often omit punctuation or leave misspellings unaddressed because it's not a big deal and you'd rather save the time. You prefer one-line emails.
Do your best to be kind, and don't be so informal that it comes across as rude.
GPT’ye bu tür bir System Prompt ile e-posta yazdırıldığında şu sonuca ulaşılabiliyor:

Garry, my daughter has the flu. I can't come in today.
Bu sonuç kısa, kişisel ve kullanıcının gerçek tarzına uygun
En büyük avantajı ise bu System Prompt’un yeniden kullanılabilir olması; böylece sonraki tüm e-postalara da aynı stil uygulanabilir

Kullanıcı prompt’u yazmanın keyfi ve potansiyeli

LLM’ye benim gibi düşünmeyi öğretip sonucu anında görmek çok sezgisel ve eğlenceli bir deneyim
Kullanıcılara, kendi üsluplarını tanımlayan bir “kişisel System Prompt” yazmayı tavsiye ediyorum
- Örnek User Prompt’lar:
  
  "Let my wife know I'll be home from work late and will miss dinner"
  "Write an email to comcast customer service explaining that they accidentally double billed you last month."
İyi bir sonuç çıkıyorsa açıklama yeterince nettir; çıkmıyorsa içeriği geliştirip tekrar edersiniz
Bu, insanlara bir şey öğretmekten bile daha kolay olabilir; çünkü daha hızlı ve daha dürüst bir geri bildirim döngüsü sunar

Çoğu yapay zeka uygulaması neden System Prompt’u göstermiyor?

Nisan 2025 itibarıyla çoğu yapay zeka uygulaması System Prompt’u bilerek gizli tutuyor
- İlgili bağlantı: X üzerinde kasten kapalı tasarımdan söz eden paylaşım
Yazar bunu kullanıcının yetkisini ve bireyselliğini elinden almak olarak görüyor; daha iyi sonuçlar ve daha iyi bir kullanım deneyimi için System Prompt’un mutlaka kullanıcıya açık olması gerektiğini savunuyor

Horseless Carriages: yeni teknolojiyi eski kalıplarla uygulamak

Yeni bir teknoloji ortaya çıktığında, ilk araçlar çoğu zaman eski yöntemleri doğrudan taklit ederek başarısız olur
“Horseless Carriage”, ilk otomobillerin atlı arabanın tasarımını aynen sürdürdüğü örnekleri ifade eder
- Örnek: Trevithick’in 1803 tarihli buharlı araba tasarımı
- O dönemde yenilikçi görünse de bugün baktığımızda temel yapısının otomobile uygun olmadığı açık
O dönemde insanlar bu araçlara bakıp “attan iyisi yok” diye düşünmüş olabilir; otomobil gerçekten olgunlaşana kadar bu yargı anlaşılırdı
Yazara göre bugünkü yapay zeka uygulamaları da benzer bir aşamada
- Örneğin Gmail’deki Gemini özelliği gibi, eski UX tasarımına yapay zekayı sonradan ekleyen yaklaşımlar
Eski düşünce tarzı “atı motorla değiştirelim” seviyesinde kalmıştı
- Bugün de birçok yapay zeka uygulaması benzer şekilde “mevcut uygulamaya biraz AI ekleyelim” yaklaşımında

Old World Thinking: geleneksel yazılım tasarımının sınırları

Geçmişte bilgisayarları kullanmanın yalnızca iki yolu vardı:
1. Doğrudan program yazmak
2. Başkasının yazdığı programı kullanmak
Programlama zor olduğu için çoğu insan ikinci yolu seçti
Bu yüzden yazılım endüstrisi, geliştiriciyle kullanıcı rollerini net biçimde ayıran bir yapıda büyüdü
- Geliştirici: yazılımın genel davranışını belirler
- Kullanıcı: belirli girdileri sağlar
LLM’deki System/User Prompt ayrımı da bu yapıyı yansıtıyor
- System Prompt = geliştiricinin alanı
- User Prompt = kullanıcının alanı
Oysa e-posta son derece kişisel bir alan ve yapay zeka kullanıcı adına e-posta yazacaksa kişinin kendi üslubunu yansıtması gerekir
Eski yapıda kullanıcı programı bizzat yazmadıkça kişiselleştirme zordu
Ama LLM çağında kullanıcı System Prompt’u doğrudan yazabiliyor
- Yani artık programlama yapmadan da yapay zekanın davranışını tasarlamak mümkün

Kullanıcının olanı kullanıcıya geri verelim

Yazarın savı şu: LLM benim yerime hareket edecekse, nasıl hareket edeceğini (System Prompt’u) ben öğretmeliyim
Elbette herkes prompt’u sıfırdan yazmak istemeyebilir
- Gmail, kullanıcının e-posta geçmişine bakarak varsayılan bir System Prompt oluşturabilir
- Önemli olan, bu prompt’un kullanıcıya gösterilmesi ve düzenlenebilir olmasıdır
“Prompt yazmayı bilmeyenler ne yapacak?” → başta zorlanabilirler ama çoğu insan bunu hızla öğrenir
- ChatGPT’nin başarısı bunu kanıtlıyor
Peki muhasebe, hukuk gibi kişisel olmayan alanlarda durum ne olacak?
- Bu alanlarda System Prompt’un uzmanlarca yazılması doğrudur; ama uzmanlar da bunu kendi bağlamlarına göre uyarlamak ister
Örnek: YC’nin muhasebe ekibi, YC’ye özgü yöntemler, kurallar ve yazılım kombinasyonları kullanır
- Genel amaçlı bir muhasebe AI ajanı, YC’de hiç işe yaramaz
Neredeyse her muhasebe ekibinin kendine özgü çalışma biçimi vardır; bu yüzden Excel gibi genel amaçlı araçları tercih ederler
Sonuç: çoğu yapay zeka uygulamasında System Prompt kullanıcı tarafından yazılmalı ve sürdürülmelidir

Yapay zeka uygulamaları hazır bir ajan değil, kullanıcının kendi ajanını oluşturmasını sağlayan araçlar (agent builder) olmalı

Geliştiricinin olanı geliştiriciye geri verelim

Peki geliştiricinin rolü ne olacak?
- Belirli bir alana (ör. e-posta, muhasebe defteri vb.) uygun agent builder arayüzleri tasarlamak
- Kullanıcının prompt’u sıfırdan yazmak zorunda kalmaması için şablonlar ve prompt oluşturma yardımcıları sunmak
- Kullanıcının ajanın sonuçlarını kontrol edip düzeltebileceği geri bildirim döngüsü arayüzleri sağlamak
Geliştirici ayrıca ajan araçları (agent tools) da sunar
- E-posta taslağı gönderme, otomatik gönderim, e-posta arama, harici API bağlantıları gibi
Bu araçlar, ajanın davranış alanını ve güvenliğini kontrol etmenin yolu olur
- Davranışı metin prompt’larıyla kısıtlamak yerine kodla yazılmış araçlarla sınırlandırmak çok daha güvenli ve nettir

Gelecekte “prompt injection” korkusuyla düşünmek bile gülünç gelebilir
→ Metin yapısında sınırlar kurmaya çalışmak, zayıf bir soyutlamanın işaretidir
→ Tüm sistemi kullanıcı alanı olarak görüp güçlü araçlar ve arayüzlerle yönetmek gerekir

E-postayı "okuyan" ajanın gerçek değeri

Az önce de söylendiği gibi, daha iyi bir System Prompt bile e-posta taslağını sıfırdan yazarken büyük bir zaman kazancı sağlamaz
Bunun nedeni, yazarın yazdığı e-postaların zaten çok kısa ve öz olması
- Yani kullanıcı prompt’unun uzunluğu ≒ e-posta gövdesinin uzunluğu
Yazar, birçok kez deney yapmış ve üretken yapay zekanın metin üretmekten çok metin dönüştürmede daha güçlü olduğunu gözlemlemiş
Bu yüzden LLM kullanmanın asıl amacı, e-posta "yazmak" değil "okuyup işlemek" olmalı

E-posta okuma ajanı demosu (`gpt-4o-mini` tabanlı)

Kullanılabilen araçlar:
- labelEmail(label, color, priority) : e-posta etiketleme
- archiveEmail() : e-postayı otomatik arşivleme
- draftReply(body) : otomatik yanıt taslağı oluşturma
Bu ajan her e-postayı okuyup:
- spam’i iyi ayıklıyor
- önem derecesine göre etiketliyor
- özetliyor veya yanıt taslağı yazıyor
- gereksiz postaları otomatik arşivliyor
Hatta birkaç araç daha eklenirse şunlar da mümkün:
- abonelikten çıkma
- takvime ekleme
- faturaları otomatik ödeme
İşte AI-native e-posta istemcisinin yapması gereken tam olarak bu:
→ sıkıcı ve tekrar eden işleri otomatikleştirerek kullanıcının zamanını kurtarmak
- Superhuman, Zero gibi bazı e-posta istemcileri şimdiden bu yönde ilerliyor

AI-native yazılım ne anlama geliyor?

Yapay zekanın gerçek killer app’i, “benim yapmak istemediğim işleri” bilgisayarın benim yerime yapmasıdır
Yazarın bu yazıya demo eklemesinin nedeni de, LLM’lerin aslında bu işleri şimdiden yeterince iyi yapabildiğini göstermek
Sorun yapay zeka performansında değil, uygulama tasarımında

Gmail ekibinin yaptığı şey, "AI eklenmiş bir e-posta uygulaması"
→ kullanıcı için bir otomasyon aracı olmak yerine, insan merkezli arayüze yapay zekayı zorla sıkıştıran bir yapı

Buna karşılık, AI-native uygulama şöyle olmalı:
- Belirli bir alanda kullanıcının kaldıraç etkisini en üst düzeye çıkarmalı
- Örn: yapay zeka e-posta istemcisi, e-posta için harcanan zamanı en aza indirmeli
- Örn: yapay zeka muhasebe yazılımı, muhasebe işleme süresini en aza indirmeli

Yapay zeka çağına dair beklenti

Tekrarlayan ve sıkıcı işlerin tamamını ajanlar üstlenir
Kullanıcı önemli işlere odaklanabilir
Kişi iyi olduğu ve yapmaktan hoşlandığı şeylere daha fazla zaman ayırabilir

Yazarın yapay zekanın geleceği konusunda heyecan duymasının nedeni tam da bu
Daha iyi araçlar, zamanın daha iyi kullanımı, daha yüksek üretkenlik

2 yorum

crawler 2025-04-24

Gerçekten kullanışlı yapay zeka uygulamaları, kullanıcının System Prompt’u düzenleyebilmesine izin verip kişiselleştirilmiş bir ajan oluşturmasını sağlamalı.

Elbette bu özellikleri yapan geliştiriciler de bunu biliyordur, ama jailbreak olduğu sürece bu kolay değil.
System Prompt’u değiştirilemesin diye sabitleseniz bile jailbreak mümkünken, System Prompt değişikliğini açmak imkansız bir iş.
Ayrıca insanlar bunu asıl işlevinden farklı amaçlarla ucuza kullanabilir de.

GN⁺ 2025-04-24

Hacker News görüşleri

Mesajları kişisel olarak yazmak için dil modelleri kullanma konusunda temkinli yaklaşılıyor. Bunun, bireysel deneyim ya da bilginin özgüllüğünden yoksun olduğu düşünülüyor
- Gemini gibi modeller kişinin geçmiş teknik açıklamalarını ya da işinin ayrıntılarını anlayabilse bunu kabul etmek daha kolay olurdu
- Ancak çoğu durumda, 1970'lerde bir sekreterin yazabileceği bir e-postadan farkı yok
- Kişisel mesaj yazarken özet gereksiz ve kısa bir mesajı uzatmak anlamsız bir gürültü üretiyor
- Mesaj yazmak için yapay zeka kullanmak, bilginin iletimiyle ilgili sınırları belirsizleştiriyor
Yapay zeka özelliklerinin %90'ının işe yaramaz ve pahalı olduğu hissediliyor
- Kodlama odaklı yapay zeka özellikleri dışında faydalı yapay zeka özellikleri bulmak zor
- Gmail ya da iMessage otomatik tamamlama özellikleri LLM'lerden önce de vardı
- Bir e-postayı daha profesyonel göstermek için Gmail özelliği hiç kullanılmadı
Gemini, kişisel asistan gibi davranıp kullanıcı adına e-posta gönderiyor
- Kişisel mesajları yapay zekaya yazdırmak karşı tarafı rahatsız edebilir
Dil bilgisi ve yazıma dikkat etmeyen insanlarla iletişim kurmak rahatsız edici bulunuyor
- Yazımı kötü olan insanlar suçlanmıyor ama yapabilecek durumda olup da umursamamak karşı tarafa karşı ilgisizliği gösteriyor
LLM ile bağlı etkileşimli widget eğlenceli bulundu
- Gmail'deki "e-postayı özetle" düğmesi gereksiz hissettiriyor
Birçok kişi yapay zekanın öngörülebilir bir tarzda yazdığını düşünüyor ama gerçekte öyle değil
- Bu yalnızca metin için değil, görsel üretimi için de geçerli olabilir
- Yapay zekanın gerçekten bir insan gibi konuşabildiği fark edildiğinde insanlar rahatsız olabilir
Etkileşimli demonun gerçek zamanlı ilerlemesi beğenildi
- E-posta stilini analiz ederek taslak hazırlayabiliyor
- Bu, yapay zekanın e-postayı otomatik yazdığı ve kullanıcının onayladığı bir yapıya evrilebilir
Yapay zeka kullanıcının ne istediğini bilemez ve hedefleri açıkça ifade etmekte zorlanır
- Yapay zeka her şeyi hallederse kullanıcı derinlemesine düşünmez, bu da uzmanlığı ve problem çözme becerisini sınırlar
En faydalı yapay zeka özellikleri göze batmaz
- E-posta etiketleme asistanı buna iyi bir örnek
- "yeniden planlama" e-postalarını otomatik yorumlayıp takvim değişikliği önermesi kullanışlı
Yapay zekanın mesajları sizin yerinize yazmasını anlamlı bulmuyorlar
- Önemli mesajlarda doğrudan kendin yazmanın bir anlamı var; bu, canlı bir etkileşimin ifadesi