21 puan yazan GN⁺ 2025-04-24 | 2 yorum | WhatsApp'ta paylaş
  • Yapay zekayla yazılım üretmek eğlenceli ve verimliyken, çoğu yapay zeka uygulaması mevcut yaklaşımı taklit eden "atsız araba (horseless carriage)" gibi verimsiz kalıyor
  • Gmail’in yapay zeka e-posta yardımcısı, aşırı resmî çıktılar üretiyor ve kullanıcıya özel bir deneyim sunamıyor
  • Gerçekten faydalı yapay zeka uygulamaları, kullanıcıların System Prompt üzerinde değişiklik yapmasına izin vererek kişiselleştirilmiş ajanlar oluşturabilmesini sağlamalı
  • Yapay zeka çağındaki ideal uygulama, mevcut programları taklit eden değil; kullanıcının tekrar eden işlerini azaltan ve otomasyonla gerçek üretkenliği artıran AI-native yazılım olmalı
  • Yapay zekanın gerçek potansiyeli, kullanıcıların önemli ve yaratıcı işlere odaklanabilmesi için günlük işleri otomatikleştirmesinde yatıyor

Yapay zekayla yapılmış uygulamalardansa, yapay zekayı kullanarak yazılım üretmek neden daha keyifli?

  • Son dönemde ilginç bir şey fark ettim: çoğu yapay zeka tabanlı uygulamayı kullanmaktan ziyade, yapay zekayı kullanarak doğrudan yazılım üretmek daha keyifli ve daha verimli
  • Yapay zekayı geliştirme aracı olarak kullandığınızda, neredeyse hayal edebileceğiniz her şeyi hızla inşa edebiliyormuşsunuz gibi hissettiriyor
  • Buna karşılık birçok yapay zeka uygulaması, sadece üstüne yapay zeka eklenmiş ürünler gibi duruyor; pratikte faydası düşük ya da hatta kullanımı daha zahmetli olabiliyor

Yapay zeka çağının ‘atsız arabası’

  • Bugün birçok yapay zeka uygulaması özünde eski yazılım tasarım anlayışını aynen sürdürüyor
  • Bu da LLM gibi güçlü modellerin gereksiz yere kısıtlandığı bir yapı ortaya çıkarıyor
  • Bunu, yapay zeka çağının "atsız arabaları (horseless carriages)" olarak tanımlıyorum
    • Bu, otomobillerin ilk tasarımlarının at arabası biçimini koruduğu ve bu yüzden verimsiz kaldığı tarihsel örneğe benziyor

Kötü tasarlanmış yapay zeka uygulamasına örnek: Gmail’in yapay zeka asistanı

  • Gmail kısa süre önce, Gemini modelini kullanarak e-posta taslağı oluşturan bir özelliği kullanıma sundu
  • Örnekte kullanıcıdan (yazardan) patronuna göndereceği bir e-posta taslağı isteniyor

> Prompt: Patrona gönderilecek bir e-posta taslağı iste

  • Gemini’nin ürettiği taslak dilbilgisi açısından kusursuz olsa da, yazarın gerçekte yazacağı üslupla hiç örtüşmüyor
    • Yazarın gerçek tarzı: "hey garry, my daughter woke up with the flu so I won't make it in today"
    • Gemini’nin çıktısı ise aşırı resmî ve yapay
  • Sonuç olarak, e-postayı doğrudan yazmaktan daha fazla zaman alıyor
  • Yazar, bu özelliği "performansı düşük bir çalışanı yönetmek gibi" diye tanımlıyor
  • Milyonlarca Gmail kullanıcısı da benzer bir deneyim yaşamış olabilir ve bu yüzden yapay zekanın hâlâ e-posta yazmakta kötü olduğu gibi bir yanılgıya kapılabilir
  • Oysa sorun Gemini modelinin kendisinde değil, Gmail ekibinin uygulamayı tasarlama biçiminde

Daha iyi bir e-posta asistanı örneği

  • Gmail, e-posta asistanını aşağıdaki gibi tasarlasaydı çok daha kullanışlı olabilirdi

E-posta okuma ajanı örneği

  • Bu demo, e-posta yazmak yerine onları okuyup işleyerek çalışıyor

  • Kullanılan araçlar:

    • labelEmail(label, color, priority) : e-postaya etiket atar
    • archiveEmail() : e-postayı arşivler
    • draftReply(body) : yanıt taslağı oluşturur
  • Gelen kutusundaki e-postalar şöyle sıralanıyor:

    • TechCrunch Weekly
    • Gustaf Alströmer - founder intro?
    • HackerNews Digest
    • The Verge Updates
    • Garry Tan - reschedule
    • ve toplam 12 adet
  • Her e-posta otomatik olarak sınıflandırılıyor ve önceliklendiriliyor; bazıları için otomatik yanıt taslağı oluşturuluyor ya da otomatik arşivleme yapılıyor

  • Her e-posta, kullanıcının tanımladığı System Prompt doğrultusunda ayrı ayrı işleniyor

  • Kullanıcı, System Prompt’u doğrudan düzenleyerek kendi etiketleme mantığını yansıtabiliyor

> Bu yaklaşım çok daha güçlü, sezgisel ve üretken; peki Gmail ekibi neden böyle bir tasarım yapmadı?

  • Sorunun özü: "tipik ve tekdüze ton"
    • Gmail’in tasarımından kaynaklanan en büyük sorunlardan biri, genel geçer ve kişiliksiz bir üslup

AI Slop: resmî ve tuhaf çıktılar

  • Gmail’de Gemini’nin ürettiği e-posta taslakları fazlasıyla uzun, resmî ve yazarın tarzından tamamen uzak
  • Bu tür çıktılar bazen oltalama e-postası gibi bile görünebilir
  • Çoğu LLM kullanıcısı buna benzer bir deneyim yaşamıştır ve bundan kaçınmak için doğal olarak prompt hacking denen stratejiye başvurur
    • Örnek prompt:
      > "let my boss garry know that my daughter woke up with the flu and that I won't be able to come in to the office today. Use no more than one line for the entire email body. Make it friendly but really concise. Don't worry about punctuation or capitalization. Sign off with “Pete” or “pete” and not “Best Regards, Pete” and certainly not “Love, Pete”"
  • Çıktının kalitesi artar ama prompt gereksiz yere uzar ve her seferinde aynı süreci tekrar etmek gerektiği için verimsizdir
  • Bu sorunun basit çözümü: kullanıcıya System Prompt’u düzenleme yetkisi vermek

System Prompt ile User Prompt ayrımı

  • LLM özünde, verilen kelimelere (prompt’a) bakarak bir sonraki kelimeyi tahmin eden bir sistemdir
  • Tüm giriş ve çıkışlar metin tabanlıdır
    • Metin sadeleştirme amacıyla kullanılıyor; gerçekte ses ve video da giriş/çıkış olabilir
  • OpenAI, Anthropic ve diğerleri bunu basitleştirmek için prompt’u System Prompt ve User Prompt olarak ayıran bir yapı benimsedi
    • System Prompt: ajanın karakterini ve davranış biçimini tanımlar (fonksiyona karşılık gelir)
    • User Prompt: kullanıcıdan gelen belirli istek ya da soru (girdi değerine karşılık gelir)
    • Modelin yanıtı: çıktı değeri

> Örnek:
> - User Prompt: "Let my boss Garry know that my daughter woke up with the flu this morning and that I won't be able to come in to the office today."
> - Gmail’in tahmini System Prompt’u:
> - "You are a helpful email-writing assistant responsible for writing emails on behalf of a Gmail user. Follow the user’s instructions and use a formal, businessy tone and correct punctuation so that it’s obvious the user is smart and serious."

  • Sorun şu ki Gmail bu System Prompt’u göstermiyor ve kullanıcıya düzenleme izni de vermiyor

Pete’in özel System Prompt’u

  • Gmail, tek tip bir System Prompt yerine kullanıcıya bunu doğrudan yazma hakkı verseydi, muhtemelen şöyle olurdu:

    > You're Pete, a 43 year old husband, father, programmer, and YC Partner.
    > You're very busy and so is everyone you correspond with, so you do your best to keep your emails as short as possible and to the point. You avoid all unnecessary words and you often omit punctuation or leave misspellings unaddressed because it's not a big deal and you'd rather save the time. You prefer one-line emails.
    > Do your best to be kind, and don't be so informal that it comes across as rude.

  • GPT’ye bu tür bir System Prompt ile e-posta yazdırıldığında şu sonuca ulaşılabiliyor:

    > Garry, my daughter has the flu. I can't come in today.

  • Bu sonuç kısa, kişisel ve kullanıcının gerçek tarzına uygun

  • En büyük avantajı ise bu System Prompt’un yeniden kullanılabilir olması; böylece sonraki tüm e-postalara da aynı stil uygulanabilir

Kullanıcı prompt’u yazmanın keyfi ve potansiyeli

  • LLM’ye benim gibi düşünmeyi öğretip sonucu anında görmek çok sezgisel ve eğlenceli bir deneyim
  • Kullanıcılara, kendi üsluplarını tanımlayan bir “kişisel System Prompt” yazmayı tavsiye ediyorum
    • Örnek User Prompt’lar:
      > "Let my wife know I'll be home from work late and will miss dinner"
      > "Write an email to comcast customer service explaining that they accidentally double billed you last month."
  • İyi bir sonuç çıkıyorsa açıklama yeterince nettir; çıkmıyorsa içeriği geliştirip tekrar edersiniz
  • Bu, insanlara bir şey öğretmekten bile daha kolay olabilir; çünkü daha hızlı ve daha dürüst bir geri bildirim döngüsü sunar

Çoğu yapay zeka uygulaması neden System Prompt’u göstermiyor?

  • Nisan 2025 itibarıyla çoğu yapay zeka uygulaması System Prompt’u bilerek gizli tutuyor
  • Yazar bunu kullanıcının yetkisini ve bireyselliğini elinden almak olarak görüyor; daha iyi sonuçlar ve daha iyi bir kullanım deneyimi için System Prompt’un mutlaka kullanıcıya açık olması gerektiğini savunuyor

Horseless Carriages: yeni teknolojiyi eski kalıplarla uygulamak

  • Yeni bir teknoloji ortaya çıktığında, ilk araçlar çoğu zaman eski yöntemleri doğrudan taklit ederek başarısız olur
  • “Horseless Carriage”, ilk otomobillerin atlı arabanın tasarımını aynen sürdürdüğü örnekleri ifade eder
    • Örnek: Trevithick’in 1803 tarihli buharlı araba tasarımı
    • O dönemde yenilikçi görünse de bugün baktığımızda temel yapısının otomobile uygun olmadığı açık
  • O dönemde insanlar bu araçlara bakıp “attan iyisi yok” diye düşünmüş olabilir; otomobil gerçekten olgunlaşana kadar bu yargı anlaşılırdı
  • Yazara göre bugünkü yapay zeka uygulamaları da benzer bir aşamada
    • Örneğin Gmail’deki Gemini özelliği gibi, eski UX tasarımına yapay zekayı sonradan ekleyen yaklaşımlar
  • Eski düşünce tarzı “atı motorla değiştirelim” seviyesinde kalmıştı
    • Bugün de birçok yapay zeka uygulaması benzer şekilde “mevcut uygulamaya biraz AI ekleyelim” yaklaşımında

Old World Thinking: geleneksel yazılım tasarımının sınırları

  • Geçmişte bilgisayarları kullanmanın yalnızca iki yolu vardı:
    1. Doğrudan program yazmak
    2. Başkasının yazdığı programı kullanmak
  • Programlama zor olduğu için çoğu insan ikinci yolu seçti
  • Bu yüzden yazılım endüstrisi, geliştiriciyle kullanıcı rollerini net biçimde ayıran bir yapıda büyüdü
    • Geliştirici: yazılımın genel davranışını belirler
    • Kullanıcı: belirli girdileri sağlar
  • LLM’deki System/User Prompt ayrımı da bu yapıyı yansıtıyor
    • System Prompt = geliştiricinin alanı
    • User Prompt = kullanıcının alanı
  • Oysa e-posta son derece kişisel bir alan ve yapay zeka kullanıcı adına e-posta yazacaksa kişinin kendi üslubunu yansıtması gerekir
  • Eski yapıda kullanıcı programı bizzat yazmadıkça kişiselleştirme zordu
  • Ama LLM çağında kullanıcı System Prompt’u doğrudan yazabiliyor
    • Yani artık programlama yapmadan da yapay zekanın davranışını tasarlamak mümkün

Kullanıcının olanı kullanıcıya geri verelim

  • Yazarın savı şu: LLM benim yerime hareket edecekse, nasıl hareket edeceğini (System Prompt’u) ben öğretmeliyim
  • Elbette herkes prompt’u sıfırdan yazmak istemeyebilir
    • Gmail, kullanıcının e-posta geçmişine bakarak varsayılan bir System Prompt oluşturabilir
    • Önemli olan, bu prompt’un kullanıcıya gösterilmesi ve düzenlenebilir olmasıdır
  • “Prompt yazmayı bilmeyenler ne yapacak?” → başta zorlanabilirler ama çoğu insan bunu hızla öğrenir
    • ChatGPT’nin başarısı bunu kanıtlıyor
  • Peki muhasebe, hukuk gibi kişisel olmayan alanlarda durum ne olacak?
    • Bu alanlarda System Prompt’un uzmanlarca yazılması doğrudur; ama uzmanlar da bunu kendi bağlamlarına göre uyarlamak ister
  • Örnek: YC’nin muhasebe ekibi, YC’ye özgü yöntemler, kurallar ve yazılım kombinasyonları kullanır
    • Genel amaçlı bir muhasebe AI ajanı, YC’de hiç işe yaramaz
  • Neredeyse her muhasebe ekibinin kendine özgü çalışma biçimi vardır; bu yüzden Excel gibi genel amaçlı araçları tercih ederler
  • Sonuç: çoğu yapay zeka uygulamasında System Prompt kullanıcı tarafından yazılmalı ve sürdürülmelidir

> Yapay zeka uygulamaları hazır bir ajan değil, kullanıcının kendi ajanını oluşturmasını sağlayan araçlar (agent builder) olmalı

Geliştiricinin olanı geliştiriciye geri verelim

  • Peki geliştiricinin rolü ne olacak?
    • Belirli bir alana (ör. e-posta, muhasebe defteri vb.) uygun agent builder arayüzleri tasarlamak
    • Kullanıcının prompt’u sıfırdan yazmak zorunda kalmaması için şablonlar ve prompt oluşturma yardımcıları sunmak
    • Kullanıcının ajanın sonuçlarını kontrol edip düzeltebileceği geri bildirim döngüsü arayüzleri sağlamak
  • Geliştirici ayrıca ajan araçları (agent tools) da sunar
    • E-posta taslağı gönderme, otomatik gönderim, e-posta arama, harici API bağlantıları gibi
  • Bu araçlar, ajanın davranış alanını ve güvenliğini kontrol etmenin yolu olur
    • Davranışı metin prompt’larıyla kısıtlamak yerine kodla yazılmış araçlarla sınırlandırmak çok daha güvenli ve nettir

> Gelecekte “prompt injection” korkusuyla düşünmek bile gülünç gelebilir
> → Metin yapısında sınırlar kurmaya çalışmak, zayıf bir soyutlamanın işaretidir
> → Tüm sistemi kullanıcı alanı olarak görüp güçlü araçlar ve arayüzlerle yönetmek gerekir

E-postayı "okuyan" ajanın gerçek değeri

  • Az önce de söylendiği gibi, daha iyi bir System Prompt bile e-posta taslağını sıfırdan yazarken büyük bir zaman kazancı sağlamaz
  • Bunun nedeni, yazarın yazdığı e-postaların zaten çok kısa ve öz olması
    • Yani kullanıcı prompt’unun uzunluğu ≒ e-posta gövdesinin uzunluğu
  • Yazar, birçok kez deney yapmış ve üretken yapay zekanın metin üretmekten çok metin dönüştürmede daha güçlü olduğunu gözlemlemiş
  • Bu yüzden LLM kullanmanın asıl amacı, e-posta "yazmak" değil "okuyup işlemek" olmalı

E-posta okuma ajanı demosu (gpt-4o-mini tabanlı)

  • Kullanılabilen araçlar:
    • labelEmail(label, color, priority) : e-posta etiketleme
    • archiveEmail() : e-postayı otomatik arşivleme
    • draftReply(body) : otomatik yanıt taslağı oluşturma
  • Bu ajan her e-postayı okuyup:
    • spam’i iyi ayıklıyor
    • önem derecesine göre etiketliyor
    • özetliyor veya yanıt taslağı yazıyor
    • gereksiz postaları otomatik arşivliyor
  • Hatta birkaç araç daha eklenirse şunlar da mümkün:
    • abonelikten çıkma
    • takvime ekleme
    • faturaları otomatik ödeme
  • İşte AI-native e-posta istemcisinin yapması gereken tam olarak bu:
    sıkıcı ve tekrar eden işleri otomatikleştirerek kullanıcının zamanını kurtarmak
    • Superhuman, Zero gibi bazı e-posta istemcileri şimdiden bu yönde ilerliyor

AI-native yazılım ne anlama geliyor?

  • Yapay zekanın gerçek killer app’i, “benim yapmak istemediğim işleri” bilgisayarın benim yerime yapmasıdır
  • Yazarın bu yazıya demo eklemesinin nedeni de, LLM’lerin aslında bu işleri şimdiden yeterince iyi yapabildiğini göstermek
  • Sorun yapay zeka performansında değil, uygulama tasarımında

> Gmail ekibinin yaptığı şey, "AI eklenmiş bir e-posta uygulaması"
> → kullanıcı için bir otomasyon aracı olmak yerine, insan merkezli arayüze yapay zekayı zorla sıkıştıran bir yapı

  • Buna karşılık, AI-native uygulama şöyle olmalı:
    • Belirli bir alanda kullanıcının kaldıraç etkisini en üst düzeye çıkarmalı
    • Örn: yapay zeka e-posta istemcisi, e-posta için harcanan zamanı en aza indirmeli
    • Örn: yapay zeka muhasebe yazılımı, muhasebe işleme süresini en aza indirmeli

Yapay zeka çağına dair beklenti

  • Tekrarlayan ve sıkıcı işlerin tamamını ajanlar üstlenir
  • Kullanıcı önemli işlere odaklanabilir
  • Kişi iyi olduğu ve yapmaktan hoşlandığı şeylere daha fazla zaman ayırabilir

> Yazarın yapay zekanın geleceği konusunda heyecan duymasının nedeni tam da bu
> Daha iyi araçlar, zamanın daha iyi kullanımı, daha yüksek üretkenlik

2 yorum

 
crawler 2025-04-24

> Gerçekten kullanışlı yapay zeka uygulamaları, kullanıcının System Prompt’u düzenleyebilmesine izin verip kişiselleştirilmiş bir ajan oluşturmasını sağlamalı.

Elbette bu özellikleri yapan geliştiriciler de bunu biliyordur, ama jailbreak olduğu sürece bu kolay değil.
System Prompt’u değiştirilemesin diye sabitleseniz bile jailbreak mümkünken, System Prompt değişikliğini açmak imkansız bir iş.
Ayrıca insanlar bunu asıl işlevinden farklı amaçlarla ucuza kullanabilir de.

 
GN⁺ 2025-04-24
Hacker News görüşleri
  • Mesajları kişisel olarak yazmak için dil modelleri kullanma konusunda temkinli yaklaşılıyor. Bunun, bireysel deneyim ya da bilginin özgüllüğünden yoksun olduğu düşünülüyor

    • Gemini gibi modeller kişinin geçmiş teknik açıklamalarını ya da işinin ayrıntılarını anlayabilse bunu kabul etmek daha kolay olurdu
    • Ancak çoğu durumda, 1970'lerde bir sekreterin yazabileceği bir e-postadan farkı yok
    • Kişisel mesaj yazarken özet gereksiz ve kısa bir mesajı uzatmak anlamsız bir gürültü üretiyor
    • Mesaj yazmak için yapay zeka kullanmak, bilginin iletimiyle ilgili sınırları belirsizleştiriyor
  • Yapay zeka özelliklerinin %90'ının işe yaramaz ve pahalı olduğu hissediliyor

    • Kodlama odaklı yapay zeka özellikleri dışında faydalı yapay zeka özellikleri bulmak zor
    • Gmail ya da iMessage otomatik tamamlama özellikleri LLM'lerden önce de vardı
    • Bir e-postayı daha profesyonel göstermek için Gmail özelliği hiç kullanılmadı
  • Gemini, kişisel asistan gibi davranıp kullanıcı adına e-posta gönderiyor

    • Kişisel mesajları yapay zekaya yazdırmak karşı tarafı rahatsız edebilir
  • Dil bilgisi ve yazıma dikkat etmeyen insanlarla iletişim kurmak rahatsız edici bulunuyor

    • Yazımı kötü olan insanlar suçlanmıyor ama yapabilecek durumda olup da umursamamak karşı tarafa karşı ilgisizliği gösteriyor
  • LLM ile bağlı etkileşimli widget eğlenceli bulundu

    • Gmail'deki "e-postayı özetle" düğmesi gereksiz hissettiriyor
  • Birçok kişi yapay zekanın öngörülebilir bir tarzda yazdığını düşünüyor ama gerçekte öyle değil

    • Bu yalnızca metin için değil, görsel üretimi için de geçerli olabilir
    • Yapay zekanın gerçekten bir insan gibi konuşabildiği fark edildiğinde insanlar rahatsız olabilir
  • Etkileşimli demonun gerçek zamanlı ilerlemesi beğenildi

    • E-posta stilini analiz ederek taslak hazırlayabiliyor
    • Bu, yapay zekanın e-postayı otomatik yazdığı ve kullanıcının onayladığı bir yapıya evrilebilir
  • Yapay zeka kullanıcının ne istediğini bilemez ve hedefleri açıkça ifade etmekte zorlanır

    • Yapay zeka her şeyi hallederse kullanıcı derinlemesine düşünmez, bu da uzmanlığı ve problem çözme becerisini sınırlar
  • En faydalı yapay zeka özellikleri göze batmaz

    • E-posta etiketleme asistanı buna iyi bir örnek
    • "yeniden planlama" e-postalarını otomatik yorumlayıp takvim değişikliği önermesi kullanışlı
  • Yapay zekanın mesajları sizin yerinize yazmasını anlamlı bulmuyorlar

    • Önemli mesajlarda doğrudan kendin yazmanın bir anlamı var; bu, canlı bir etkileşimin ifadesi