6 puan yazan GN⁺ 2025-09-12 | 2 yorum | WhatsApp'ta paylaş
  • Claude’un bellek sistemi, yalnızca kullanıcı doğrudan çağırdığında etkinleşir ve gerçek konuşma geçmişini gerçek zamanlı olarak arayıp bilgiyi döndürür
  • Buna karşılık ChatGPT, her konuşmada kullanıcı profilini ve geçmişini otomatik olarak yükleyerek anında kişiselleştirilmiş bir deneyim sunar
  • Bu iki yaklaşım, hedef kullanıcı kitlesi ile ürün geliştirme felsefesindeki farkı yansıtır
  • Claude kullanıcıları geliştirici ve profesyonel ağırlıklıdır; şeffaflık, doğrudan kontrol ve gizliliğe önem verir
  • Son dönemde Claude’a da ekip ve enterprise hesaplar için ChatGPT benzeri otomatik bellek özelliği eklenmesiyle yapay zeka bellek tasarımı alanı hızla genişliyor

Claude’un bellek sistemi nasıl çalışıyor

Claude’un bellek sisteminin iki temel özelliği vardır

  • Her konuşmanın başında boş bir durumdan başlar; kullanıcı profili ya da önceki konuşma geçmişini önceden yüklemez
  • Bellek özelliği yalnızca kullanıcının “daha önce konuştuğumuz şeyi söyle”, “kaldığımız yerden devam et” gibi açık çağrı ifadeleri kullanmasıyla etkinleşir

Claude, yapay zekanın oluşturduğu özetler veya sıkıştırılmış profiller yerine, yalnızca gerçek geçmiş konuşma kayıtlarını gerçek zamanlı olarak arayıp bu bilgiyi kullanır
Arama tamamlandığında Claude, sonuçları birleştirerek kullanıcının isteğine yanıt verir ya da tartışmayı sürdürür

Conversation Search aracı

  • conversation_search aracı, tüm konuşma geçmişini anahtar kelime ya da konuya göre arar
  • Örneğin “Chandni Chowk hakkında konuştuğumuz şeyi hatırlıyor musun?” dendiğinde Claude, bu konuyla ilgili birden fazla konuşmayı bulur ve bunları birleştirip bir özet sunar
  • Birden fazla konu aynı anda sorulursa (ör. Michelangelo, Chainflip, Solana), her biri için ayrı ayrı sıralı arama yapar ve ilgili içeriği bağlantılarla birlikte döndürür
  • conversation_search parametreleri arasında azami sonuç sayısı ve arama sorgusu bulunur
    • Örn: max_results(1~10), query(arama anahtar kelimesi)
    Reklam

Temporal Chat Retrieval aracı

  • recent_chats aracı, konuşma geçmişine zamana göre erişir
  • “Son 10 konuşmanın içeriğini söyle” gibi bir istekte en güncel konuşmaları sırayla bulup özet sunar
  • Belirli bir dönem belirtilerek “2024 Kasım’ının son haftasında ne konuşmuştuk?” gibi zaman temelli arama da yapılabilir
  • recent_chats parametreleri arasında after/before(başlangıç·bitiş zamanı), n(konuşma sayısı, 1~20), sort_order(artan/azalan sıra) vardır

ChatGPT ile Claude karşılaştırması

Geçen yıla kadar ChatGPT ve Claude’un sunduğu başlıca işlevler benzerdi, ancak artık ürün yönleri belirgin biçimde ayrıştı

  • ChatGPT, geniş kitleye yönelik bir tüketici ürünü olarak gelişti; öğrenciler, ebeveynler, hobi amaçlı kullanıcılar gibi çok farklı arka planlardan insanlar tarafından kullanılıyor
    • Her konuşmada bellek bileşenleri otomatik olarak yüklenir ve anında, zahmetsiz kişiselleştirme deneyimi sunar
    • Ayrıntılı kullanıcı profiline dayanarak gelecekte özellik önerileri, özelleştirilmiş işlevler ve gelir yaratma için kullanılabilir
  • Claude ise geliştiriciler, mühendisler ve profesyonelleri merkeze alan bir kullanıcı kitlesi hedeflenerek geliştirildi
    • Kullanıcılar algoritmanın nasıl çalıştığını anlar ve belleği ne zaman çağıracaklarını açıkça seçer
    • Profilleme veya otomasyondan ziyade, bir araç olarak işlevsellik, öngörülebilirlik ve gizliliğe daha fazla değer verir
Reklam

Böylece iki hizmetin bellek sistemi, kullanıcı kitlesi ve geliştirme felsefesindeki farkı doğrudan yansıtır

Yapay zeka bellek tasarımındaki çeşitlilik

ChatGPT ve Claude’un tam zıt bellek sistemleri, yapay zeka bellek tasarımı alanının ne kadar çeşitli olduğunu gösteriyor

  • Bellek yaklaşımında tek bir doğru ya da evrensel çözüm yoktur; gerçek kullanıcı ihtiyaçları ve amaçlarına göre tasarımın tersine kurgulanması şarttır
  • Yapay zeka araçlarının kullanım geçmişi henüz 3 yılı bile doldurmadığından, aynı yapay zeka asistanını uzun süre kullanırken biriken verinin işlenmesi ya da gizlilik yönetimi konusunda yerleşmiş en iyi uygulamalar henüz oluşmuş değil
  • Şu anda farklı yapay zeka uygulamaları kendilerine özgü bellek yaklaşımlarını deniyor ve temel modeller de her hafta daha güçlü hale geliyor
  • Bu süreçte en iyi yönteme dair tek bir doğru yok; çeşitli denemeler ve deneyler sürüyor

Son güncelleme: Claude’a otomatik bellek özelliği geliyor

Bu yazının yayımlandığı gün Anthropic, Claude’un ekip/enterprise hesapları için otomatik bellek özelliğini duyurdu

  • Bu özellik, ChatGPT yaklaşımına benzer şekilde, iş bağlamı/çalışma kalıpları/proje bazlı bilgiler üzerinden otomatik bellek özetleri oluşturur
  • Her Claude projesi için bağımsız bir bellek oluşturulur ve kullanıcılar Claude’un neyi hatırladığını görüntüleyip düzenleyebilir
  • Yazarın kişisel Pro Max aboneliğine bu özellik henüz gelmediği için henüz değerlendirme yapılmadı
  • İleride mevcut arama tabanlı bellekle karşılaştırma ve ChatGPT’den farklar üzerine ek inceleme planlanıyor

2 yorum

 
GN⁺ 2025-09-12
Hacker News görüşleri
  • Uygulamadaki farklar sonuçta iş hedeflerinden kaynaklanıyor
    ChatGPT açıkça reklam ve ortaklık bağlantıları üzerinden gelir elde etmeyi hedefliyor ve bellek uygulaması da kullanıcı profili oluşturmaya odaklanıyor
    Buna karşılık Claude'un bellek uygulaması, geçmiş etkileşimler ve soyutlamalara erişim gibi daha uzun vadeli hedeflere daha yakın
    İnsan hafızasının çalışma biçimine benzer şekilde konuşmaların aranabilmesi için tasarlanmış ve ileride pekiştirmeli öğrenme sayesinde kullanıcının işaret ettiği hataları hatırlayabilir ya da geçmiş konuşmalardan soyutlamalar çıkararak görevleri proaktif biçimde yerine getirebilir diye düşünülüyor
    Sonuçta ChatGPT kullanıcının kendisini hatırlamaya çalışırken, Claude tek tek etkileşim kayıtlarına odaklanıyor

    • AGI olsaydı reklam olmadan da gelir yaratabilirdi, ama yeni bir Google gibi şirketin reklama ihtiyacı var
      Söylem ile gerçek davranış arasında tutarsızlık olduğu hissediliyor
    • Anthropic'in de kişiselleştirilmiş reklam sunmayacağına inanılmıyor
    • Kullanıcının LLM'i a, b, c konularında sık, d, e, f konularında daha seyrek kullandığını varsayarsak
      OpenAI, b, c, f gibi bazı konularda kesintili reklamlarla (tam ekran, 30 saniyeden uzun) gelir elde edebilir
      Bu, yalnızca konuları analiz ederek mümkün olabilir
      Eğer OpenAI yaklaşık 1000 sohbet ve kodlama oturumunu analiz edip kullanıcının belirli bir şirkette işe girmesini ya da başka bir şirketten araba almasını sağlayarak gelirini maksimize edebiliyorsa, bu süreçte yalnızca kesintili reklamlar değil, yanıtların kalitesi veya içeriği de ayarlanabilir
      Bu yeterince gerçekçi olduğu kadar distopik de bir tablo
      Buna karşılık DeepSeek reklamsız çalışırsa, kapalı kaynak LLM'lerin pazar payı elde etmesi için gereken eşik çok daha yüksek olacaktır
      Sonuçta LLM'ler de diğer tüm ürünler gibi kullanıcıların kaliteye göre ödeme yaptığı bir yapıya evrilecek ve herkes farklı kalite seviyeleri isteyecek
      Reklamların yapay zekanın yanıt güvenilirliğini zedeleyebileceği düşünüldüğünden, tam ekran reklamların en gerçekçi sonuç olduğu düşünülüyor
    • Reklama doğru net bir yön görüldüğünün neden düşünüldüğü merak ediliyor
      ChatGPT bir sosyal ağ değil, dolayısıyla aynı şekilde gelir elde etmek zorunda değil
      Abonelik, enterprise, business, API gibi alanlardan zaten yeterince gelir elde ediyor
  • ChatGPT'nin bellek uygulamasını analiz eden yazının bağlantısının hatalı olduğu belirtiliyor ve doğru bağlantı paylaşılıyor
    ChatGPT'nin bellek uygulama yöntemi merak ediliyordu; Claude ile tamamen farklı yaklaşım görmek oldukça ilginç
    Claude'un yöntemi teknik görevleri çözmeye daha uygun görünürken, ChatGPT günlük konuşmalar ve reklam entegrasyonu için daha avantajlı görünüyor
    Bir gün bu tür dil tabanlı bellek yöntemleri demode olacak ve birileri dilsel ifadelerin ötesine geçen kodlanmış anı depolama/geri çağırma yöntemini bulacak
    Bu AGI için son atılım da olabilir

    • Bunun AGI için son atılım olduğu iddiasına katılınmıyor
      Mevcut LLM'ler kavramları anlamıyor; fiilen bir 'anlama' işlevine sahip değiller ve özünde gelişmiş birer Markov zinciri
      Gerçek zekanın AGI için ön koşul olduğu düşünülüyor
    • Son konuşma listesinin gerçek bellek değil, gerektiğinde erişilen bir konuşma sıkıştırması biçiminde saklandığı için Claude'a benzer olduğu düşünülüyor
      ChatGPT'nin belleği ise yalnızca varlık bazlı özetlerden oluşan gerçek Memory'yi bağlama koyabiliyor gibi görünüyor
    • ChatGPT günlük konuşmalar, teknik görevler ve diğer her şeyi kapsamak istediği için bu strateji iyi işliyor
      Ayrıca geçmiş konuşma özetleri ya da embedding yöntemleri de kodlanmış bellek depolama biçimi sayılmaz mı diye soruluyor
    • AGI istenmiyor
      AGI'nin komutlara nasıl uymasının sağlanabileceği endişe yaratıyor
  • Claude'un bellek uygulamasından memnun olunduğu belirtiliyor, ancak ChatGPT'nin belleği kapatılmış
    ChatGPT çok farklı işler için kullanıldığı için, bağlantısız içerikleri anlamsız biçimde ilişkilendirmeye çalışması tuhaf bulunmuş

    • ChatGPT'nin belleği en kullanışlı özellik olarak görülüyor ve onu kullanmaya devam etme nedenlerinden biri bu
      Kişiselleştirme ve ihtiyaç duyulan bilgilere başvurabilme isteniyor
      Örneğin bir projeye ait bilgileri hatırlaması sağlanırsa, sonrasında her seferinde bağlamı açıklamak gerekmiyor ve bu yaşam kalitesini ciddi biçimde artırıyor
      Ancak doğrudan kontrol edilemeyen arka plan konuşma belleği oluşturma biçimi pek sevilmiyor
    • Buna karşılık ChatGPT'nin bilgileri bellekten otomatik olarak çekmesi çok daha kullanışlı bulunuyor
    • Bellek özelliğinin kapatılma nedeni, daha önce yanlış bilgileri belleğe kaydetmesi ve bunları sürekli geri getirmesiydi
    • Önceki konuşma içeriklerinin ne zaman geri çağrılacağını kontrol edebilmenin değerli olduğu düşünülüyor
      ChatGPT istenmeyen eski konuşma içeriklerini gereksiz yere karıştırdığı için verimsiz bulunuyor
    • ChatGPT'nin en temel şeyleri bile hatırlayamaması şaşırtıcı bulunuyor
      Dil öğrenimi amacıyla çeşitli yapay zeka öğretmenleri kullanılmış ve ChatGPT en iyisi olmuş
      Ancak sürekli olarak "yavaş konuş" denmesi gerekmiş ve bu kuralın tüm konuşmaya uygulanması istense de mümkün olmamış
      Bunun dışında da belleğin düzgün çalışmadığı durumlar var
  • Yakında ChatGPT'nin bellek yöntemi değişecek
    İlgili bağlantılar: X.com - bellek değişikliği haberi, Anthropic resmi duyurusu

    • Bellek sistemi değişirse üzücü olacağı düşünülüyor
  • ChatGPT belleği ve sohbet geçmişi hakkında bizzat yazı yazma deneyimi paylaşılıyor
    İçinde doğrudan bilgi dökümü yapan prompt da bulunuyor
    İlgili bağlantı

  • Her zaman kesin girdi kontrolü istendiği için bellek tamamen kapalı tutuluyor
    Tüm sistem prompt'larının, eğitimin vb. kaldırılması ve yalnızca doğrudan yazılan prompt'ların kullanılması isteniyor

  • ChatGPT'ye doğrudan soru sorularak öğrenilen bilgilerin güvenilir olup olmadığı, yoksa üretimsel halüsinasyon mu olduğu sorgulanıyor
    LLM'in nasıl çalıştığını bilmesi için bir neden olmadığı ve bununla ilgili eğitim verisi almış olmasının da muhtemel olmadığı düşünülüyor

    • LLM'e nasıl çalıştığını sormanın çok faydalı olmadığı, ancak kullanabildiği fonksiyonların/araçların imzalarını sormanın aksine oldukça isabetli olabildiği söyleniyor
      Çünkü bu araç bilgileri sistem prompt'unda çok ayrıntılı biçimde yazılı oluyor
  • Claude'un yalnızca orijinal konuşma geçmişini referans alarak anıları geri çağırdığı söyleniyor
    Yapay zekanın oluşturduğu özetler ya da sıkıştırılmış profiller olmadan, yalnızca gerçek geçmiş konuşmaları gerçek zamanlı arıyor
    Özet, profil, bilgi grafiği gibi yapıların olmaması bunun uzman bir özellik olduğu değil, iyi çalışmadığı anlamına geliyor
    Örneğin "Chandni Chowk" gibi spesifik şeyleri hatırlayabilir, ama "sorun yaşadığım iş arkadaşım" gibi muğlak ifadeleri doğru biçimde bulamayabilir

  • Harici bellek deposunun tool calling ya da MCP üzerinden kullanılması durumunda önündeki engellerin ne olduğu soruluyor
    RL ile bellek kullanım kalıplarının güçlendirilip güçlendirilmediği merak ediliyor
    Veri gizliliği açısından, çıkarım sırasında LLM zaten bilgiyi öğrenecek olsa da bunun doğrudan girilmesi istenmiyor
    Örnek: "İlgi alanları: MacOS, bondage, discipline, Baseball"

    • İlkbaharda eğlencesine SQLite db ile bellek saklayan bir MCP aracı yapıldığı anlatılıyor
      O dönemde Claude, prompt ile sürekli yönlendirilse bile belleği kendiliğinden kullanmak istemiyordu
      Her seferinde açıkça bellek kontrolü veya kayıt talimatı vermek gerektiğinden faydası düşük bulunmuş
      İlgili depo
  • Bu yazı okununca kafa karışıklığı yaşandığı söyleniyor
    Yazarın, bellek kapalıyken bile prompt'un eklendiğini düşünüp düşünmediği net değil
    Kendi durumunda bellek kapalıyken son konuşmaların ya da tercih bilgilerinin eklendiğine dair hiçbir metadata bulunmuyor ve konuşmalar tamamen bağımsız kalıyor
    Deney sırasında belleğin açılıp kapatılması arasında gidip gelinmesinin kafa karıştırmış olabileceği ya da yazının yanlış anlaşılmış olabileceği düşünülüyor

 
roxie 2025-09-13

Bir anda bütün noktalar kayboldu