Claude’un bellek mimarisi ChatGPT’nin tam tersi

(shloked.com)

6 puan yazan GN⁺ 2025-09-12 | 2 yorum | WhatsApp'ta paylaş

Claude’un bellek sistemi, yalnızca kullanıcı doğrudan çağırdığında etkinleşir ve gerçek konuşma geçmişini gerçek zamanlı olarak arayıp bilgiyi döndürür
Buna karşılık ChatGPT, her konuşmada kullanıcı profilini ve geçmişini otomatik olarak yükleyerek anında kişiselleştirilmiş bir deneyim sunar
Bu iki yaklaşım, hedef kullanıcı kitlesi ile ürün geliştirme felsefesindeki farkı yansıtır
Claude kullanıcıları geliştirici ve profesyonel ağırlıklıdır; şeffaflık, doğrudan kontrol ve gizliliğe önem verir
Son dönemde Claude’a da ekip ve enterprise hesaplar için ChatGPT benzeri otomatik bellek özelliği eklenmesiyle yapay zeka bellek tasarımı alanı hızla genişliyor

Claude’un bellek sistemi nasıl çalışıyor

Claude’un bellek sisteminin iki temel özelliği vardır

Her konuşmanın başında boş bir durumdan başlar; kullanıcı profili ya da önceki konuşma geçmişini önceden yüklemez
Bellek özelliği yalnızca kullanıcının “daha önce konuştuğumuz şeyi söyle”, “kaldığımız yerden devam et” gibi açık çağrı ifadeleri kullanmasıyla etkinleşir

Claude, yapay zekanın oluşturduğu özetler veya sıkıştırılmış profiller yerine, yalnızca gerçek geçmiş konuşma kayıtlarını gerçek zamanlı olarak arayıp bu bilgiyi kullanır
Arama tamamlandığında Claude, sonuçları birleştirerek kullanıcının isteğine yanıt verir ya da tartışmayı sürdürür

Conversation Search aracı

conversation_search aracı, tüm konuşma geçmişini anahtar kelime ya da konuya göre arar
Örneğin “Chandni Chowk hakkında konuştuğumuz şeyi hatırlıyor musun?” dendiğinde Claude, bu konuyla ilgili birden fazla konuşmayı bulur ve bunları birleştirip bir özet sunar
Birden fazla konu aynı anda sorulursa (ör. Michelangelo, Chainflip, Solana), her biri için ayrı ayrı sıralı arama yapar ve ilgili içeriği bağlantılarla birlikte döndürür
conversation_search parametreleri arasında azami sonuç sayısı ve arama sorgusu bulunur
- Örn: max_results(1~10), query(arama anahtar kelimesi)
Reklam

Temporal Chat Retrieval aracı

recent_chats aracı, konuşma geçmişine zamana göre erişir
“Son 10 konuşmanın içeriğini söyle” gibi bir istekte en güncel konuşmaları sırayla bulup özet sunar
Belirli bir dönem belirtilerek “2024 Kasım’ının son haftasında ne konuşmuştuk?” gibi zaman temelli arama da yapılabilir
recent_chats parametreleri arasında after/before(başlangıç·bitiş zamanı), n(konuşma sayısı, 1~20), sort_order(artan/azalan sıra) vardır

ChatGPT ile Claude karşılaştırması

Geçen yıla kadar ChatGPT ve Claude’un sunduğu başlıca işlevler benzerdi, ancak artık ürün yönleri belirgin biçimde ayrıştı

ChatGPT, geniş kitleye yönelik bir tüketici ürünü olarak gelişti; öğrenciler, ebeveynler, hobi amaçlı kullanıcılar gibi çok farklı arka planlardan insanlar tarafından kullanılıyor
- Her konuşmada bellek bileşenleri otomatik olarak yüklenir ve anında, zahmetsiz kişiselleştirme deneyimi sunar
- Ayrıntılı kullanıcı profiline dayanarak gelecekte özellik önerileri, özelleştirilmiş işlevler ve gelir yaratma için kullanılabilir
Claude ise geliştiriciler, mühendisler ve profesyonelleri merkeze alan bir kullanıcı kitlesi hedeflenerek geliştirildi
- Kullanıcılar algoritmanın nasıl çalıştığını anlar ve belleği ne zaman çağıracaklarını açıkça seçer
- Profilleme veya otomasyondan ziyade, bir araç olarak işlevsellik, öngörülebilirlik ve gizliliğe daha fazla değer verir

Böylece iki hizmetin bellek sistemi, kullanıcı kitlesi ve geliştirme felsefesindeki farkı doğrudan yansıtır

Yapay zeka bellek tasarımındaki çeşitlilik

ChatGPT ve Claude’un tam zıt bellek sistemleri, yapay zeka bellek tasarımı alanının ne kadar çeşitli olduğunu gösteriyor

Bellek yaklaşımında tek bir doğru ya da evrensel çözüm yoktur; gerçek kullanıcı ihtiyaçları ve amaçlarına göre tasarımın tersine kurgulanması şarttır
Yapay zeka araçlarının kullanım geçmişi henüz 3 yılı bile doldurmadığından, aynı yapay zeka asistanını uzun süre kullanırken biriken verinin işlenmesi ya da gizlilik yönetimi konusunda yerleşmiş en iyi uygulamalar henüz oluşmuş değil
Şu anda farklı yapay zeka uygulamaları kendilerine özgü bellek yaklaşımlarını deniyor ve temel modeller de her hafta daha güçlü hale geliyor
Bu süreçte en iyi yönteme dair tek bir doğru yok; çeşitli denemeler ve deneyler sürüyor

Son güncelleme: Claude’a otomatik bellek özelliği geliyor

Bu yazının yayımlandığı gün Anthropic, Claude’un ekip/enterprise hesapları için otomatik bellek özelliğini duyurdu

Bu özellik, ChatGPT yaklaşımına benzer şekilde, iş bağlamı/çalışma kalıpları/proje bazlı bilgiler üzerinden otomatik bellek özetleri oluşturur
Her Claude projesi için bağımsız bir bellek oluşturulur ve kullanıcılar Claude’un neyi hatırladığını görüntüleyip düzenleyebilir
Yazarın kişisel Pro Max aboneliğine bu özellik henüz gelmediği için henüz değerlendirme yapılmadı
İleride mevcut arama tabanlı bellekle karşılaştırma ve ChatGPT’den farklar üzerine ek inceleme planlanıyor

2 yorum

GN⁺ 2025-09-12

Hacker News görüşleri

Uygulamadaki farklar sonuçta iş hedeflerinden kaynaklanıyor
ChatGPT açıkça reklam ve ortaklık bağlantıları üzerinden gelir elde etmeyi hedefliyor ve bellek uygulaması da kullanıcı profili oluşturmaya odaklanıyor
Buna karşılık Claude'un bellek uygulaması, geçmiş etkileşimler ve soyutlamalara erişim gibi daha uzun vadeli hedeflere daha yakın
İnsan hafızasının çalışma biçimine benzer şekilde konuşmaların aranabilmesi için tasarlanmış ve ileride pekiştirmeli öğrenme sayesinde kullanıcının işaret ettiği hataları hatırlayabilir ya da geçmiş konuşmalardan soyutlamalar çıkararak görevleri proaktif biçimde yerine getirebilir diye düşünülüyor
Sonuçta ChatGPT kullanıcının kendisini hatırlamaya çalışırken, Claude tek tek etkileşim kayıtlarına odaklanıyor
- AGI olsaydı reklam olmadan da gelir yaratabilirdi, ama yeni bir Google gibi şirketin reklama ihtiyacı var
  Söylem ile gerçek davranış arasında tutarsızlık olduğu hissediliyor
- Anthropic'in de kişiselleştirilmiş reklam sunmayacağına inanılmıyor
- Kullanıcının LLM'i a, b, c konularında sık, d, e, f konularında daha seyrek kullandığını varsayarsak
  OpenAI, b, c, f gibi bazı konularda kesintili reklamlarla (tam ekran, 30 saniyeden uzun) gelir elde edebilir
  Bu, yalnızca konuları analiz ederek mümkün olabilir
  Eğer OpenAI yaklaşık 1000 sohbet ve kodlama oturumunu analiz edip kullanıcının belirli bir şirkette işe girmesini ya da başka bir şirketten araba almasını sağlayarak gelirini maksimize edebiliyorsa, bu süreçte yalnızca kesintili reklamlar değil, yanıtların kalitesi veya içeriği de ayarlanabilir
  Bu yeterince gerçekçi olduğu kadar distopik de bir tablo
  Buna karşılık DeepSeek reklamsız çalışırsa, kapalı kaynak LLM'lerin pazar payı elde etmesi için gereken eşik çok daha yüksek olacaktır
  Sonuçta LLM'ler de diğer tüm ürünler gibi kullanıcıların kaliteye göre ödeme yaptığı bir yapıya evrilecek ve herkes farklı kalite seviyeleri isteyecek
  Reklamların yapay zekanın yanıt güvenilirliğini zedeleyebileceği düşünüldüğünden, tam ekran reklamların en gerçekçi sonuç olduğu düşünülüyor
- Reklama doğru net bir yön görüldüğünün neden düşünüldüğü merak ediliyor
  ChatGPT bir sosyal ağ değil, dolayısıyla aynı şekilde gelir elde etmek zorunda değil
  Abonelik, enterprise, business, API gibi alanlardan zaten yeterince gelir elde ediyor
ChatGPT'nin bellek uygulamasını analiz eden yazının bağlantısının hatalı olduğu belirtiliyor ve doğru bağlantı paylaşılıyor
ChatGPT'nin bellek uygulama yöntemi merak ediliyordu; Claude ile tamamen farklı yaklaşım görmek oldukça ilginç
Claude'un yöntemi teknik görevleri çözmeye daha uygun görünürken, ChatGPT günlük konuşmalar ve reklam entegrasyonu için daha avantajlı görünüyor
Bir gün bu tür dil tabanlı bellek yöntemleri demode olacak ve birileri dilsel ifadelerin ötesine geçen kodlanmış anı depolama/geri çağırma yöntemini bulacak
Bu AGI için son atılım da olabilir
- Bunun AGI için son atılım olduğu iddiasına katılınmıyor
  Mevcut LLM'ler kavramları anlamıyor; fiilen bir 'anlama' işlevine sahip değiller ve özünde gelişmiş birer Markov zinciri
  Gerçek zekanın AGI için ön koşul olduğu düşünülüyor
- Son konuşma listesinin gerçek bellek değil, gerektiğinde erişilen bir konuşma sıkıştırması biçiminde saklandığı için Claude'a benzer olduğu düşünülüyor
  ChatGPT'nin belleği ise yalnızca varlık bazlı özetlerden oluşan gerçek Memory'yi bağlama koyabiliyor gibi görünüyor
- ChatGPT günlük konuşmalar, teknik görevler ve diğer her şeyi kapsamak istediği için bu strateji iyi işliyor
  Ayrıca geçmiş konuşma özetleri ya da embedding yöntemleri de kodlanmış bellek depolama biçimi sayılmaz mı diye soruluyor
- AGI istenmiyor
  AGI'nin komutlara nasıl uymasının sağlanabileceği endişe yaratıyor
Claude'un bellek uygulamasından memnun olunduğu belirtiliyor, ancak ChatGPT'nin belleği kapatılmış
ChatGPT çok farklı işler için kullanıldığı için, bağlantısız içerikleri anlamsız biçimde ilişkilendirmeye çalışması tuhaf bulunmuş
- ChatGPT'nin belleği en kullanışlı özellik olarak görülüyor ve onu kullanmaya devam etme nedenlerinden biri bu
  Kişiselleştirme ve ihtiyaç duyulan bilgilere başvurabilme isteniyor
  Örneğin bir projeye ait bilgileri hatırlaması sağlanırsa, sonrasında her seferinde bağlamı açıklamak gerekmiyor ve bu yaşam kalitesini ciddi biçimde artırıyor
  Ancak doğrudan kontrol edilemeyen arka plan konuşma belleği oluşturma biçimi pek sevilmiyor
- Buna karşılık ChatGPT'nin bilgileri bellekten otomatik olarak çekmesi çok daha kullanışlı bulunuyor
- Bellek özelliğinin kapatılma nedeni, daha önce yanlış bilgileri belleğe kaydetmesi ve bunları sürekli geri getirmesiydi
- Önceki konuşma içeriklerinin ne zaman geri çağrılacağını kontrol edebilmenin değerli olduğu düşünülüyor
  ChatGPT istenmeyen eski konuşma içeriklerini gereksiz yere karıştırdığı için verimsiz bulunuyor
- ChatGPT'nin en temel şeyleri bile hatırlayamaması şaşırtıcı bulunuyor
  Dil öğrenimi amacıyla çeşitli yapay zeka öğretmenleri kullanılmış ve ChatGPT en iyisi olmuş
  Ancak sürekli olarak "yavaş konuş" denmesi gerekmiş ve bu kuralın tüm konuşmaya uygulanması istense de mümkün olmamış
  Bunun dışında da belleğin düzgün çalışmadığı durumlar var
Yakında ChatGPT'nin bellek yöntemi değişecek
İlgili bağlantılar: X.com - bellek değişikliği haberi, Anthropic resmi duyurusu
- Bellek sistemi değişirse üzücü olacağı düşünülüyor
ChatGPT belleği ve sohbet geçmişi hakkında bizzat yazı yazma deneyimi paylaşılıyor
İçinde doğrudan bilgi dökümü yapan prompt da bulunuyor
İlgili bağlantı
Her zaman kesin girdi kontrolü istendiği için bellek tamamen kapalı tutuluyor
Tüm sistem prompt'larının, eğitimin vb. kaldırılması ve yalnızca doğrudan yazılan prompt'ların kullanılması isteniyor
ChatGPT'ye doğrudan soru sorularak öğrenilen bilgilerin güvenilir olup olmadığı, yoksa üretimsel halüsinasyon mu olduğu sorgulanıyor
LLM'in nasıl çalıştığını bilmesi için bir neden olmadığı ve bununla ilgili eğitim verisi almış olmasının da muhtemel olmadığı düşünülüyor
- LLM'e nasıl çalıştığını sormanın çok faydalı olmadığı, ancak kullanabildiği fonksiyonların/araçların imzalarını sormanın aksine oldukça isabetli olabildiği söyleniyor
  Çünkü bu araç bilgileri sistem prompt'unda çok ayrıntılı biçimde yazılı oluyor
Claude'un yalnızca orijinal konuşma geçmişini referans alarak anıları geri çağırdığı söyleniyor
Yapay zekanın oluşturduğu özetler ya da sıkıştırılmış profiller olmadan, yalnızca gerçek geçmiş konuşmaları gerçek zamanlı arıyor
Özet, profil, bilgi grafiği gibi yapıların olmaması bunun uzman bir özellik olduğu değil, iyi çalışmadığı anlamına geliyor
Örneğin "Chandni Chowk" gibi spesifik şeyleri hatırlayabilir, ama "sorun yaşadığım iş arkadaşım" gibi muğlak ifadeleri doğru biçimde bulamayabilir
Harici bellek deposunun tool calling ya da MCP üzerinden kullanılması durumunda önündeki engellerin ne olduğu soruluyor
RL ile bellek kullanım kalıplarının güçlendirilip güçlendirilmediği merak ediliyor
Veri gizliliği açısından, çıkarım sırasında LLM zaten bilgiyi öğrenecek olsa da bunun doğrudan girilmesi istenmiyor
Örnek: "İlgi alanları: MacOS, bondage, discipline, Baseball"
- İlkbaharda eğlencesine SQLite db ile bellek saklayan bir MCP aracı yapıldığı anlatılıyor
  O dönemde Claude, prompt ile sürekli yönlendirilse bile belleği kendiliğinden kullanmak istemiyordu
  Her seferinde açıkça bellek kontrolü veya kayıt talimatı vermek gerektiğinden faydası düşük bulunmuş
  İlgili depo
Bu yazı okununca kafa karışıklığı yaşandığı söyleniyor
Yazarın, bellek kapalıyken bile prompt'un eklendiğini düşünüp düşünmediği net değil
Kendi durumunda bellek kapalıyken son konuşmaların ya da tercih bilgilerinin eklendiğine dair hiçbir metadata bulunmuyor ve konuşmalar tamamen bağımsız kalıyor
Deney sırasında belleğin açılıp kapatılması arasında gidip gelinmesinin kafa karıştırmış olabileceği ya da yazının yanlış anlaşılmış olabileceği düşünülüyor

roxie 2025-09-13

Bir anda bütün noktalar kayboldu