Claude’un bellek mimarisi ChatGPT’nin tam tersi
(shloked.com)- Claude’un bellek sistemi, yalnızca kullanıcı doğrudan çağırdığında etkinleşir ve gerçek konuşma geçmişini gerçek zamanlı olarak arayıp bilgiyi döndürür
- Buna karşılık ChatGPT, her konuşmada kullanıcı profilini ve geçmişini otomatik olarak yükleyerek anında kişiselleştirilmiş bir deneyim sunar
- Bu iki yaklaşım, hedef kullanıcı kitlesi ile ürün geliştirme felsefesindeki farkı yansıtır
- Claude kullanıcıları geliştirici ve profesyonel ağırlıklıdır; şeffaflık, doğrudan kontrol ve gizliliğe önem verir
- Son dönemde Claude’a da ekip ve enterprise hesaplar için ChatGPT benzeri otomatik bellek özelliği eklenmesiyle yapay zeka bellek tasarımı alanı hızla genişliyor
Claude’un bellek sistemi nasıl çalışıyor
Claude’un bellek sisteminin iki temel özelliği vardır
- Her konuşmanın başında boş bir durumdan başlar; kullanıcı profili ya da önceki konuşma geçmişini önceden yüklemez
- Bellek özelliği yalnızca kullanıcının “daha önce konuştuğumuz şeyi söyle”, “kaldığımız yerden devam et” gibi açık çağrı ifadeleri kullanmasıyla etkinleşir
Claude, yapay zekanın oluşturduğu özetler veya sıkıştırılmış profiller yerine, yalnızca gerçek geçmiş konuşma kayıtlarını gerçek zamanlı olarak arayıp bu bilgiyi kullanır
Arama tamamlandığında Claude, sonuçları birleştirerek kullanıcının isteğine yanıt verir ya da tartışmayı sürdürür
Conversation Search aracı
- conversation_search aracı, tüm konuşma geçmişini anahtar kelime ya da konuya göre arar
- Örneğin “Chandni Chowk hakkında konuştuğumuz şeyi hatırlıyor musun?” dendiğinde Claude, bu konuyla ilgili birden fazla konuşmayı bulur ve bunları birleştirip bir özet sunar
- Birden fazla konu aynı anda sorulursa (ör. Michelangelo, Chainflip, Solana), her biri için ayrı ayrı sıralı arama yapar ve ilgili içeriği bağlantılarla birlikte döndürür
- conversation_search parametreleri arasında azami sonuç sayısı ve arama sorgusu bulunur
- Örn: max_results(1~10), query(arama anahtar kelimesi)
Temporal Chat Retrieval aracı
- recent_chats aracı, konuşma geçmişine zamana göre erişir
- “Son 10 konuşmanın içeriğini söyle” gibi bir istekte en güncel konuşmaları sırayla bulup özet sunar
- Belirli bir dönem belirtilerek “2024 Kasım’ının son haftasında ne konuşmuştuk?” gibi zaman temelli arama da yapılabilir
- recent_chats parametreleri arasında after/before(başlangıç·bitiş zamanı), n(konuşma sayısı, 1~20), sort_order(artan/azalan sıra) vardır
ChatGPT ile Claude karşılaştırması
Geçen yıla kadar ChatGPT ve Claude’un sunduğu başlıca işlevler benzerdi, ancak artık ürün yönleri belirgin biçimde ayrıştı
- ChatGPT, geniş kitleye yönelik bir tüketici ürünü olarak gelişti; öğrenciler, ebeveynler, hobi amaçlı kullanıcılar gibi çok farklı arka planlardan insanlar tarafından kullanılıyor
- Her konuşmada bellek bileşenleri otomatik olarak yüklenir ve anında, zahmetsiz kişiselleştirme deneyimi sunar
- Ayrıntılı kullanıcı profiline dayanarak gelecekte özellik önerileri, özelleştirilmiş işlevler ve gelir yaratma için kullanılabilir
- Claude ise geliştiriciler, mühendisler ve profesyonelleri merkeze alan bir kullanıcı kitlesi hedeflenerek geliştirildi
- Kullanıcılar algoritmanın nasıl çalıştığını anlar ve belleği ne zaman çağıracaklarını açıkça seçer
- Profilleme veya otomasyondan ziyade, bir araç olarak işlevsellik, öngörülebilirlik ve gizliliğe daha fazla değer verir
Böylece iki hizmetin bellek sistemi, kullanıcı kitlesi ve geliştirme felsefesindeki farkı doğrudan yansıtır
Yapay zeka bellek tasarımındaki çeşitlilik
ChatGPT ve Claude’un tam zıt bellek sistemleri, yapay zeka bellek tasarımı alanının ne kadar çeşitli olduğunu gösteriyor
- Bellek yaklaşımında tek bir doğru ya da evrensel çözüm yoktur; gerçek kullanıcı ihtiyaçları ve amaçlarına göre tasarımın tersine kurgulanması şarttır
- Yapay zeka araçlarının kullanım geçmişi henüz 3 yılı bile doldurmadığından, aynı yapay zeka asistanını uzun süre kullanırken biriken verinin işlenmesi ya da gizlilik yönetimi konusunda yerleşmiş en iyi uygulamalar henüz oluşmuş değil
- Şu anda farklı yapay zeka uygulamaları kendilerine özgü bellek yaklaşımlarını deniyor ve temel modeller de her hafta daha güçlü hale geliyor
- Bu süreçte en iyi yönteme dair tek bir doğru yok; çeşitli denemeler ve deneyler sürüyor
Son güncelleme: Claude’a otomatik bellek özelliği geliyor
Bu yazının yayımlandığı gün Anthropic, Claude’un ekip/enterprise hesapları için otomatik bellek özelliğini duyurdu
- Bu özellik, ChatGPT yaklaşımına benzer şekilde, iş bağlamı/çalışma kalıpları/proje bazlı bilgiler üzerinden otomatik bellek özetleri oluşturur
- Her Claude projesi için bağımsız bir bellek oluşturulur ve kullanıcılar Claude’un neyi hatırladığını görüntüleyip düzenleyebilir
- Yazarın kişisel Pro Max aboneliğine bu özellik henüz gelmediği için henüz değerlendirme yapılmadı
- İleride mevcut arama tabanlı bellekle karşılaştırma ve ChatGPT’den farklar üzerine ek inceleme planlanıyor
2 yorum
Hacker News görüşleri
Uygulamadaki farklar sonuçta iş hedeflerinden kaynaklanıyor
ChatGPT açıkça reklam ve ortaklık bağlantıları üzerinden gelir elde etmeyi hedefliyor ve bellek uygulaması da kullanıcı profili oluşturmaya odaklanıyor
Buna karşılık Claude'un bellek uygulaması, geçmiş etkileşimler ve soyutlamalara erişim gibi daha uzun vadeli hedeflere daha yakın
İnsan hafızasının çalışma biçimine benzer şekilde konuşmaların aranabilmesi için tasarlanmış ve ileride pekiştirmeli öğrenme sayesinde kullanıcının işaret ettiği hataları hatırlayabilir ya da geçmiş konuşmalardan soyutlamalar çıkararak görevleri proaktif biçimde yerine getirebilir diye düşünülüyor
Sonuçta ChatGPT kullanıcının kendisini hatırlamaya çalışırken, Claude tek tek etkileşim kayıtlarına odaklanıyor
Söylem ile gerçek davranış arasında tutarsızlık olduğu hissediliyor
OpenAI, b, c, f gibi bazı konularda kesintili reklamlarla (tam ekran, 30 saniyeden uzun) gelir elde edebilir
Bu, yalnızca konuları analiz ederek mümkün olabilir
Eğer OpenAI yaklaşık 1000 sohbet ve kodlama oturumunu analiz edip kullanıcının belirli bir şirkette işe girmesini ya da başka bir şirketten araba almasını sağlayarak gelirini maksimize edebiliyorsa, bu süreçte yalnızca kesintili reklamlar değil, yanıtların kalitesi veya içeriği de ayarlanabilir
Bu yeterince gerçekçi olduğu kadar distopik de bir tablo
Buna karşılık DeepSeek reklamsız çalışırsa, kapalı kaynak LLM'lerin pazar payı elde etmesi için gereken eşik çok daha yüksek olacaktır
Sonuçta LLM'ler de diğer tüm ürünler gibi kullanıcıların kaliteye göre ödeme yaptığı bir yapıya evrilecek ve herkes farklı kalite seviyeleri isteyecek
Reklamların yapay zekanın yanıt güvenilirliğini zedeleyebileceği düşünüldüğünden, tam ekran reklamların en gerçekçi sonuç olduğu düşünülüyor
ChatGPT bir sosyal ağ değil, dolayısıyla aynı şekilde gelir elde etmek zorunda değil
Abonelik, enterprise, business, API gibi alanlardan zaten yeterince gelir elde ediyor
ChatGPT'nin bellek uygulamasını analiz eden yazının bağlantısının hatalı olduğu belirtiliyor ve doğru bağlantı paylaşılıyor
ChatGPT'nin bellek uygulama yöntemi merak ediliyordu; Claude ile tamamen farklı yaklaşım görmek oldukça ilginç
Claude'un yöntemi teknik görevleri çözmeye daha uygun görünürken, ChatGPT günlük konuşmalar ve reklam entegrasyonu için daha avantajlı görünüyor
Bir gün bu tür dil tabanlı bellek yöntemleri demode olacak ve birileri dilsel ifadelerin ötesine geçen kodlanmış anı depolama/geri çağırma yöntemini bulacak
Bu AGI için son atılım da olabilir
Mevcut LLM'ler kavramları anlamıyor; fiilen bir 'anlama' işlevine sahip değiller ve özünde gelişmiş birer Markov zinciri
Gerçek zekanın AGI için ön koşul olduğu düşünülüyor
ChatGPT'nin belleği ise yalnızca varlık bazlı özetlerden oluşan gerçek Memory'yi bağlama koyabiliyor gibi görünüyor
Ayrıca geçmiş konuşma özetleri ya da embedding yöntemleri de kodlanmış bellek depolama biçimi sayılmaz mı diye soruluyor
AGI'nin komutlara nasıl uymasının sağlanabileceği endişe yaratıyor
Claude'un bellek uygulamasından memnun olunduğu belirtiliyor, ancak ChatGPT'nin belleği kapatılmış
ChatGPT çok farklı işler için kullanıldığı için, bağlantısız içerikleri anlamsız biçimde ilişkilendirmeye çalışması tuhaf bulunmuş
Kişiselleştirme ve ihtiyaç duyulan bilgilere başvurabilme isteniyor
Örneğin bir projeye ait bilgileri hatırlaması sağlanırsa, sonrasında her seferinde bağlamı açıklamak gerekmiyor ve bu yaşam kalitesini ciddi biçimde artırıyor
Ancak doğrudan kontrol edilemeyen arka plan konuşma belleği oluşturma biçimi pek sevilmiyor
ChatGPT istenmeyen eski konuşma içeriklerini gereksiz yere karıştırdığı için verimsiz bulunuyor
Dil öğrenimi amacıyla çeşitli yapay zeka öğretmenleri kullanılmış ve ChatGPT en iyisi olmuş
Ancak sürekli olarak "yavaş konuş" denmesi gerekmiş ve bu kuralın tüm konuşmaya uygulanması istense de mümkün olmamış
Bunun dışında da belleğin düzgün çalışmadığı durumlar var
Yakında ChatGPT'nin bellek yöntemi değişecek
İlgili bağlantılar: X.com - bellek değişikliği haberi, Anthropic resmi duyurusu
ChatGPT belleği ve sohbet geçmişi hakkında bizzat yazı yazma deneyimi paylaşılıyor
İçinde doğrudan bilgi dökümü yapan prompt da bulunuyor
İlgili bağlantı
Her zaman kesin girdi kontrolü istendiği için bellek tamamen kapalı tutuluyor
Tüm sistem prompt'larının, eğitimin vb. kaldırılması ve yalnızca doğrudan yazılan prompt'ların kullanılması isteniyor
ChatGPT'ye doğrudan soru sorularak öğrenilen bilgilerin güvenilir olup olmadığı, yoksa üretimsel halüsinasyon mu olduğu sorgulanıyor
LLM'in nasıl çalıştığını bilmesi için bir neden olmadığı ve bununla ilgili eğitim verisi almış olmasının da muhtemel olmadığı düşünülüyor
Çünkü bu araç bilgileri sistem prompt'unda çok ayrıntılı biçimde yazılı oluyor
Claude'un yalnızca orijinal konuşma geçmişini referans alarak anıları geri çağırdığı söyleniyor
Yapay zekanın oluşturduğu özetler ya da sıkıştırılmış profiller olmadan, yalnızca gerçek geçmiş konuşmaları gerçek zamanlı arıyor
Özet, profil, bilgi grafiği gibi yapıların olmaması bunun uzman bir özellik olduğu değil, iyi çalışmadığı anlamına geliyor
Örneğin "Chandni Chowk" gibi spesifik şeyleri hatırlayabilir, ama "sorun yaşadığım iş arkadaşım" gibi muğlak ifadeleri doğru biçimde bulamayabilir
Harici bellek deposunun tool calling ya da MCP üzerinden kullanılması durumunda önündeki engellerin ne olduğu soruluyor
RL ile bellek kullanım kalıplarının güçlendirilip güçlendirilmediği merak ediliyor
Veri gizliliği açısından, çıkarım sırasında LLM zaten bilgiyi öğrenecek olsa da bunun doğrudan girilmesi istenmiyor
Örnek: "İlgi alanları: MacOS, bondage, discipline, Baseball"
O dönemde Claude, prompt ile sürekli yönlendirilse bile belleği kendiliğinden kullanmak istemiyordu
Her seferinde açıkça bellek kontrolü veya kayıt talimatı vermek gerektiğinden faydası düşük bulunmuş
İlgili depo
Bu yazı okununca kafa karışıklığı yaşandığı söyleniyor
Yazarın, bellek kapalıyken bile prompt'un eklendiğini düşünüp düşünmediği net değil
Kendi durumunda bellek kapalıyken son konuşmaların ya da tercih bilgilerinin eklendiğine dair hiçbir metadata bulunmuyor ve konuşmalar tamamen bağımsız kalıyor
Deney sırasında belleğin açılıp kapatılması arasında gidip gelinmesinin kafa karıştırmış olabileceği ya da yazının yanlış anlaşılmış olabileceği düşünülüyor
Bir anda bütün noktalar kayboldu