Dosya sistemleri neden ilgi görüyor

(madalitso.me)

36 puan yazan GN⁺ 2026-03-09 | 1 yorum | WhatsApp'ta paylaş

Son dönemde yapay zeka ajanı ekosisteminde dosya sistemleri yeniden ilgi görmeye başladı ve veritabanlarından farklı bir kalıcı bağlam yönetimi aracı olarak öne çıkıyor
LLM’lerin bağlam penceresi kalıcı bir bellekten çok silinen bir beyaz tahtaya benziyor; dosya sistemi ise bunu çözmenin en basit kalıcı depolama yolu
Claude Code, Cursor gibi araçlar dosya tabanlı bağlam depolama ile uzun süreli belleği hayata geçiriyor; CLAUDE.md, aboutme.md gibi dosyalar ajanın kimliği ve ortam bilgilerini taşıyor
Dosya sistemi tabanlı bağlam yönetimi temel gündem maddesi haline gelirken, LlamaIndex·LangChain·Oracle·Archil gibi önemli şirketler peş peşe ilgili yazılar ve ürünler yayımlıyor
CLAUDE.md, AGENTS.md, .cursorrules gibi ajan bağlam dosyaları çoğalırken, Anthropic’in Agent Skills (SKILL.md) formatı Microsoft·OpenAI·GitHub·Cursor gibi şirketlerce benimsenerek birlikte çalışabilirlik sağlıyor
ETH Zürich araştırmasına göre bağlam dosyaları tersine görev başarı oranını düşürebilir ve çıkarım maliyetini %20’den fazla artırabilir; bu yüzden yalnızca asgari gereksinimler yazılmalı
Dosyalar belirli bir uygulamaya bağımlı değil; yapay zeka ajanları çağında araçlar arası geçişi, iş akışı birleşimini ve sürekliliği mümkün kılan açık bir arayüz haline geliyor

Everyone is talking about files : Her yerde dosyalar konuşuluyor

LlamaIndex, "Files Are All You Need" yazısını yayımladı; LangChain ise ajanların bağlam mühendisliği için dosya sistemlerini nasıl kullanabileceğini ele aldı
Oracle (evet, o Oracle!) ajan belleği yönetiminde dosya sistemleri ile veritabanlarının karşılaştırılması başlıklı bir yazı yayımladı; Dan Abramov ise AT Protocol tabanlı bir sosyal dosya sistemi önerdi
Archil, ajanlar POSIX dosya sistemi istediği için bulut volume’leri inşa ediyor
LlamaIndex’ten Jerry Liu, "yüzlerce aracı olan tek bir ajan" yerine yalnızca bir dosya sistemi ve 5-10 araçla, 100’den fazla MCP aracına sahip bir ajandan daha genel amaçlı bir sistem kurulabileceğini savunuyor
Karpathy, Claude Code’un çalışmasının nedeninin kullanıcının bilgisayarı, ortamı, verisi ve bağlamı üzerinde doğrudan çalışması olduğunu; OpenAI’ın bulut container dağıtımına odaklanmasının yanlış yön olduğunu belirtiyor
Şu anda kodlama ajanları fiili yapay zeka kullanım örneklerinin büyük bölümünü oluşturuyor; Anthropic ise CLI aracı Claude Code gelirlerinin önemli kısmını sürüklediği için kârlılığa yaklaşmış durumda

Bağlam penceresi bellek değildir

İnsan belleği uzun süreli depolama, seçici geri çağırma ve gereksiz bilgiyi unutma işlevlerini içerir; LLM’lerin bağlam penceresi ise sürekli silinen bir beyaz tahtaya daha yakındır
Claude Code kullanırken "context left until auto-compact" uyarısı yaklaştığında, ajanın biriktirdiği kod tabanı, tercihler ve alınmış kararlar gibi bağlam sıkıştırılır ya da kaybolur
Dosya sistemi bunu en basit şekilde çözer: kayıtları dosyalara yazar ve gerektiğinde yeniden okur
- CLAUDE.md, proje hakkında kalıcı bağlam sağlar
- Cursor, geçmiş sohbet kayıtlarını aranabilir dosyalar olarak saklar
- aboutme.md dosyası; tercihleri, becerileri ve çalışma tarzını içeren taşınabilir bir kimlik tanımlayıcısı işlevi görür ve API koordinasyonu olmadan uygulamalar arasında taşınabilir

ETH Zürich araştırması: bağlam dosyalarının paradoksu

ETH Zürich’in yakın tarihli makalesi, depo düzeyindeki bağlam dosyalarının gerçekten kodlama ajanlarının görev tamamlama başarısına yardımcı olup olmadığını değerlendiriyor
Sonuçlar sezgiye aykırı: farklı ajanlar ve modeller boyunca bağlam dosyaları görev başarı oranını düşürüyor, çıkarım maliyetini ise %20’den fazla artırıyor
- Bağlam dosyası verilen ajanlar daha geniş arama yaptı, daha fazla test çalıştırdı ve daha fazla dosya dolaştı; ancak gerçekten değiştirilmesi gereken koda ulaşmaları gecikti
- Dosya, ajanın aşırı ciddiye aldığı bir kontrol listesi gibi çalıştı
Makalenin vardığı sonuç "bağlam dosyalarını kullanmayın" değil; gereksiz gereksinimlerin görevi zorlaştırdığı ve bağlam dosyalarının yalnızca asgari gereksinimleri anlatması gerektiği
Sorun, dosya sisteminin kalıcı katmanının kendisi değil; CLAUDE.md dosyasını 2.000 kelimelik bir onboarding belgesi gibi yazma pratiği

Dosya formatı API’nin kendisi — ama hangi dosya?

Şu anda CLAUDE.md, AGENTS.md, copilot-instructions.md, .cursorrules bir arada varlığını sürdürüyor; ajanların kalıcı, dosya sistemi tabanlı bağlama ihtiyaç duyduğu konusunda uzlaşma var ama dosya adı ve içerik formatı konusunda uzlaşma yok
Dan Abramov’un sosyal dosya sistemi yazısındaki temel tasarım şu: AT Protocol, kullanıcı verisini kişisel repository içindeki dosyalar olarak ele alıyor ve uygulamaların "post"un ne olduğunda anlaşmasına gerek kalmadan alan adı tabanlı namespace ile çakışmaları önlüyor
- Tüm uygulamaların veritabanları türetilmiş veri, yani tüm kullanıcı klasörlerinin önbelleğe alınmış somutlaştırılmış görünümleri haline geliyor
Anthropic, Agent Skills’ı açık standart olarak duyurdu: SKILL.md formatı Microsoft, OpenAI, Atlassian, GitHub ve Cursor tarafından benimsendi
- Claude Code için yazılmış bir skill, Codex ve Copilot’ta da çalışıyor — dosya formatı API’nin kendisi
NanoClaw, hafif bir kişisel yapay zeka asistanı framework’ü olarak "özellik yerine skill" modelini benimsiyor
- Telegram desteği gerekiyorsa, bir Telegram modülü yerine /add-telegram skill’i (bir Markdown dosyası) Claude Code’a nasıl entegre edileceğini öğretiyor
- Skill’ler dosya olduğu için taşınabilir, denetlenebilir ve birleştirilebilir; MCP sunucusu ya da eklenti pazaryerine ihtiyaç yok
İşte bu, koordinasyon gerektirmeyen birlikte çalışabilirlik: iki uygulama Markdown okuyabiliyorsa bağlam paylaşabilir; SKILL.md formatını anlayabiliyorsa işlev paylaşabilir; ortaklık anlaşmaları veya standart kurumu toplantıları olmadan, dosya formatının kendisi koordinasyon işlevi görür

Darboğazın yeri değişiyor

Geleneksel veri mimarisi, depolamanın darboğaz olduğu varsayımıyla tasarlanmıştı; ancak işlem gücü depolama I/O’sunu aşınca paradigma depolama ile compute’un ayrılmasına (S3 + geçici compute cluster’ları) kaydı
Benzer bir durum yapay zeka ajanlarında da görülüyor: darboğaz model performansı ya da compute değil, bağlam
- Modeller yeterince akıllı ama unutkan
- Dosya sistemi, ajanın çalıştığı tam noktada — yani geliştiricinin makinesinde, ortamın ve verinin zaten bulunduğu yerde — kalıcı bağlamı yönetmenin en etkili yolu

Dosya sistemi zaten bir grafik

Twitter’da yapılan şu tespit dikkat çekiyor: "Dosya sistemi kullanırken ajanlar için grafa gerek olmadığını söyleyenler, aslında graf kullandıklarını inkâr ediyor"
- Dosya sistemi; dizinler, alt dizinler ve dosyalardan oluşan bir ağaç yapısıdır, yani yönlü döngüsüz grafik (DAG)
- Ajan ls, grep, dosya okuma ve referans takibi yaptığında zaten graf üzerinde dolaşıyor
Oracle yazısından Richmond en keskin ayrımı yapıyor: arayüz olarak dosya sistemi kazanır, temel katman olarak veritabanı kazanır
- Eşzamanlı erişim, büyük ölçekli semantik arama, tekilleştirme, güncellik ağırlıkları gibi ihtiyaçlar çıktığında sonunda kendi indeksinizi kurarsınız; bu da fiilen veritabanıdır
Dosya arayüzü evrensel olduğu ve LLM’lerin zaten anladığı bir yapı olduğu için güçlü; veritabanı tabanlı altyapı katmanı ise gerçek operasyonda gereken garantileri sağladığı için güçlü
Gelecek, dosya mı veritabanı mı tartışması değil; insanların ve ajanların etkileşim kurduğu arayüzün dosya olduğu, altında ise kullanım senaryosuna uygun bir temel katmanın yer aldığı yapı

Bu, kişisel bilişimin yeniden tanımlanması

Dosya sistemi, yapay zeka çağında kişisel bilişimin anlamını yeniden tanımlayabilir
- Veri, bağlam, tercihler, skill’ler ve bellek; kullanıcının sahip olduğu bir formatta bulunur, herhangi bir ajan tarafından okunabilir ve belirli bir uygulamaya kilitlenmez
- aboutme.md, bugün OpenClaw/NanoClaw’da da yarın çıkacak yeni bir araçta da çalışır
- Skill dosyaları taşınabilir, proje bağlamı ise araçlar arasında korunur
Bu, her şeyin kapalı SaaS uygulamalarına ve tescilli veritabanlarına taşınmasından önce kişisel bilişimin aslında hedeflediği şeye daha yakın
- Dosyalar orijinal açık protokoldür; yapay zeka ajanları bilişimin başlıca arayüzü haline geldikçe, araç değiştirmeyi, iş akışlarını birleştirmeyi ve uygulamalar arasında sürekliliği kimseden izin almadan mümkün kılan birlikte çalışabilirlik katmanı olurlar
Yine de bunun idealist bir yanı var: açık formatların tarihinde, kâğıt üzerinde kazanan ama pratikte başarısız olan çok sayıda standart var
- Şirketlerin, geçiş maliyetini korumak için kendi bağlam dosyalarını ince farklarla oluşturma teşviki güçlü
- CLAUDE.md, AGENTS.md ve .cursorrules dosyalarının tek bir evrensel format yerine bir arada bulunması bile varsayılan durumun parçalanma olduğunu gösteriyor
- ETH Zürich makalesi, bir format var olsa bile iyi bir bağlam dosyası yazmanın zor olduğunu ve kötü bir bağlam dosyasının hiç olmamasından daha kötü olabileceğini hatırlatıyor
Dan Abramov’un ana mesajı:
> Anılarımız, düşüncelerimiz ve tasarımlarımız onları üreten yazılımdan daha uzun yaşamalı
- Bu teknik bir tez değil, bir değer meselesi; dosya sistemi bu rol için en iyi teknoloji olduğu için değil, zaten kullanıcıya ait olan tek teknoloji olduğu için uygun

1 yorum

GN⁺ 2026-03-09

Hacker News yorumları

Dosyalar, kullanıcıların veriye doğrudan sahip olabilmesini sağlayan en temel özgürlük biçimidir
Bu, gizlilik, bütünlük ve erişilebilirlik üzerinde egemenlik kurmayı mümkün kılar
Dijital özgürlüğün temel eksenlerinden biri olarak, FOSS lisanslarıyla eşdeğer görülmelidir
- LLM'lerin muhakeme yeteneği sayesinde artık dosya yapısı konusunda endişelenmeye gerek kalmadı
  Doğal dil zaten dosyanın içinde yer alıyor ve okunabilirlik başlı başına bir spesifikasyon haline geliyor
  Okuması kolay olduğu sürece herkes dosyaya yazabilir ve REPL gibi anında çalıştırabilir
- Bu yüzden Apple gibi büyük teknoloji şirketlerinin dosya kavramını ortadan kaldırmaya yönelik girişimleri rahatsız edici
  Veriyi uygulamalara bağlıyorlar; verinin bağımsız biçimde var olmasını engelliyor ve içe/dışa aktarmayı zorlaştırıyorlar
  Ben de bu sorunu çözmek için, yedeklerden veriyi ince taneli dosya birimleri halinde çıkarıp kişisel bir dijital kütüphaneye taşıyan bir araç geliştiriyorum
  Değişmez veri için arşivlemek yeterli, ama düzenlenebilir veriyi yeniden uygulamalarda düzenlenebilen ‘canlı’ bir biçime döndürmek en büyük zorluk
- Yapılandırma dosyalarının, Windows Registry gibi merkezi depolardan çok daha iyi olduğunu düşünüyorum
  Geçici değişiklik yapmak ve paylaşmak kolay, ayrıca ayarların anlamı net biçimde tanımlanıyor
  Windows'un dosyalara üçüncü sınıf vatandaş muamelesi yapmasından hoşlanmıyorum
SaaS açısından da aynı şekilde düşünüyorum
Kod ne kadar geçici ve alan-özel olursa olsun, veri (dosyalar) standart ve sıkıcı olacak kadar kararlı olmalıdır
Yalnızca belirli bir uygulamanın okuyabildiği formatlar teknik borçtur ve sonunda projeyi batırır
1995'ten kalma bir JPEG dosyasını bugün hâlâ açabiliyor olmamızın nedeni, onun yazılıma bağımlı olmamasıdır
- 10 yıldan eski fotoğraf yönetim sistemim, dosya sistemi ile EXIF'i tek doğruluk kaynağı olarak kullanıyor
  Bu, defalarca doğrulanmış doğru bir yaklaşım
  Google Photos ya da Immich gibi soyutlama katmanları sadece kullanım kolaylığı içindir; özünde önemli olan dosyalardır
  İşte de araştırma ve dokümantasyonu markdown ve csv dosyalarıyla yönetiyorum
  elodie proje bağlantısı
- Günümüz fotoğraf yönetimindeki sorun, düzenleme, etiket ve albüm bilgilerinin tamamen harici metadata olarak saklanması
  Platform değiştirince tüm düzenleme geçmişi kayboluyor
  Geri alma özelliği kullanışlı olsa da, bu tür değişikliklerin taşınabilir olacak şekilde standartlaşmasını isterim
Bell Labs'in Plan 9'ından söz etmek istiyorum
Plan 9 from Bell Labs
- Ben agenc adlı bir ajan orkestratörü geliştiriyorum
  Claude'a önceki çalışmaları sorduğumda Plan 9'u önerdi; tam da bugün ihtiyacımız olan kavram bu
  Ajan yetkilerini en aza indirme felsefesi, kurumsal güvenlik modeliyle aynı
  Sadece Plan 9 fazla erken ortaya çıktı
- Yeni bir dosya sistemi olarak GeFS'e bakmaya değer
Plan 9 ve UNIX'in haklı olduğunu yeniden fark ettiriyor
En güçlü arayüz, dosya sistemi üzerindeki metin dosyalarıdır
Artık 9p2026'yı yeniden yapmanın zamanı geldi
Ancak yazıdaki bazı temel kavramlar yanlış — dosya sistemi bir ağaç değil, döngü içerebilen bir graftır
- Plan 9'un çekirdek özelliğinin ne olduğunu, bunun FUSE ile eklenip eklenemeyeceğini ya da daha derin bir sihir gerektirip gerektirmediğini merak ediyorum
Bu bana da çok dokunan bir konu
Son 1 yılda 10'dan fazla SaaS hizmetinden kişisel verilerimi tek bir dizin yapısına taşıdım
İyi organize edilmiş bir dosya sistemi, tek kullanıcı için yeterli ve veri parçalanmasını ortadan kaldırıyor
Gelecekte, dosya sistemini opak hale getirmeden güvenli çok kullanıcılı yazmayı destekleyen yeni veritabanları çıkacak gibi görünüyor
QMD'nin arama için oynadığı role benzer bir his veriyor
Şu anda AI kullanımı hâlâ olgunlaşmamış bir aşamada
Üretim sistemleri tutarlı ve ölçeklenebilir veri yapıları üzerinde çalışacaktır, ama bunları inşa eden ajanlar dosya sistemi tabanlı teknolojileri kullanacaktır
UI'ın masaüstünden uzaklaşıp sesli ve görsel arayüzlere evrileceğini düşünüyorum
Örneğin görüntülü görüşmelerde yüz ifadesi ve tonlamayı okuyarak daha fazla bağlam edinmek gibi
- Yakın zamanda izlediğim AI demo videosu, ses ve jestlerden bağlam çıkarıp bunu metne dönüştürdükten sonra LLM'e veriyor
  Tam anlamıyla multimodal değil ama çok ilgi çekiciydi
- Yine de metin girişi ortadan kalkmayacak gibi geliyor
  Yazmak düşünceleri düzenlemeye yardımcı olur ve konuşma kadar doğaçlama değildir
  Konuşma tanıma (STT) ne kadar iyi olursa olsun, insan zekâsı hâlâ yazma merkezli işliyor
Dosyalar ancak bulunabildiğinde faydalıdır
Yani arama ve indeks zorunlu; ama ölçek büyüdükçe bunlar bozulmaya başlar
Bu yüzden asıl soru, ‘ajanın işlediği bilgi tabanı ne kadar büyük olabilir?’
Bu konuyu “a good agentic KB” yazısında birinci ilkeler düzeyinde inceledim
Kod tabanı gibi iyi düzenlenmiş çok sayıda dosyada kodlama ajanları bilgiyi iyi buluyor
Ama dağınık verilerde dosya sistemiyle yapılandırmak çok daha zor
Bu, vektör DB'de anlamsal arama yapmaktan daha karmaşık
Kod tabanları DRY ilkesi sayesinde doğal olarak bir graf yapısını korur, ama kod dışı verilerde bu geçerli değil
Bu yüzden dosya sisteminin uzun vadede iyi bir bağlam yapısı olduğuna katılıyorum, ancak aramanın yerini henüz tamamen alamaz
Dosya sisteminin berbat bir soyutlama olduğunu düşünüyorum
Dosyaları dizin ağacı gibi bilinçli bir yapıya asmak zorunda olmak verimsiz
İlişkisel model ya da benzersiz tanımlayıcı tabanlı yapılar daha iyi olabilir
- Dosya sisteminin avantajı, değişikliğin yerelliğini korumasıdır
  Bir daldaki değişiklikler diğer dalı etkilemez
  Buna karşılık veritabanlarında UPDATE ya da DELETE tüm yapıyı etkileyebilir ve bu yüzden risklidir
  Bu nedenle modern işletim sistemlerindeki gibi, ağaç yapısının üstüne DB indeksi ekleyen hibrit yaklaşım idealdir
- NTFS içeride MFT veritabanı kullanır
  Dosya adlarını b+tree ile indeksler ve dosya verisini de MFT içinde saklar
  Dizinler sadece ‘directory=true’ özniteliğine sahip satırlardır
  WinFS gibi tamamen ilişkisel yaklaşım performans sorunları nedeniyle başarısız oldu; onun yerini Skydrive aldı
- Çoğu dosya sisteminde dosyalar inode ile benzersiz biçimde tanımlanır ve birden fazla bağlantıyla referans verilebilir
  Bu nokta sık sık unutuluyor gibi görünüyor
- UUID insanlar için opaktır ama ajanlar için kusursuz biçimde ayırt edilebilir bir tanımlayıcıdır
  Sonuçta yönün, S3 tarzı blob depolamanın üzerine iyi bir indeks koyup dizinleri etiket gibi istek üzerine oluşturulan yapılara dönüştürmek olacağını düşünüyorum
  Sonunda geriye sadece “Q3 ile ilgili materyaller bu dizinde” türü gruplama işlevi kalabilir

Dosya sistemleri neden ilgi görüyor

Everyone is talking about files : Her yerde dosyalar konuşuluyor

Bağlam penceresi bellek değildir

ETH Zürich araştırması: bağlam dosyalarının paradoksu

Dosya formatı API’nin kendisi — ama hangi dosya?

Darboğazın yeri değişiyor

Dosya sistemi zaten bir grafik

Bu, kişisel bilişimin yeniden tanımlanması

İlgili okumalar

1 yorum

Hacker News yorumları