Yinelenen dosyaları ve benim nasıl bir kullanıcı olduğumu söyleyen disk tarayıcı LLM diskscan
(argo9.com)Yayıncılıkta iş sırasında en zor şeylerden biri dosya ve klasör düzeni. Tek bir projeyi çoğu zaman birden fazla klasöre kopyalayarak ilerlediğimiz için yalnızca bende değil, çalışanların disklerinde de aynı klasörlerden çok sayıda oluşuyor.
Bunu 1 yıl önce zaten Python ile yapmıştım, ardından go whails ile uygulama haline getirdim; bu kez ise ilgili işlevleri Rust ile daha da geliştirerek hazırladım. Ayrıca dosya biçimlerine ve gizli dosyalara bakarak sizin nasıl bir disk kullanıcısı olduğunuzu da raporluyor.
Mac, Windows, Linux, NAS ve bulutta yinelenen dosyaları ve projeleri karşılaştırarak aynı dosya olup olmadığını, sürümün daha yeni olup olmadığını kontrol ediyor; çalışma dosyaları arasındaki gereksiz ._ gibi dosyaları da temizliyor.
Disk düzeyinde yinelenen karşılaştırması ve raporlama yapıyor; hash tabanlı olarak asılları karşılaştırıyor.
Diskteki dosyalara bakıp bir tür profil çıkarma işlevi var; ayrıca yeni olarak hangi projeler üzerinde çalıştığınıza dair bir rapor da veriyor. Yerel bir programdır; Ollama, LMStudio gibi yerel LLM'leri ve GeminiAPI, OpenAI API seçeneklerini kullanabilirsiniz.
İndirme bağlantıları
Mac
https://drive.google.com/file/d/…
Windows kurulum
1 yorum
Hash tabanlı olarak yinelenen dosyaları düzenleme kısmı istikrarlı bir yaklaşım gibi görünüyor.
Benzer bir sorunu pratikte yaşamıştım;
dosya adları aynı olsa bile gerçek içerik farklı olabiliyor ya da
ara çalışma dosyaları (
.tmp,._vb.) araya karıştığı içinbasit karşılaştırmayla düzenleme pek iyi sonuç vermiyordu.
LLM ile kullanıcı tipine kadar raporlanması ilgi çekici,
p bu rapor hangi ölçütlere göre oluşturuluyor?
Örneğin dosya yapısı veya uzantı dağılımı temelinde mi, merak ediyorum.