- Yakın tarihli bir MIT Technology Review yazısında yerel LLM’leri çevrimdışı yedek Wikipedia ile karşılaştırma fikri tanıtılıyor
- Ollama kütüphanesindeki başlıca LLM model dosya boyutları ile Kiwix’in sunduğu çevrimdışı Wikipedia paketlerinin boyutları doğrudan karşılaştırılıyor
- LLM dosyaları ile Wikipedia verileri amaç, güçlü yönler ve zayıf yönler açısından farklı olduğundan basit bir karşılaştırma yapmak zor, ancak depolama boyutu açısından ilginç farklar var
- Bazı LLM’ler (1~4GB modeller) basit İngilizce Wikipedia’dan (yaklaşık 1GB) daha büyükken, tam Wikipedia (57GB) büyük LLM’lerden (20~32GB) daha büyük
- Dosya boyutunun yanı sıra bellek, CPU gereksinimleri gibi pratik unsurlar da dikkate alınmalı; gerçek kullanım amacına göre seçim değişebilir
Yerel LLM’ler ile çevrimdışı Wikipedia karşılaştırması
Giriş ve karşılaştırmanın çıkış noktası
- MIT Technology Review’da kısa süre önce "How to run an LLM on your laptop" başlıklı bir yazı yayımlandı
- Yazı, LLM’leri yerelde çalıştırarak çevrimdışı ortamda da bilgiye erişilebilmesini vurguluyor
- Simon Willison’ın, "Çevrimdışı bir LLM, Wikipedia’nın özet ve eksik bir sürümü gibi; kıyamet sonrası bir senaryoda yalnızca bir USB ile toplumun yeniden ayağa kalkmasına yardımcı olabilir" benzetmesi dikkat çekici
Model ve veri boyutlarının karşılaştırması
- Ollama kütüphanesindeki çeşitli LLM modelleri ile Kiwix’in sunduğu çevrimdışı Wikipedia paket dosyalarının boyutları karşılaştırılıyor
- Karşılaştırma için, tipik tüketici donanımında çalışabilecek modeller ve görsel içermeyen Wikipedia verileriyle sınırlı kalınıyor
- Başlıca karşılaştırma sonuçları şöyle:
- En küçük özet sürümleri
- Best of Wikipedia (ilk 50 bin, özet sürümü): 356.9MB
- Simple English Wikipedia (özet sürümü): 417.5MB
- Temsili LLM modelleri (küçük)
- Qwen 3 0.6B: 523MB
- Deepseek-R1 1.5B: 1.1GB
- Llama 3.2 1B: 1.3GB
- Temsili LLM modelleri (orta-büyük)
- Deepseek-R1 8B / Qwen 3 8B: 5.2GB
- Gemma3n e4B: 7.5GB
- Deepseek-R1 14B: 9GB
- Qwen 3 14B: 9.3GB
- Wikipedia’nın tamamı
- Wikipedia (tamamı): 57.18GB
- Wikipedia’nın en popüler 50 bin maddesi 356.9MB ile oldukça küçük
- En küçük LLM (0.6B, Qwen) 523MB ile basit bir Wikipedia özet sürümünden daha büyük
- Wikipedia’nın tamamı (57.18GB), en büyük LLM’den (20GB) çok daha büyük
Karşılaştırmanın sınırları ve dikkat edilmesi gerekenler
- Doğrudan karşılaştırmak zor: Ansiklopedi (veri) ile LLM (üretken model) özünde amaç ve yapı olarak farklı
- Yalnızca dosya boyutu önemli değil: LLM’ler dosya boyutuna ek olarak çalışma sırasında bellek ve CPU kaynaklarına da ciddi ölçüde ihtiyaç duyar. Çevrimdışı Wikipedia ise düşük özellikli cihazlarda daha kolay çalıştırılabilir
- Gerçek kullanım amacına göre fayda: Örneğin sadece kimya alanı indirilebilir ya da belirli donanıma optimize edilmiş bir LLM kullanılabilir
- Seçim ölçütlerinin öznel olması: Karşılaştırmada kullanılan kalemlerin seçimi öznel
Sonuç ve çıkarımlar
- Wikipedia’nın en popüler 50 bin maddesi ile Llama 3.2 3B modeli dosya boyutu açısından benzer düzeyde
- En küçük Wikipedia paketi en küçük LLM’den bile daha küçük, Wikipedia’nın tam veri dosyası ise en büyük LLM’den daha büyük
- Yeterli depolamaya sahip ortamlarda hem LLM hem de Wikipedia verisini birlikte indirip kullanmak da değerlendirilebilir
1 yorum
Hacker News görüşü
gpgkeyiçinhttpkullanmıştı ve bu da güvenliği bozuyordu.Global Catastrophic Risksgibi kitapları koyamazsınız ama ilgili web sayfası gibi şeyler taranabilir gibi görünüyor.wikipedia_en_all_maxi_2024-01.zimdosyasını indiriyorum; sayfalarılibzimile çıkarıp LLM'e bağlamayı planlıyorum.zimdosyasında sayfalar HTML olarak saklanıyor ve boyutu yaklaşık 100GB. Bunu yapma nedenim, HDD'de büyük miktarda depolanmış bir oyun listesini (yalnızca başlıklar var, ayrı kategori yok) Wikipedia makaleleriyle eşleştirip tür ya da bilgiye göre düzenlemek istemem. Deneylerimde LLM'nin (Mistral Small 3.2 quantized) bu karmaşayı şaşırtıcı derecede iyi düzenlediğini gördüm.llama.cppile özel bir betikten hızlıca çalıştırılabiliyor.$1-distill-$2gibi adlandırılan modeller (bazen-distilleki olmadan) aslında $1 modelinin çıktılarıyla $2 modelinin eğitildiği “bilgi damıtma (distillation)” ürünleridir; yani ismin düşündürdüğünün aksine $1'in kendisi değildir. Makalede geçen “Deepseek-R1 1.5B” gibi bir model aslında doğrudan var olan bir şey değil, buna benzer bir durumdur.