2 puan yazan GN⁺ 2024-12-07 | 1 yorum | WhatsApp'ta paylaş
  • Llama 3.3 koleksiyonu
    • Bu koleksiyon, Llama 3.3'ün dönüştürücülerini ve orijinal deposunu içeriyor
    • En son 8 saat önce güncellendi
    • Toplam 1 öğe içeriyor

1 yorum

 
GN⁺ 2024-12-07
Hacker News görüşleri
  • Llama 3.2 405B ile karşılaştırıldığında performansının benzer veya biraz daha iyi olduğu görülüyor

    • Zuck'a göre bu, Llama 3 serisinin son sürümü ve Llama 4'ün 2025'te çıkması planlanıyor
    • Steve Jobs'ın Dropbox hakkında söylediği ünlü "bu bir ürün değil, bir özellik" sözünü hatırlatıyor
    • Meta, güçlü bir modeli açık kaynak olarak sunarak yapay zekayı metalaştırıyor ve bunun üzerinden Facebook ile Instagram hizmetlerini güçlendirebiliyor
    • Burada yapılan şey yapay zeka satmak değil, yapay zekayı kullanarak ana işi güçlendirmek
    • Açık kaynak olarak sunarak geniş çapta benimsenme ve geliştirilme avantajı elde edilebiliyor
  • Kendi benchmark'larımızda beklenenden daha iyi performans gösteriyor

    • Daha derin inceleyeceğiz ama etkileyici görünüyor
  • Şu anda iyi bir "genel amaçlı" Mac masaüstü istemcisi üzerine tartışma sürüyor

    • Ollama, ChatGPT, Claude, Perplexity vb. kullanmak istiyorum
    • Farklı uygulamalarda AI sohbeti kullanmak istiyorum; bunun bir masaüstü uygulaması olması şart değil
    • MacMind hoş ama başka API'lerin frontend'i olarak oldukça maliyetli
    • "Cimri olma" yanıtı da makul
  • Birçok benchmark'ta GPT-4o'ya benzer performans gösteriyor

  • Hugging Face'e 4bit bitsandbytes, GGUF'ler ve orijinal 16bit ağırlıklar yüklendi

    • Llama 3.3 70B, 48GB VRAM'in altında 2 kat daha hızlı fine-tune edilebiliyor ve bellek kullanımı %70 azaltılabiliyor
  • OpenRouter'da 1M token fiyatını takip ediyorum ve her yenilemede fiyat düşüyor

  • Llama'nın açık kaynak yapılması, "Commoditize Your Complement" stratejisinin harika bir örneği

    • Bu stratejiyi duymamış olanlar için Gwern'in "Laws of Tech: Commoditize Your Complement" bağlantısı verilmiş
  • Hugging Face modeli hakkında sorular

    • Dizüstü bilgisayarda JupyterLab üzerinden çalıştırılabilir mi
    • Ne gibi avantajları var
    • Düzenli olarak güncellenebilir mi
    • Belirli kullanım amaçlarına göre fine-tune edilebilir mi
    • Bir modeli fine-tune etmek ne kadar zaman ve emek gerektirir
    • Hugging Face'in bu sorulara yanıt veren bir URL sağlayıp sağlamadığına dair talep
  • Meta, OpenAI/Anthropic'i hedef alarak güçlü açık modeller yayımlıyor ve beklentileri sürekli aşıyor

    • En büyük faydayı geliştiriciler görüyor