6 puan yazan GN⁺ 2024-06-30 | 2 yorum | WhatsApp'ta paylaş
  • Meta, Code Llama tabanlı; kod optimizasyonu ve derleyici işlevleri sunan LLM Compiler model ailesini duyurdu
  • Bu modeller şu yeteneklere sahip:
    • Derleyici emülasyonu
    • Kod boyutu optimizasyonu için en iyi geçişlerin tahmini
    • Kodun disassembly işlemi
  • Yeni optimizasyon ve derleyici görevleri için ince ayar yapılabiliyor

Başlıca özellikler

  • Kod boyutu optimizasyonu ve disassembly alanında en üst düzey sonuçlara ulaşıyor
  • Yapay zekanın kod optimizasyonunu öğrendiğini ve derleyici uzmanlarının optimizasyon fırsatlarını belirlemesine yardımcı olabileceğini gösteriyor

Modelin yayımlanması

  • LLM Compiler 7B ve 13B modelleri, hem araştırma hem de ticari kullanım için izin veren esnek bir lisansla yayımlandı
  • Geliştiricilerin ve araştırmacıların bu modellerden kolayca yararlanmasını ve bu alanda yeni araştırmalar yapmasını destekliyor

2 yorum

 
ragingwind 2024-07-01

Fikir ilginç görünüyor.

 
GN⁺ 2024-06-30
Hacker News görüşü
  • LLM’leri derleyici/geri derleyici olarak kullanmak ilginç bir uygulama
  • Derleyicilerde güvenilirlik ve doğruluk önemlidir
  • LLM’ler doğaları gereği öngörülemez olduğundan, bunları build pipeline’ına dahil etmek tuhaf hissettiriyor
  • Makalede, CodeLlama’dan başlayarak model üç görev için eğitilmiş
    • İlk görev derleme: girdi kodu ve derleyici bayrakları verilerek çıktı assembly’sini tahmin etmek
    • İkinci görev derleyici bayrağı tahmini/optimizasyonu: assembly boyutunu optimize etmek
    • Üçüncü görev geri derleme: önceki yaklaşımlara göre avantaj sağladığını iddia ediyor
  • Geri derleme yaklaşımının doğrulanabilirliği konusunda sorun var
  • Doğruluğu kontrol etmek için geri derlenen kodu yeniden derleme yöntemi kullanılıyor
  • Doğruluk yaklaşık %45, yani henüz güvenilir değil; ancak geleneksel geri derleyicilerle birlikte kullanılırsa faydalı olabilir
  • Bu modelin performans optimizasyonuna genişletilip genişletilemeyeceğini araştırmak isterdim
  • LLM’lerin sezgi sağladığı ve sistemlerin bunu mekanik/katı bir şekilde işlediği yapıların artacağını düşünüyorum
  • LLM’lerin girdinin anlamını koruyup korumadığını nasıl doğrulayabileceğimizi merak ediyorum
  • Önceki araştırmalar GitHub’da görülebilir
  • Twitter bu araştırmadan etkilenmişti, ama programları bozma ihtimalinin yüksek olduğunu düşünüyorum
  • Meta’nın diğer yapay zeka makalelerinden farklı olarak, bunun Instagram, Facebook veya Meta’da kullanıldığına dair bir ifade yok
  • "LLM Compiler" yerine "Compiler LLM" daha doğru bir ad gibi görünüyor
  • Bu çalışmanın amacını anlayamıyorum
  • <i>Deus Ex</i> oyununda Meta Technologies Neural Optimizer ve Disassembler ticareti yaptığımı hatırlıyorum