21 puan yazan GN⁺ 2024-03-15 | 2 yorum | WhatsApp'ta paylaş

Excel ile yapay zeka öğrenmek

  • Excel'de uygulanmış gerçek bir LLM üzerinden yapay zekanın nasıl çalıştığını öğrenmek
  • GPT-2'nin Forward Pass'ini harici API çağrıları olmadan yalnızca Excel fonksiyonlarıyla uygulamak
  • E-tabloları anlayabiliyorsanız yapay zekayı da anlayabileceğiniz hedefleniyor
  • Ders 1: Excel ile GPT'yi anlamak
  • Ders 2: Byte Pair Encoding ve Tokenization
  • Ek: Excel uygulamasını ayrıntılı inceleme (Transformers'ı anlayanlara yönelik)
  • XLSB (Excel Binary) formatında olduğu için indirip çalıştırabilirsiniz (Mac/Windows mümkün, ancak Windows öneriliyor)
  • Uygulamanın sınırlamaları
    • BPE, multi-head attention ve multilayer perceptron aşamalarını içeren tam küçük GPT-2 (124M parametre) modeli
    • Yalnızca inference/forward pass mümkün (eğitim yok)
    • Bağlam 10 token uzunluğuyla sınırlı
    • Kelime başına 10 karakter sınırı
    • Yalnızca zero temperature çıktı mümkün

SSS

  • Google Sheets hakkında: Bu proje Google Sheets'te başladı, ancak tüm model fazla büyük olduğu için Excel'e taşındı. Google Sheets'te çalıştırma yöntemi hâlâ araştırılıyor, ancak tek bir dosya olarak Excel'deki kadar uygun olmayabilir.
  • Neden ChatGPT gibi sohbet edemiyor: Çok kısa bağlam uzunluğuna ek olarak, onu sohbet odaklı bir chatbot'a dönüştüren instruction tuning ve insan geri bildiriminden pekiştirmeli öğrenme (RLHF) eksik.
  • İsmin kökeni: "Spreadsheets-are-all-you-need" adı, Transformer makine öğrenimi mimarisini ilk kez açıklayan ünlü "Attention Is All You Need" makalesinin başlığına gönderme yapıyor.

GN⁺ görüşü

  • Bu proje, yapay zeka ve makine öğrenimine erişilebilirliği artırmaya katkı sağlıyor. Excel gibi tanıdık bir araç kullanarak karmaşık teknolojileri anlaşılır hâle getirmesi, uzman olmayanların da yapay zekanın temel ilkelerini öğrenmesine fırsat veriyor.
  • Excel üzerinden yapılan uygulama, gerçek yapay zeka modellerinin nasıl çalıştığını görsel olarak anlamak için faydalı olsa da, gerçek yapay zeka geliştirmede kullanılmıyor. Bu nedenle yapay zekayı bu şekilde öğrenmek, sizi profesyonel bir yapay zeka geliştiricisi yapmaz.
  • Bu tür eğitim araçları, genel kamuoyunun yapay zekaya ilgisini artırabilir ve yapay zeka teknolojilerinin demokratikleşmesine katkı sağlayabilir. Ancak gerçek yapay zeka sistemleri kurarken daha uzmanlaşmış araçlara ve framework'lere ihtiyaç vardır.
  • Benzer eğitim amaçlı projeler arasında Google'ın Machine Learning Crash Course'u veya Coursera'daki Andrew Ng'nin Machine Learning dersi bulunuyor. Bu dersler, teori ile pratiği birleştirerek daha derinlemesine öğrenme sunuyor.
  • Bu teknolojiyi benimserken, bunun gerçek yapay zeka modeli geliştirmeden farklı bir yaklaşım gerektirdiğini anlamak gerekir. Bu proje eğitim amaçlıdır; gerçek yapay zeka geliştirme projelerinde ise genellikle TensorFlow ve PyTorch gibi uzman AI framework'leri kullanılır.

2 yorum

 
GN⁺ 2024-03-15
Hacker News görüşleri
  • İçerik üreticisinin selamı ve teşekkürü

    • Proje yaratıcısı: Gönderiyi paylaştığınız için teşekkür ediyor; soru ve önerilere yanıt vermeyi ve insanların LLM'leri (Large Language Models) daha iyi anlamasına yardımcı olmayı umuyor. Bir sonraki video embedding'ler hakkında ve yakında tamamlanacak.
  • Elektronik tablolar kullanarak sinir ağı eğitimi

    • Jeremy Howard: Yıllardır sinir ağlarını (NNs) elektronik tablolarla öğretiyor ve bu yöntemin eğitici ve sezgisel olduğunu söylüyor.
  • Elektronik tablolarla sinir ağlarını açıklamak

    • Artık arkadaşlarıma "sadece curve fitting" demek yerine "sadece bir elektronik tablo" diyebilirim.
  • Elektronik tablo bağlantısının paylaşılması

  • RLHF gerekliliğine dair soru

    • Büyük dil modellerini bir sohbet botuna dönüştürmek için gerekli olan instruction tuning ve insan geri bildiriminden pekiştirmeli öğrenme (RLHF) olmadan da bunun mümkün olup olmadığı sorgulanıyor.
  • GPT-2'nin elektronik tabloda uygulanışına hayranlık

    • GPT-2'nin elektronik tabloda nasıl uygulandığı etkileyici bulunuyor ve yazara bu projenin open source olup olmayacağı soruluyor.
  • Elektronik tabloda GPT-3 veya GPT-4 uygulama olasılığı

    • Elektronik tabloların neden GPT-3 ya da GPT-4'ü uygulayamayacağı merak ediliyor.
  • LLM'leri anlamaya yardımcı olan harika bir proje

    • Bu proje harika bulunuyor ve LLM'leri (Large Language Models) anlamaya yardımcı olması için 7 kişiye gönderildiği belirtiliyor.
  • Excel'de PDE çözme örneğinin paylaşılması

    • Excel'de kısmi diferansiyel denklemleri (PDEs) çözmeye dair örnekler olduğu paylaşılıyor. FFT (Fast Fourier Transform) ve özel fonksiyonlar biliniyordu, ancak bunun ilginç ve eğlenceli göründüğü söyleniyor.
  • Yatırım bankalarını müşteri edinen bir yapay zeka şirketi

    • Yatırım bankalarını müşteri olarak hedefleyen bir yapay zeka şirketi fikrinin oldukça akıllıca olduğu söyleniyor.