Fly.io, artık GPU’lu
(fly.io)Yapay zeka gerçekten harika
- Fly.io, işlem gücünü kullanıcıya yakın konumlara yerleştirebilen yeni bir genel bulut hizmetidir.
- Artık GPU kullanarak edge bilişim ortamında yapay zeka iş yüklerini çalıştırabiliyor.
- Fly.io, tam yığın uygulamaları veya Fly Machines API tabanlı geliştirme platformlarını kullanıcıya yakın yerlerde çalıştırmayı sağlıyor.
Fly.io GPU ile gerçek kullanım örnekleri
- Fly.io’nun bulut omurgası üzerine kendi kodunuzu ve tercih ettiğiniz modeli dağıtabilirsiniz.
- Fly.io GPU ile Ollama’yı (metin üretimi tarafındaki dostlar) çalıştıran bir GPU uygulamasını iki adımda kolayca ayağa kaldırabilirsiniz.
fly.tomldosyasına yapılandırma ekleyipfly apps create sandwich_ai && fly deploykomutunu çalıştırarak uygulamayı dağıtabilirsiniz.
Işık hızının bir sınırı var
- GPU’ları hızlıca devreye almak güzel, ancak Fly.io asıl gücünü edge’de çıkarım çalıştırmada gösteriyor.
- Örneğin kullanıcı mutfağındaki malzemeleri girer girmez anında sandviç tarifi alabileceği bir uygulama düşünülebilir.
- Fly.io, dünya çapındaki veri merkezlerinde GPU bulunduruyor ve GPU desteği olan tüm bölgelerde aynı programı çalıştırmanıza olanak tanıyor.
Yalnızca gerçekten gerektiğinde
- GPU’lar güçlü paralel işlem cihazlarıdır, ancak ucuz değillerdir.
fly.tomldosyasınaservicesbölümü ekleyerek uygulamanın nasıl ölçekleneceğini belirleyebilirsiniz.- Böylece kullanıcılar sandviç tarifi istemediğinde GPU maliyeti ödemeyecek şekilde ayarlayabilirsiniz.
Ayrıntılar
- ABD, Avrupa ve Sidney’de birden fazla bölgede kullanılabilen GPU’lar sunuyor.
- Çeşitli GPU seçenekleri ve fiyatlar sunuluyor; varsayılan olarak tüm dağıtımlarda sekiz AMD EPYC CPU çekirdeği kullanılıyor.
- 500 GB’a kadar volume bağlanabiliyor; ayrıca rezervasyonlu instance’lar ve dedicated host’lar için indirimler de sunuluyor.
GN⁺ görüşü:
- Fly.io, yapay zeka iş yüklerini edge bilişim ortamında çalıştırabilen yenilikçi bir bulut hizmeti sunarak kullanıcı deneyimini iyileştirmeye odaklanıyor.
- GPU tabanlı hizmet, hem hızlı çıkarım hızını hem de maliyet verimliliğini gözeten bir çözüm sunuyor; özellikle gerçek zamanlı olarak yüksek işlem gücü gerektiren uygulamalar için uygun.
- Bu hizmet, yapay zeka teknolojilerine erişimi artırabileceği ve geliştiricilerin yeni, yenilikçi uygulamalar oluşturmasına yardımcı olabileceği için oldukça ilgi çekici ve faydalı bir gelişme.
1 yorum
Hacker News yorumları
cogdosyalarını çalıştırıp çalıştıramadığını ve aynı tahmin API’siyle önceden paketlenmiş modelleri çalıştırıp çalıştıramadığını merak ediyor. replicate yüzünden tereddüt edebileceğini, ancak bunun benimsenmesinin daha sorunsuz bir deneyim sağlayacağını düşündüğünü söylüyor.