- MK-1, OpenAI, Anthropic ve Google gibi seçkin yapay zeka devleriyle eşdeğer veya daha iyi yeteneklere sahip yapay zeka modelleri sunmayı hedefleyen yeni bir şirket.
- Şirketin ilk ürünü olan MKML, yalnızca birkaç satır Python koduyla GPU üzerinde büyük dil modeli (LLM) çıkarım maliyetini 2 kat azaltabilen bir çıkarım çalışma zamanıdır.
- MKML, Hugging Face ve PyTorch gibi popüler ekosistemlerle uyumludur.
- MKML şu anda kapalı beta sürüm aşamasındadır ve ilk iş ortaklarını aramaktadır.
- MKML, yapay zeka modellerinin bellek kullanımını azaltıp hızını artırarak optimize edilmesine yardımcı olabilir. Örneğin, Llama-2 13B modelini 26GB'den 10.5GB'ye düşürebilir ve forward pass çıkarım süresini 2.3 kata kadar azaltabilir.
- MKML, yapay zeka modellerini maliyet veya hız odağıyla optimize etmek için kullanılabilir. Maliyet optimizasyonu senaryosunda modelin daha ucuz GPU instance'larına sığmasını sağlayabilir ve daha pahalı instance'larda temel modelden daha hızlı çalıştırabilir. Hız optimizasyonu senaryosunda ise MKML, modeli 2.0 kata kadar hızlandırarak daha fazla kullanıcıya hizmet verilmesini sağlayabilir.
- MKML, mevcut iş akışlarına kolayca entegre edilebilir. Bu süreç, MKML'in model codec'lerinden biriyle modeli bir kez sıkıştırmayı, sıkıştırılmış modeli diske kaydetmeyi ve ardından çıkarım için yüklemeyi içerir.
- MKML, çeşitli model boyutlarını ve sistem yapılandırmalarını destekler ve hız testlerinde tutarlı biçimde temel çizgiden daha hızlıdır.
- MKML ayrıca özgün modele yüksek sadakat korur ve standart perplexity ölçümlerinde ihmal edilebilir farklar gösterir.
- MK-1'in uzun vadeli vizyonu, tüm çıkarım yığınında yapay zekanın performansını sınırlarına kadar taşımaktır. Gelecekteki geliştirmeler için iddialı bir yol haritaları vardır.
1 yorum
Hacker News görüşleri