Microsoft Phi-2 modeli MIT lisansına geçirildi
(huggingface.co)- Phi-2’nin Hugging Face deposundaki
7e10f3ecommit’inde LICENSE, NOTICE.md ve README.md olmak üzere 3 dosya değişti; lisans gösterimi MIT’ye çevrildi - Yeni LICENSE dosyası, MIT License metninin tamamıyla değiştirilerek kullanım, kopyalama, değiştirme, dağıtım, yeniden lisanslama ve satışı geniş biçimde izinli hale getiriyor
- Mevcut Microsoft Research License’ta yer alan tersine mühendislik yasağı, bağımsız barındırma kısıtlaması, kişisel veri işleme, tahkim ve tazminat sorumluluğu sınırlaması gibi birçok madde kaldırıldı
- README metaverisi,
license_name: microsoft-research-licenseyerinelicense: mitkullanıyor; mevcut LICENSE bağlantısı korunuyor - Yeni NOTICE.md, flash-attention’ı üçüncü taraf bileşen olarak bildiriyor ve BSD 3-Clause License ile LGPL kütüphane değişikliklerinde hata ayıklama amacıyla sınırlı tersine mühendisliğe izin veren ifadeyi içeriyor
Commit’te değişen dosyalar
- Hugging Face’teki
microsoft/phi-2deposunun commit’i “Upload 3 files” olarak görünüyor; değişenler LICENSE, NOTICE.md ve README.md olmak üzere 3 dosya - Browse files üzerinden ilgili commit durumundaki dosya listesi görülebilir
LICENSE: Microsoft Research License’tan MIT License’a değiştirildi
- LICENSE dosyasında mevcut lisans metni kaldırıldı ve MIT License metninin tamamıyla değiştirildi
- Yeni LICENSE,
PhyAGI.veCopyright (c) Microsoft Corporation.ifadelerinin ardından MIT License’ı içeriyor - MIT License, yazılımı ve ilişkili dokümantasyon dosyalarını edinen herkese aşağıdaki hakları ücretsiz olarak tanıyor
- Kullanma, kopyalama, değiştirme, birleştirme
- Yayımlama, dağıtma, yeniden lisanslama
- Yazılım kopyalarını satma
- Yazılımın sağlandığı kişilere aynı hakları verme
- Şart, telif hakkı bildirimi ve izin bildiriminin yazılımın tüm kopyalarına veya esaslı kısımlarına dahil edilmesi
- Garanti reddi AS IS biçiminde yer alıyor; satılabilirlik, belirli bir amaca uygunluk ve ihlal etmeme garantileri dahil olmak üzere açık veya zımni hiçbir garanti verilmiyor
- Telif hakkı sahipleri ve hak sahipleri, yazılımın kullanımı veya diğer işlemlerden doğan taleplerden, zararlardan ya da sorumluluklardan sorumlu tutulmuyor
Kaldırılan önceki kısıtlama maddeleri
- Önceki LICENSE’tan çeşitli kısıtlamalar ve hukuki maddeler kaldırıldı
- Kaldırılan maddeler şunları içeriyor
- Materyallerin tersine mühendisliği, decompile edilmesi ve disassemble edilmesi yasağı
- Microsoft veya tedarikçilerin bildirimlerini kaldırma, küçültme, engelleme ya da değiştirme yasağı
- Yasalara aykırı biçimde veya kötü amaçlı yazılım oluşturma/dağıtma amacıyla kullanım yasağı
- Materyalleri paylaşma, yayımlama, dağıtma, kiralama; bağımsız barındırma çözümü sunma; üçüncü tarafa devretme yasağı
- Kişisel verilerle ilgili kısıtlamalar da kaldırıldı
- Kişiyi tanımlayabilecek verilerin onaylanmış ve rıza verilmiş amaçlar dışında kullanılmaması gerekiyordu
- Kişilerle iletişim kurmak için kullanılmaması gerekiyordu
- Araştırma tamamlanır tamamlanmaz kişisel verilerin ve yedeklerin/kopyaların imha edilmesi gerekiyordu
- Microsoft’a değişikliklerin sağlanması halinde Microsoft’a geniş kapsamlı bir lisans verileceğine ilişkin madde de kaldırıldı
- Ayrıca yayımlama, geri bildirim, ihracat kısıtlamaları, destek hizmetleri, ABD içinde tahkim ve toplu dava feragati, uygulanacak hukuk, tüketici hakları, garanti reddi ve tazminat sorumluluğu sınırlaması maddeleri kaldırıldı
README metaverisi değişikliği
- README.md’nin front matter bölümünde lisans gösterimi değişti
- Kaldırılan öğeler şunlar
license:license_name: microsoft-research-license
- Yeni öğe
license: mit license_link: https://huggingface.co/microsoft/phi-2/resolve/main/LICENSEkorunuyorinference: falsevelanguage: - enöğeleri gösterilen diff’te korunuyor
NOTICE.md ve üçüncü taraf bileşen bildirimi
- Yeni NOTICE.md dosyası “NOTICES AND INFORMATION” ve “Do Not Translate or Localize” ifadeleriyle başlıyor
- Microsoft, bu yazılımın üçüncü taraf materyaller içerdiğini belirtiyor
- Microsoft’un bazı açık kaynak kodları
https://3rdpartysource.microsoft.comadresinden sağlanıyor veya ürün adı, açık kaynak bileşen adı, platform ve sürüm numarasıyla birlikte US $5.00 tutarında çek ya da posta havalesi gönderilerek talep edilebiliyor - Diğer koşullardan bağımsız olarak, GNU Lesser General Public License ile lisanslanmış kütüphane değişikliklerinde hata ayıklamak için gerekli kapsamda bu yazılıma tersine mühendislik yapılabiliyor
- Bileşen olarak flash-attention yer alıyor
- flash-attention bildirimi BSD 3-Clause License içeriyor
- Kaynak yeniden dağıtımında telif hakkı bildirimi, koşullar listesi ve sorumluluk reddi korunmalı
- İkili dosya yeniden dağıtımında aynı bildirimler, koşullar ve sorumluluk reddi dokümantasyona veya diğer materyallere dahil edilmeli
- Önceden yazılı izin alınmadan telif hakkı sahiplerinin veya katkıcıların adları türev ürünlerin tanıtımında kullanılamaz
- BSD 3-Clause bildirimi, ilgili yazılımın da “AS IS” olarak sağlandığını ve doğrudan, dolaylı, arızi, özel, cezai veya sonuç niteliğindeki zararlardan sorumlu olmadığını belirtiyor
1 yorum
Hacker News yorumları
Böyle açık modellerin ortaya çıkması gerçekten heyecan verici.
İlginç olan, yapay zeka “etikçileri”nin güvenliği gerekçe göstererek makine öğrenimi modellerine erişimi kontrol eden bir tür yüksek rahipler sınıfı gibi davranmak istemesi. Ancak yapay zekanın en büyük riskinin, modelleri kontrol eden kişilerin bu modellerle insanların ne yazabileceğini kontrol edip sansürlemesinde olduğunu düşünüyorum.
Halkın elindeki açık kaynak modellerin, yapay zekanın gerçek risklerine karşı en iyi savunma olduğunu düşünüyor; bunu ileri taşıyan Facebook, Microsoft ve Mistral’i alkışlıyorum.
Sosyal medya özetleri yerine gerçek argümanları okumanız iyi olur. Düşündüğünüzden çok daha derin bir tartışma var; endişe duyduğunuz riskler de geniş biçimde ele alınıyor ve önerilen çözümler de var. Bu çözümlerin, “en iyi savunma” iddiasından gerçekten işe yarama olasılığı daha yüksek.
Bu araçların demokratikleşmesini de, güvenli ve etik kullanımını da önemseyen çok kişi var.
Kötü niyetli insanların lisans metnindeki ifadeleri gözetmesini beklemek, bir kontrol aracı olarak baştan pek iyi değildi. Yalnızca yasalara uyacak kadar iyi niyetli insanların ilerlemesini ve inovasyonunu engeller; Rusya, Kuzey Kore, Çin gibi yerlerde farklı niyetleri olan kişiler ya da suç örgütleri ve dolandırıcılar bu tür fikirlere bağlı kalmaz.
Düzgün bir açık kaynak lisansı altında çalışan topluluk büyüyor ve ilginç işler giderek daha hızlı gerçekleşiyor. Alternatif lisanslar etkisiz; o toplulukla bağı koparıyor, iş birliğini karmaşıklaştırıyor ve genel araştırma içinde giderek azınlık hâline geliyor. Bu yüzden bu tür lisanslar giderek anlamsızlaşıyor.
Bunu düzeltmek, hukuki açıdan basit ve standart bir duruma geçmek demek; ticarileştirmeyi, iş birliğini ve araştırmayı kolaylaştırır. Microsoft’un bunda değer olduğunu makul biçimde kabul edip gerçekliğe uyum sağladığı görülüyor.
Önceden ticari olmayan lisans olduğu için heyecanım biraz azalmıştı.
Performansı ve boyutu düşünüldüğünde ticari kullanıma uygun bir lisansa geçmesi oldukça büyük bir olay.
Bu modelde önemli olan, akıl yürütme becerisinin güçlü olması.
Ancak bomba yapmayı öğrenmek vb. ya da “kötü işler” yapmamak için özellikle büyük ölçekli web tarama veri kümeleriyle eğitilmedi.
Bu yüzden aynı sınıftaki, hatta daha büyük parametreli modellerle karşılaştırıldığında “en akıllıca düşünen” model olsa da dünya bilgisi veya genel kültür açısından görece eksik.
Bu ileride değişebilir, ama mevcut durumun böyle olduğunu düşünüyorum.
Çünkü yanıtın web’den öğrendiği şeylere değil, benim sağladığım verilere dayanmasını istiyorum.
Pek çok iş için genel bilgi gerekmez; özellikle RAG’de bu avantaj büyüktür.
Veriyi arama yoluyla sağlamak daha iyi; bunun sonucunda “akıllıymış gibi görünen ama tamamen yanlış” yanıtlar azalır.
İçine gömülü veri azsa, sohbet asistanı alanı dışında da daha genel amaçlı kullanılabilir. Çünkü çoğu durumda modelin yalnızca kullanıcının sağladığı verileri bilmesini isteriz.
Örneğin bir orta çağ fantezi oyununda bir karakterin birden ABD siyaseti hakkında konuşmaya başlaması çok tuhaf olurdu. Phi-2 de ince ayar olmadan bunu tamamen çözmez, ama anlatılmak istenen yön bu.
Modelden çok veri kümesini merak ediyorum.
Harika bir değişiklik ve bağımsız açık kaynak projelerinin neden önemli olduğunu da gösteriyor.
TinyLlama’nın Apache 2.0 lisansıyla yayımlanmasının bu değişiklikte etkisi olmadığını söylemek zor.
Bu, Phi-3 ve sonraki nesil modellerin Phi-2’yi eski hâle getireceğinin bir işareti gibi görünüyor.
Bu model epey uzun süre üst sıralardaydı; onu bu kadar iyi yapan ne?
Telefon gibi küçük cihazlarda bile çalıştırılabilirken GPT-3.5’e yakın performans veren en iyi model.
Mimarisi ve eğitim verileri de ilginç. Seçilmiş sentetik veriler kullanan seyrek bir model olduğu için rastgele internet metinleriyle eğitilmiş modellere kıyasla çok daha yüksek doğruluk sağlıyor.