Microsoft Phi-2 modeli MIT lisansına geçirildi

(huggingface.co)

2 puan yazan GN⁺ 2024-01-08 | 1 yorum | WhatsApp'ta paylaş

Phi-2’nin Hugging Face deposundaki 7e10f3e commit’inde LICENSE, NOTICE.md ve README.md olmak üzere 3 dosya değişti; lisans gösterimi MIT’ye çevrildi
Yeni LICENSE dosyası, MIT License metninin tamamıyla değiştirilerek kullanım, kopyalama, değiştirme, dağıtım, yeniden lisanslama ve satışı geniş biçimde izinli hale getiriyor
Mevcut Microsoft Research License’ta yer alan tersine mühendislik yasağı, bağımsız barındırma kısıtlaması, kişisel veri işleme, tahkim ve tazminat sorumluluğu sınırlaması gibi birçok madde kaldırıldı
README metaverisi, license_name: microsoft-research-license yerine license: mit kullanıyor; mevcut LICENSE bağlantısı korunuyor
Yeni NOTICE.md, flash-attention’ı üçüncü taraf bileşen olarak bildiriyor ve BSD 3-Clause License ile LGPL kütüphane değişikliklerinde hata ayıklama amacıyla sınırlı tersine mühendisliğe izin veren ifadeyi içeriyor

Commit’te değişen dosyalar

Hugging Face’teki microsoft/phi-2 deposunun commit’i “Upload 3 files” olarak görünüyor; değişenler LICENSE, NOTICE.md ve README.md olmak üzere 3 dosya
Browse files üzerinden ilgili commit durumundaki dosya listesi görülebilir

LICENSE: Microsoft Research License’tan MIT License’a değiştirildi

LICENSE dosyasında mevcut lisans metni kaldırıldı ve MIT License metninin tamamıyla değiştirildi
Yeni LICENSE, PhyAGI. ve Copyright (c) Microsoft Corporation. ifadelerinin ardından MIT License’ı içeriyor
MIT License, yazılımı ve ilişkili dokümantasyon dosyalarını edinen herkese aşağıdaki hakları ücretsiz olarak tanıyor
- Kullanma, kopyalama, değiştirme, birleştirme
- Yayımlama, dağıtma, yeniden lisanslama
- Yazılım kopyalarını satma
- Yazılımın sağlandığı kişilere aynı hakları verme
Şart, telif hakkı bildirimi ve izin bildiriminin yazılımın tüm kopyalarına veya esaslı kısımlarına dahil edilmesi
Garanti reddi AS IS biçiminde yer alıyor; satılabilirlik, belirli bir amaca uygunluk ve ihlal etmeme garantileri dahil olmak üzere açık veya zımni hiçbir garanti verilmiyor
Telif hakkı sahipleri ve hak sahipleri, yazılımın kullanımı veya diğer işlemlerden doğan taleplerden, zararlardan ya da sorumluluklardan sorumlu tutulmuyor

Kaldırılan önceki kısıtlama maddeleri

Önceki LICENSE’tan çeşitli kısıtlamalar ve hukuki maddeler kaldırıldı
Kaldırılan maddeler şunları içeriyor
- Materyallerin tersine mühendisliği, decompile edilmesi ve disassemble edilmesi yasağı
- Microsoft veya tedarikçilerin bildirimlerini kaldırma, küçültme, engelleme ya da değiştirme yasağı
- Yasalara aykırı biçimde veya kötü amaçlı yazılım oluşturma/dağıtma amacıyla kullanım yasağı
- Materyalleri paylaşma, yayımlama, dağıtma, kiralama; bağımsız barındırma çözümü sunma; üçüncü tarafa devretme yasağı
Kişisel verilerle ilgili kısıtlamalar da kaldırıldı
- Kişiyi tanımlayabilecek verilerin onaylanmış ve rıza verilmiş amaçlar dışında kullanılmaması gerekiyordu
- Kişilerle iletişim kurmak için kullanılmaması gerekiyordu
- Araştırma tamamlanır tamamlanmaz kişisel verilerin ve yedeklerin/kopyaların imha edilmesi gerekiyordu
Microsoft’a değişikliklerin sağlanması halinde Microsoft’a geniş kapsamlı bir lisans verileceğine ilişkin madde de kaldırıldı
Ayrıca yayımlama, geri bildirim, ihracat kısıtlamaları, destek hizmetleri, ABD içinde tahkim ve toplu dava feragati, uygulanacak hukuk, tüketici hakları, garanti reddi ve tazminat sorumluluğu sınırlaması maddeleri kaldırıldı

README metaverisi değişikliği

README.md’nin front matter bölümünde lisans gösterimi değişti
Kaldırılan öğeler şunlar
- license:
- license_name: microsoft-research-license
Yeni öğe license: mit
license_link: https://huggingface.co/microsoft/phi-2/resolve/main/LICENSE korunuyor
inference: false ve language: - en öğeleri gösterilen diff’te korunuyor

NOTICE.md ve üçüncü taraf bileşen bildirimi

Yeni NOTICE.md dosyası “NOTICES AND INFORMATION” ve “Do Not Translate or Localize” ifadeleriyle başlıyor
Microsoft, bu yazılımın üçüncü taraf materyaller içerdiğini belirtiyor
Microsoft’un bazı açık kaynak kodları https://3rdpartysource.microsoft.com adresinden sağlanıyor veya ürün adı, açık kaynak bileşen adı, platform ve sürüm numarasıyla birlikte US $5.00 tutarında çek ya da posta havalesi gönderilerek talep edilebiliyor
Diğer koşullardan bağımsız olarak, GNU Lesser General Public License ile lisanslanmış kütüphane değişikliklerinde hata ayıklamak için gerekli kapsamda bu yazılıma tersine mühendislik yapılabiliyor
Bileşen olarak flash-attention yer alıyor
flash-attention bildirimi BSD 3-Clause License içeriyor
- Kaynak yeniden dağıtımında telif hakkı bildirimi, koşullar listesi ve sorumluluk reddi korunmalı
- İkili dosya yeniden dağıtımında aynı bildirimler, koşullar ve sorumluluk reddi dokümantasyona veya diğer materyallere dahil edilmeli
- Önceden yazılı izin alınmadan telif hakkı sahiplerinin veya katkıcıların adları türev ürünlerin tanıtımında kullanılamaz
BSD 3-Clause bildirimi, ilgili yazılımın da “AS IS” olarak sağlandığını ve doğrudan, dolaylı, arızi, özel, cezai veya sonuç niteliğindeki zararlardan sorumlu olmadığını belirtiyor

1 yorum

GN⁺ 2024-01-08

Hacker News yorumları

Böyle açık modellerin ortaya çıkması gerçekten heyecan verici.
İlginç olan, yapay zeka “etikçileri”nin güvenliği gerekçe göstererek makine öğrenimi modellerine erişimi kontrol eden bir tür yüksek rahipler sınıfı gibi davranmak istemesi. Ancak yapay zekanın en büyük riskinin, modelleri kontrol eden kişilerin bu modellerle insanların ne yazabileceğini kontrol edip sansürlemesinde olduğunu düşünüyorum.
Halkın elindeki açık kaynak modellerin, yapay zekanın gerçek risklerine karşı en iyi savunma olduğunu düşünüyor; bunu ileri taşıyan Facebook, Microsoft ve Mistral’i alkışlıyorum.
- Yapay zeka “etikçileri”ni böyle görmek fazlasıyla kötü niyetli bir yorum.
  Sosyal medya özetleri yerine gerçek argümanları okumanız iyi olur. Düşündüğünüzden çok daha derin bir tartışma var; endişe duyduğunuz riskler de geniş biçimde ele alınıyor ve önerilen çözümler de var. Bu çözümlerin, “en iyi savunma” iddiasından gerçekten işe yarama olasılığı daha yüksek.
- “Tüm” yapay zeka etikçilerini model erişimini engellemek isteyen bir rahipler sınıfı olarak tasvir etmenin zararlı olduğunu düşünüyorum.
  Bu araçların demokratikleşmesini de, güvenli ve etik kullanımını da önemseyen çok kişi var.
- Artık cin şişeden çıktı diye düşünüyorum.
  Kötü niyetli insanların lisans metnindeki ifadeleri gözetmesini beklemek, bir kontrol aracı olarak baştan pek iyi değildi. Yalnızca yasalara uyacak kadar iyi niyetli insanların ilerlemesini ve inovasyonunu engeller; Rusya, Kuzey Kore, Çin gibi yerlerde farklı niyetleri olan kişiler ya da suç örgütleri ve dolandırıcılar bu tür fikirlere bağlı kalmaz.
  Düzgün bir açık kaynak lisansı altında çalışan topluluk büyüyor ve ilginç işler giderek daha hızlı gerçekleşiyor. Alternatif lisanslar etkisiz; o toplulukla bağı koparıyor, iş birliğini karmaşıklaştırıyor ve genel araştırma içinde giderek azınlık hâline geliyor. Bu yüzden bu tür lisanslar giderek anlamsızlaşıyor.
  Bunu düzeltmek, hukuki açıdan basit ve standart bir duruma geçmek demek; ticarileştirmeyi, iş birliğini ve araştırmayı kolaylaştırır. Microsoft’un bunda değer olduğunu makul biçimde kabul edip gerçekliğe uyum sağladığı görülüyor.
- Bu çılgın yapay zeka yatırımının asıl gizli amacının büyük ölçekli bir sansür altyapısı kurmak olmadığını kim garanti edebilir?
- Değerin toplandığı her yerde, katkı yapmayan insan ordularına vergi ödemezseniz ayağını fren pedalının üstüne koyan bir midye sektörü ortaya çıkar.
Önceden ticari olmayan lisans olduğu için heyecanım biraz azalmıştı.
Performansı ve boyutu düşünüldüğünde ticari kullanıma uygun bir lisansa geçmesi oldukça büyük bir olay.
Bu modelde önemli olan, akıl yürütme becerisinin güçlü olması.
Ancak bomba yapmayı öğrenmek vb. ya da “kötü işler” yapmamak için özellikle büyük ölçekli web tarama veri kümeleriyle eğitilmedi.
Bu yüzden aynı sınıftaki, hatta daha büyük parametreli modellerle karşılaştırıldığında “en akıllıca düşünen” model olsa da dünya bilgisi veya genel kültür açısından görece eksik.
Bu ileride değişebilir, ama mevcut durumun böyle olduğunu düşünüyorum.
- Yine de RAG uygulamaları için harika.
  Çünkü yanıtın web’den öğrendiği şeylere değil, benim sağladığım verilere dayanmasını istiyorum.
- Büyük dil modellerini doğal dil kullanma becerisi ve sorulara yanıt verecek bilgi olmak üzere iki özellik üzerinden düşünürsek, küçük dil modellerini doğal dil işleme konusunda çok iyi modeller olarak görmek gerekir.
  Pek çok iş için genel bilgi gerekmez; özellikle RAG’de bu avantaj büyüktür.
- Modelin odağının veriyi içine gömmek olmamasını umarım.
  Veriyi arama yoluyla sağlamak daha iyi; bunun sonucunda “akıllıymış gibi görünen ama tamamen yanlış” yanıtlar azalır.
  İçine gömülü veri azsa, sohbet asistanı alanı dışında da daha genel amaçlı kullanılabilir. Çünkü çoğu durumda modelin yalnızca kullanıcının sağladığı verileri bilmesini isteriz.
  Örneğin bir orta çağ fantezi oyununda bir karakterin birden ABD siyaseti hakkında konuşmaya başlaması çok tuhaf olurdu. Phi-2 de ince ayar olmadan bunu tamamen çözmez, ama anlatılmak istenen yön bu.
- Web tarama verileriyle eğitilmemesinin, Microsoft’un mülkiyeti ve kişisel bilgileri çalıp bunlardan para kazandığı gerçeğini daha az açık göstermeye yönelik olduğunu düşünüyorum.
Modelden çok veri kümesini merak ediyorum.
- Muhtemelen phi-1/1.5’in “Textbooks are all you Need” eğitim yönteminin gelişmiş bir biçimidir: https://arxiv.org/abs/2309.05463
Harika bir değişiklik ve bağımsız açık kaynak projelerinin neden önemli olduğunu da gösteriyor.
TinyLlama’nın Apache 2.0 lisansıyla yayımlanmasının bu değişiklikte etkisi olmadığını söylemek zor.
- TinyLlama’nın yayımlanmasının etkili olduğunu düşünmek için dayanağın ne?
Bu, Phi-3 ve sonraki nesil modellerin Phi-2’yi eski hâle getireceğinin bir işareti gibi görünüyor.
Bu model epey uzun süre üst sıralardaydı; onu bu kadar iyi yapan ne?
- Bu modelin boyutu ve çıkarım maliyeti düşünüldüğünde performansı mükemmel.
  Telefon gibi küçük cihazlarda bile çalıştırılabilirken GPT-3.5’e yakın performans veren en iyi model.
  Mimarisi ve eğitim verileri de ilginç. Seçilmiş sentetik veriler kullanan seyrek bir model olduğu için rastgele internet metinleriyle eğitilmiş modellere kıyasla çok daha yüksek doğruluk sağlıyor.

Microsoft Phi-2 modeli MIT lisansına geçirildi

Commit’te değişen dosyalar

LICENSE: Microsoft Research License’tan MIT License’a değiştirildi

Kaldırılan önceki kısıtlama maddeleri

README metaverisi değişikliği

NOTICE.md ve üçüncü taraf bileşen bildirimi

İlgili okumalar

1 yorum

Hacker News yorumları