4 puan yazan GN⁺ 2023-10-05 | 2 yorum | WhatsApp'ta paylaş
  • Font üretimi için FontoGen adlı üretken bir makine öğrenimi (ML) modeli geliştirildi
  • Model, font açıklamasını girdi olarak alıp çıktı olarak font dosyası veriyor
  • Yazar, 2023'te yapay zekanın yükselişinden ilham alarak metinden SVG üretimini araştırmaya başladı ve buradan font üretimi fikrine ulaştı
  • Model, IconShop2 makalesi referans alınarak kuruldu ve SVG üretimine benzer şekilde font üretiminin de mümkün olduğu görüldü
  • Model, metin gömmesinin ardından font gömmesinin geldiği bir diziyle eğitilen sequence-to-sequence bir model
  • Metin gömmesi, önceden eğitilmiş bir BERT encoder modeli kullanılarak üretildi; font gömmesi ise fontların token dizilerine dönüştürülmesiyle oluşturuldu
  • Model, 16 katman ve 8 bloktan oluşan, toplam 73,7 milyon parametreye sahip, yalnızca encoder kullanan otoregresif bir transformer
  • Yazar, başlangıç prompt'una odaklanmak ve birden çok önceki glifin stilini yakalamak için N adet önceki token'ı gözlemleyerek BigBird3 attention kullandı
  • Model, GPT-3.5 kullanılarak çeşitli açıklama türlerinin birkaç anahtar kelimeye özetlendiği 71 bin benzersiz fonttan oluşan bir veri kümesi üzerinde eğitildi
  • Eğitim süreci 127 saat sürdü ve doğrulama kaybı neredeyse hiç iyileşmeyince durduruldu
  • Yazar, veri kümesi ön işleme aşamasına mümkün olduğunca çok yük taşıyarak performansı üç kat artırdı
  • Yazar, tasarımcının ürettiği tek bir gliften yola çıkarak diğer tüm glifleri üretmek için modelin mevcut font düzenleyicilere entegre edilmesi gibi potansiyel gelecek uygulamaları öneriyor

2 yorum

 
dbgus2028 2023-10-06

Bana sevimli bir font yap

 
GN⁺ 2023-10-05
Hacker News görüşleri
  • GPT-4 kod yorumlayıcısı, gliflerin siyah-beyaz PNG'lerini SVG'ye dönüştürebiliyor ve bu, görsel üretim modelleriyle birleştirilerek font oluşturmak için kullanılabiliyor.
  • Godel Escher Bach'ın yazarı Douglas Hofstader, genel yapay zeka olmadan font üretiminin mümkün olmadığına inanıyordu.
  • Letter Spirit projesi, ızgarayla sınırlı ve "gridfonts" olarak adlandırılan, stili tutarlı yazı tipleri tasarlayarak sanatsal yaratıcılığı modellemeyi amaçlıyor.
  • ML modelleri tarafından üretilen fontların hassasiyeti konusunda endişeler var; çizgilerin tamamen paralel olmaması ve köşelerin tam olarak 90 derece olmaması gibi sorunlar görülüyor.
  • Pikselleri 150x150 bağımsız kutular olarak ifade etme yaklaşımının ideal olmadığı düşünülüyor; bunun yerine convnet kullanılması ve çıktının izlenmesi öneriliyor.
  • Bu yaklaşımla yeni fontların, özellikle de yoğun biçimde stilize edilmiş fontların üretilmesi daha uygulanabilir hale gelebilir.
  • Model, safetensor değil ckpt formatında; bu da bazı kullanıcıların bunu denemeyi isteyip istemeyeceğini etkileyebilir.
  • Difüzyon modelleri metin çizmekte zorlanmasına rağmen, bu yöntem bu uygulamada iyi çalışıyor.