1 puan yazan GN⁺ 4 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • Epicure, 4,14 milyon tarif ve FlavorDB bileşik verileriyle 1.790 standart malzemenin 300 boyutlu gömmelerini öğrenen bir modeldir
  • Mevcut FlavorGraph’ın İngilizce merkezli derlemi, sabit kimya-tarif karışımı ve dağınık malzeme sözlüğü sorunlarını azaltacak şekilde tasarlanmıştır
  • Cooc, Chem ve Core, aynı yapı içinde yalnızca rastgele yürüyüş şemasını değiştirerek tarif ortak-görünümü ile kimyasal sinyallerin ağırlığını karşılaştırır
  • Üç gömme, 27 duyusal-besinsel yönü ve 8 mutfak makro bölgesini doğrusal olarak geri kazanır ve gözetimsiz biçimde 20 faktör elde eder
  • En yakın komşular ve SLERP yön aritmetiği ile riceı South-Asian yönüne döndürmek gibi malzeme keşfi mümkündür, ancak kod ve çıktılar henüz açık değildir

Epicure’ün hedefi

  • Malzeme gömmeleri, malzemeler arasındaki uyumu, kültürlere göre benzer malzemeleri ve duyusal-besinsel eksenlerdeki konumları bulmak için bir temel sağlar
    • Doenjang ile mirin, dashi ve susam yağının; zeytinyağı ile ise fesleğen, domates ve prosciutto’nun iyi gitmesi gibi bilgi, farklı kültürlere ait tarif derlemlerinde ve şef sezgisinde birikmiştir
    • Menü/tarif yardımcı araçlarında, eldeki malzemelere dayalı önerilerde, Akdeniz malzemelerinden Doğu Asya’daki karşılık malzemelere geçiş aramalarında ve yağlılık hissi, fermantasyon, acılık, yüksek protein gibi eksenlere dayalı keşiflerde kullanılabilir
  • Önceki çalışmalar, kimya tabanlı lezzet ağları ile tarif/bilgi grafiği tabanlı yaklaşımlara uzanmıştır
    • Ahn et al. [2011], lezzet ağını tanıttı ve paylaşılan bileşiklerde kültürler arası farklar görüldüğünü gösterdi
    • Garg et al. [2017] tarafından geliştirilen FlavorDB, 936 gıda varlığının aroma moleküllerini listeledi; FooDB ise 70.000 bileşikle kimyasal kapsamı genişletti
    • FlavorGraph [Park et al., 2021], FlavorDB ile Recipe1M+’ı birleştirerek 6.653 malzeme ve 1.645 bileşikten oluşan heterojen bir grafik kuran ve Metapath2Vec ile eğitilmiş açık bir gıda gömmesidir
    • FoodKG [Haussmann et al., 2019], öneri amacıyla tarif, beslenme ve ontoloji verilerini RDF bilgi grafiğinde birleştirir

FlavorGraph’ın sınırları ve Epicure’ün tasarımı

  • Önceki analizlerde, FlavorGraph’ın 300 boyutlu gömmelerinde tat, doku, beslenme, coğrafya, kültür ve işlemeyi kapsayan 15’ten fazla yorumlanabilir mutfak boyutu doğrulandı ve LLM ile güçlendirilmiş sözlük birleştirmenin sinyallerin çoğunu kuvvetlendirdiği görüldü
  • FlavorGraph’ın sabit ön eğitiminin üç kısıtı vardı
    • Tek bir İngilizce merkezli derlemeye dayanıyordu
    • Kimyasal sinyal ile tarif bağlamı sinyali tek ve sabit bir tümevarımsal önyargıyla birleştiriliyordu; bu da bunu bir tasarım ekseni olarak ayarlamayı zorlaştırıyordu
    • Malzeme sözlüğünde hazırlama biçimi ayrıntıları ve gıda dışı öğelerin karıştığı dağınık yapı korunuyordu
  • Epicure, bu kısıtları azaltmak için en baştan eğitilmiş üç kardeş skip-gram malzeme gömmesinden oluşur
    • 11 kaynaktan 4,14 milyon tarif toplandı
    • Dil kapsamı İngilizce, Çince, Rusça, Vietnamca, İspanyolca, Türkçe, Endonezce, Almanca ve Indian-English’tir
    • Ham malzeme dizgileri, LLM ile güçlendirilmiş bir boru hattıyla 1.790 standart malzeme girdisine normalize edildi
    • Üç model, mimariyi ve hiperparametreleri paylaşır; yalnızca skip-gram amaç fonksiyonunun gördüğü rastgele yürüyüş şeması farklıdır

Veri ve üç gömme

  • Epicure, iki tür grafiği başlangıç noktası olarak alır
    • Malzeme-malzeme NPMI grafiği, 203.508 kenardan oluşur
    • FlavorDB malzeme-bileşik grafiği, 80.019 kenardan oluşur ve 15 kategoride 2.247 tiplenmiş bileşik düğümü içerir
  • Üç Metapath2Vec varyantı, kimya ile tarif bağlamı arasındaki spektrumda farklı konumlar alır
    • Cooc

      • Yalnızca tarif ortak-görünüm grafiğinde yürüyen modeldir
      • Malzemelerin gerçek tariflerde birlikte görünmesinden gelen bağlam sinyaline odaklanır
    • Chem

      • Yalnızca tiplenmiş bileşik metayollarında yürüyen modeldir
      • Malzeme-bileşik ilişkilerinden gelen kimyasal sinyale odaklanır
    • Core

      • Bileşik tabanlı yollar ile malzeme-malzeme yollarını birlikte kullanır
      • Kontrollü karışım oranıyla malzeme-malzeme yürüyüşleri ekleyerek kimyasal sinyal ile tarif bağlamı sinyalini karıştırır
      • Bu yapı, aynı girdi verisi ve eğitim yapısı içinde kimya vs. tarif bağlamı ağırlığını bir tasarım ekseni olarak görünür kılar
      • Üç kardeş model arasındaki fark, yalnızca rastgele yürüyüş şemasından doğacak şekilde tasarlanmıştır
      • Böylece gömmelerin nitelik farkı, girdi verisinin değil yürüyüş şemasının etkisi olarak karşılaştırılabilir

Gömme uzayında geri kazanılan mutfak anlamı

  • Üç Epicure modeli, gözetimli probe’larda 27 sürekli duyusal-besinsel yönü ve 8 mutfak makro bölgesini doğrusal olarak geri kazanır
    • Mutfak bölgelerinin ayrıştırılabilirliğinde ortalama Cohen’s d, Cooc/Core/Chem sırasıyla 2,43/2,70/3,07’dir
    • Probe kapsamı cuisine, food-group, NOVA işleme derecesi, USDA makrobesinleri ve 19 duyusal kategoriyi içerir
  • Gözetimsiz analiz, her modelde 20 yorumlanabilir faktörü geri kazanır
    • Food-group artıklarından arındırılmış gömmeler üzerinde çoklu seed kararlı FastICA uygulanır
    • Her faktörün üst çeyrekteki öğeleri GMM ile bölünerek model başına 150–200 adlandırılmış mutfak modu elde edilir
  • GMM modlarının ortalama tutarlılığı, rastgele çift taban çizgisinden daha yüksektir
    • Cooc/Core/Chem için ortalama tutarlılık 0,611/0,833/0,703’tür
    • Buna karşılık gelen rastgele çift taban çizgisi 0,097/0,348/0,115’tir
  • Önceki gömme araştırmalarının bakış açıları da doğrulamada kullanılmıştır
    • Mikolov et al. [2013]’ün word2vec doğrusal yönlülük yaklaşımı, 27 gözetimli mutfak probe’u, 20 FastICA faktörü ve SLERP döndürme işleminin temelini oluşturur
    • Mu et al. [2017]’nin izotropi yaklaşımına göre, gömme izotropisi participation ratio ve ortalama ikili kosinüs ile doğrudan ölçülür
    • Üç kardeş model, izotropi spektrumunda belirgin biçimde farklı konumlara yerleşir ve bu, girdi verisinin değil yürüyüş şemasının özelliği olarak ele alınır
    • Caliskan et al. [2017]’nin WEAT yaklaşımı, adlandırılmış anlamsal eksenlerin geometrik yapıya yansıyıp yansımadığını teşhis eden yardımcı bir doğrulama olarak kullanılır

Keşif işlemleri ve kullanım olasılıkları

  • Epicure, aynı 300 boyutlu gömme uzayında birbirini tamamlayan iki işlem ailesi sunar
    • En yakın komşu tabanlı eşleme

      • top-K komşu aramasıyla bir malzemenin çevresindeki yakın öğeleri bulur
      • Mod üyeliği sorgusuyla belirli bir mutfak moduna ait öğeler keşfedilir
    • SLERP yön aritmetiği

      • Seed malzemeyi gözetimli pole vector’e ya da ortaya çıkan factor-mode pole’a doğru döndürür
      • Sürekli açı θ, seed ağırlıklı arama ile target ağırlıklı arama arasında enterpolasyon yapar
      • Örneğin ricea South-Asian yönü eklenirse curry leaf, urad dal, chana dal, fenugreek seed tarafına kayar
      • Hem gözetimli anlamsal yönler hem de gözetimsiz ortaya çıkan modlar, malzeme keşfinde kullanılabilir
      • Şeflere yönelik araçlar, malzemeleri döndürürken, karıştırırken ve ararken duyusal, besinsel ve kültürel olarak tutarlı yönler boyunca keşif yapılmasını sağlayabilir
      • Kimya tabanlı ilişkiler ile tarif bağlamı tabanlı ilişkiler, model seçimi ve yürüyüş şemasıyla ayarlanabilir
      • Kod ve eğitilmiş çıktılar şu anda kamuya açık değildir

1 yorum

 
GN⁺ 4 시간 전
Hacker News görüşleri
  • Araştırmanın kendisi ilgi çekici ama başlık yanıltıcı
    Daha iyi bir başlık muhtemelen “İnsanların kullandığı malzemeleri 1.800 temel öğeye sıkıştırmak” olurdu
    Gerçek tarifler, yani hazırlama yöntemleri ya da oranlar konusunda neredeyse hiçbir şey yok; ama dünya genelinde domatesin dana etiyle iyi gittiği gibi bilgiler, lezzet eşleşmeleri oluştururken oldukça yararlı ve ilginç bir kaynak olabilir

    • Birbirine uyan tatların haritasını ele alan harika bir kitap olarak The Flavor Bible var
      1.800 malzemenin tüm kombinasyonlarını içermiyor ama yaygın kullanılan otlar, baharatlar, sebzeler ve etleri oldukça iyi kapsıyor. Bu kitabı sıkıştırsanız bile metin boyutu muhtemelen o kadar büyük olmazdı
      LLM tarafından üretilen tariflerin sorunu, pişirme tekniğinin inceliklerini kaçırmaları. Başarı çoğu zaman tek bir adıma ya da tek bir orana bağlı oluyor; örneğin “fried chicken”ın dünya çapında sayısız çeşidi var ama tariflerin ortalamasını almak lezzetli bir fried chicken üretmiyor
    • Benim gözümden kaçmadıysa, makalenin hiçbir yerinde bunun insanlığın tüm malzemelerini kapsadığına dair bir dayanak görünmüyor
      11 veri kaynağı çeşitli yaygın yemekleri kapsıyor ama veri kümesinin %90'ını İngilizce ve Çince kaynaklar oluşturuyor. Afrika ve Arap dünyası da veride yok; bu ikisi tek başına bile dünya nüfusunun yaklaşık %25'i ediyor
      İngilizce dışındaki tüm terimlerin yapay zeka ile İngilizceye çevrilmiş olması yöntem açısından anlaşılabilir ama hata payı olduğu da açık
    • Eskiden 12 kişilik bir dana yahni yaparken içine domates sosu koyup durumu kurtarmıştım
      Dana eti yanlış pişirilirse sertleşebiliyor ama domatesin asidi onu yeniden yumuşatıyor
    • Bu konuyla ilgileniyorsanız şu makaleye de bakmaya değer: https://www.nature.com/articles/srep00196
    • Domateste bol miktarda glutamat var; bu da dana etinin lezzetini daha da öne çıkarıyor
  • İlginç
    Tarifleri küçük şemalara sıkıştırmaya çalışıyorum: https://leontrolski.github.io/recipes.html

    • Hoşuma gitti. Biraz Cooking for Engineers'ın tablo düzenini hatırlattı. Tarifin en altına kaydırınca görülebiliyor: https://www.cookingforengineers.com/recipe/19/Erics-Chocolat...
    • Güzel. https://www.reddit.com/r/flowchartrecipes/ ve https://www.cookingforengineers.com/recipe/87/Carrot-Pulp-Ca... sayfalarındaki tablo görünümünü hatırlattı
    • Aa, bağımlılık grafiği tarif kartı. Gerçekten harika
      Hep böyle bir şeyi hayal etmiştim ve tariflerin malzemeleri devasa, ayrıştırılmamış bir liste halinde verip sonra da “kuru malzemeleri derin bir kapta karıştırın” demesine hep sinir olmuşumdur
      Bir süre, bunu iyi uygularsan kârlı olabileceğini düşünmüştüm ama artık güçlü bir arayüz ortaya çıkar çıkmaz kolayca kopyalanacak gibi geliyor
    • Gerçekten harika bir site. Elle çizilmiş grafikleri çok beğendim
      Tablo, Modernist Cuisine tariflerini hatırlattı. Orada malzemeler adımlara göre gruplanıyor ve ağırlıklar, bazen hacim ve oranlarla birlikte veriliyor
      Örnek: https://modernistcuisine.com/wp-content/uploads/2013/01/Mac-...
    • Bu yaklaşımı gerçekten seviyorum. Mutfakta çalışırken uzaktan da okunabilecek büyük, şema tabanlı bir tarif kitabı yapılırsa başarılı olabilir gibi duruyor
  • Bu arada https://publicdomainrecipes.com sitesinin tamamı https://browse.library.kiwix.org üzerinde 22MiB'lik tek bir dosya olarak sunuluyor: https://browse.library.kiwix.org/viewer#publicdomainrecipes....
    Tarif ekleme işlemi https://github.com/ronaldl29/public-domain-recipes üzerinden yapılabiliyor

  • “İngilizce, Çince, Rusça, Vietnamca, İspanyolca, Türkçe, Endonezce, Almanca, Hint İngilizcesi gibi 7 dilde 11 kaynak” ise buna insanlığın tüm mutfağı demek zor

    • Yine de bugün dünya nüfusunun yaklaşık %70'ini temsil ediyor. %100 değil ama büyük grupların önemli bir kısmını kapsıyor
      Ama dünya genelinde çok popüler olan İtalyan, Japon, Yunan ve Meksika mutfakları eksik; ayrıca Afrika ve Orta Doğu da tamamen yok, dolayısıyla eksik bir çalışma
    • Evet. Derleme incelendiğinde tariflerin neredeyse yarısı Çin/Kore tarafına ait
      Makale bunu hızlıca kabul ediyor ama bunun dengeli bir veri kümesi olmadığı açık
  • [1] içinde, bu makalenin anlattığı şeyin önceki bir yinelemesi gibi görünen bir demo görülebiliyor
    Demonun hangi malzemeleri seçtiğini merak ettiğim için, Peter Gilmore[2]’un “Organum: Nature, Texture, Intensity, Purity” kitabında geçen alışılmadık birkaç malzemeyi denedim. Kendisi Avustralya’nın Sidney kentindeki Quay restoranıyla tanınıyor
    Ardıç meyvesi, macadamia, nigella tohumu, portakal çiçeği suyu, lemon verbena gibi oldukça iddialı malzemeleri biliyor ve susam yağı ile kavrulmuş susam yağını da ayırt ediyor. Malzeme listesinde yalnızca “pirinç”, “siyah pirinç”, “esmer pirinç”, “yapışkan pirinç” olsa da, “pirinç” seçildiğinde kızarmış pilav için pişirilmiş yasemin pirincinin soğutulmasını, pilav içinse basmati pirincinin ıslatılıp durulanmasını önerecek kadar akıllı
    “Kuzu eti”ni seçip yanında braising’de sık kullanılan sebzeleri de seçince, omuz veya incik gibi uygun parçaları öneriyor
    Üzüm çekirdeği yağı, orzo, mangosten, lemon myrtle’ı bilmiyor; karkalla gibi muhtemelen ancak Peter Gilmore düzeyinde birinin kullanacağı ve çoğu şefin adını bile duymadığı malzemeleri de doğal olarak bilmiyor. Ama bunlar bölgesel ya da çok özel malzemeler olduğu için bunu büyük bir sınırlama saymıyorum
    “Kabak çekirdeği”ni biliyor ama “pumpkin”i bilmiyor, onu “squash” altında ele alıyor; yani Britanya/Amerikan İngilizcesi kullanımını iyileştirmek için daha fazla yerelleştirme gerekiyor. “Kuzu eti” ve “avokado”yu birleştirip salata yapmasını bekledim ama başaramadı; sonra malzeme listesinde marul ya da roka olmadığını, sadece Amerikan İngilizcesindeki “salad greens” ifadesinin bulunduğunu fark ettim. Başka salata malzemeleriyle, tavukla ya da proteinsiz de denedim ama salata yapmak yerine, protein parçasının etrafına domates jölesi (agar) ve avokado püresi yerleştirilmiş sahte lüks tabaklar üretmeye devam etti
    [1] https://epicure.kaikaku.ai/
    [2] https://en.wikipedia.org/wiki/Peter_Gilmore_(chef)

    • “pumpkin”in “squash” olması, basit bir kelime farkından çok daha büyük bir sorun
      Amerikalılar açısından yaygın kullanılan birçok squash türü var ve pumpkin bunlardan sadece biri. Aklıma gelenler acorn, butternut, spaghetti; titiz davranırsak zucchini de buna dahil
  • Bunu X/Twitter’da gördüm ama insanlığın yemeklerini, tüm teknikleri, malzemeleri ve kültürel bağlama göre pişirme biçimlerini 2 megabayt içine sıkıştırabileceğine inanmak zor
    Bu, “araç çağrısı ve kodlama yapabilen 1GB model” denilip denenince neredeyse hiç çalışmamasına benziyor. Teknik olarak 1GB’lık bir kodlama modeli olabilir ama bu, iyi bir model olduğu anlamına gelmiyor

    • Yenebilir insan yemeği uzayı küçük. Sadece birkaç bin malzeme ve birkaç bin pişirme tekniği var; dolayısıyla bunu yüksek sadakatli bir model olarak kolayca sıkıştırabilirsiniz
  • İngilizce ve Almancayı içerip İtalyanca ve Fransızcayı dışarıda bırakan bir yemek modeli/korpusuna güvenmek zor

    • Tabloda İtalyan, Fransız ve başka birçok mutfak yer alıyor. 11 kaynak listesi dil temelli
      Gerçek Fransızca yazılmış tarifler eksik olabilir ama İngilizce yazılmış bir Fransız soğan çorbası tarifi kesinlikle vardır
  • “Tüm malzeme sınıflandırması [Claude] tarafından deterministik decoding (temperature 0–0.1) ile yapıldı” deniyor; bu bağlamda büyük bir sorun değil ama düşük temperature deterministik olmakla aynı şey değil

    • Evet. temperature 0, deterministik çıkarım için ne gerekli ne de yeterli bir koşul
  • Clickbait’i bir kenara bırakırsak oldukça ilginç bir kavram. Bu tür embedding’lerle malzemeler ya da tat profilleri için bir word2vec anı gelip gelmeyeceğini merak ediyorum
    Başkalarının da isabetle belirttiği gibi, bu daha temsili veri kaynaklarıyla yeniden yapılabilir ve bu yaklaşımın ne kadar etkili olacağını görmek ilginç olur

  • İlgili veri ve bilgileri Claude Code’a verip uygulatmayı denedim, sonuç oldukça iyi görünüyor
    Tarif üretmekten ziyade ikame malzeme önerileri için daha uygun olabilir: https://viz.roshangeorge.dev/recipe-model/