- Epicure, 4,14 milyon tarif ve FlavorDB bileşik verileriyle 1.790 standart malzemenin 300 boyutlu gömmelerini öğrenen bir modeldir
- Mevcut FlavorGraph’ın İngilizce merkezli derlemi, sabit kimya-tarif karışımı ve dağınık malzeme sözlüğü sorunlarını azaltacak şekilde tasarlanmıştır
- Cooc, Chem ve Core, aynı yapı içinde yalnızca rastgele yürüyüş şemasını değiştirerek tarif ortak-görünümü ile kimyasal sinyallerin ağırlığını karşılaştırır
- Üç gömme, 27 duyusal-besinsel yönü ve 8 mutfak makro bölgesini doğrusal olarak geri kazanır ve gözetimsiz biçimde 20 faktör elde eder
- En yakın komşular ve SLERP yön aritmetiği ile
riceı South-Asian yönüne döndürmek gibi malzeme keşfi mümkündür, ancak kod ve çıktılar henüz açık değildir
Epicure’ün hedefi
- Malzeme gömmeleri, malzemeler arasındaki uyumu, kültürlere göre benzer malzemeleri ve duyusal-besinsel eksenlerdeki konumları bulmak için bir temel sağlar
- Doenjang ile mirin, dashi ve susam yağının; zeytinyağı ile ise fesleğen, domates ve prosciutto’nun iyi gitmesi gibi bilgi, farklı kültürlere ait tarif derlemlerinde ve şef sezgisinde birikmiştir
- Menü/tarif yardımcı araçlarında, eldeki malzemelere dayalı önerilerde, Akdeniz malzemelerinden Doğu Asya’daki karşılık malzemelere geçiş aramalarında ve yağlılık hissi, fermantasyon, acılık, yüksek protein gibi eksenlere dayalı keşiflerde kullanılabilir
- Önceki çalışmalar, kimya tabanlı lezzet ağları ile tarif/bilgi grafiği tabanlı yaklaşımlara uzanmıştır
- Ahn et al. [2011], lezzet ağını tanıttı ve paylaşılan bileşiklerde kültürler arası farklar görüldüğünü gösterdi
- Garg et al. [2017] tarafından geliştirilen FlavorDB, 936 gıda varlığının aroma moleküllerini listeledi; FooDB ise 70.000 bileşikle kimyasal kapsamı genişletti
- FlavorGraph [Park et al., 2021], FlavorDB ile Recipe1M+’ı birleştirerek 6.653 malzeme ve 1.645 bileşikten oluşan heterojen bir grafik kuran ve Metapath2Vec ile eğitilmiş açık bir gıda gömmesidir
- FoodKG [Haussmann et al., 2019], öneri amacıyla tarif, beslenme ve ontoloji verilerini RDF bilgi grafiğinde birleştirir
FlavorGraph’ın sınırları ve Epicure’ün tasarımı
- Önceki analizlerde, FlavorGraph’ın 300 boyutlu gömmelerinde tat, doku, beslenme, coğrafya, kültür ve işlemeyi kapsayan 15’ten fazla yorumlanabilir mutfak boyutu doğrulandı ve LLM ile güçlendirilmiş sözlük birleştirmenin sinyallerin çoğunu kuvvetlendirdiği görüldü
- FlavorGraph’ın sabit ön eğitiminin üç kısıtı vardı
- Tek bir İngilizce merkezli derlemeye dayanıyordu
- Kimyasal sinyal ile tarif bağlamı sinyali tek ve sabit bir tümevarımsal önyargıyla birleştiriliyordu; bu da bunu bir tasarım ekseni olarak ayarlamayı zorlaştırıyordu
- Malzeme sözlüğünde hazırlama biçimi ayrıntıları ve gıda dışı öğelerin karıştığı dağınık yapı korunuyordu
- Epicure, bu kısıtları azaltmak için en baştan eğitilmiş üç kardeş skip-gram malzeme gömmesinden oluşur
- 11 kaynaktan 4,14 milyon tarif toplandı
- Dil kapsamı İngilizce, Çince, Rusça, Vietnamca, İspanyolca, Türkçe, Endonezce, Almanca ve Indian-English’tir
- Ham malzeme dizgileri, LLM ile güçlendirilmiş bir boru hattıyla 1.790 standart malzeme girdisine normalize edildi
- Üç model, mimariyi ve hiperparametreleri paylaşır; yalnızca skip-gram amaç fonksiyonunun gördüğü rastgele yürüyüş şeması farklıdır
Veri ve üç gömme
- Epicure, iki tür grafiği başlangıç noktası olarak alır
- Malzeme-malzeme NPMI grafiği, 203.508 kenardan oluşur
- FlavorDB malzeme-bileşik grafiği, 80.019 kenardan oluşur ve 15 kategoride 2.247 tiplenmiş bileşik düğümü içerir
- Üç Metapath2Vec varyantı, kimya ile tarif bağlamı arasındaki spektrumda farklı konumlar alır
-
Cooc
- Yalnızca tarif ortak-görünüm grafiğinde yürüyen modeldir
- Malzemelerin gerçek tariflerde birlikte görünmesinden gelen bağlam sinyaline odaklanır
-
Chem
- Yalnızca tiplenmiş bileşik metayollarında yürüyen modeldir
- Malzeme-bileşik ilişkilerinden gelen kimyasal sinyale odaklanır
-
Core
- Bileşik tabanlı yollar ile malzeme-malzeme yollarını birlikte kullanır
- Kontrollü karışım oranıyla malzeme-malzeme yürüyüşleri ekleyerek kimyasal sinyal ile tarif bağlamı sinyalini karıştırır
- Bu yapı, aynı girdi verisi ve eğitim yapısı içinde kimya vs. tarif bağlamı ağırlığını bir tasarım ekseni olarak görünür kılar
- Üç kardeş model arasındaki fark, yalnızca rastgele yürüyüş şemasından doğacak şekilde tasarlanmıştır
- Böylece gömmelerin nitelik farkı, girdi verisinin değil yürüyüş şemasının etkisi olarak karşılaştırılabilir
-
Gömme uzayında geri kazanılan mutfak anlamı
- Üç Epicure modeli, gözetimli probe’larda 27 sürekli duyusal-besinsel yönü ve 8 mutfak makro bölgesini doğrusal olarak geri kazanır
- Mutfak bölgelerinin ayrıştırılabilirliğinde ortalama Cohen’s d, Cooc/Core/Chem sırasıyla 2,43/2,70/3,07’dir
- Probe kapsamı cuisine, food-group, NOVA işleme derecesi, USDA makrobesinleri ve 19 duyusal kategoriyi içerir
- Gözetimsiz analiz, her modelde 20 yorumlanabilir faktörü geri kazanır
- Food-group artıklarından arındırılmış gömmeler üzerinde çoklu seed kararlı FastICA uygulanır
- Her faktörün üst çeyrekteki öğeleri GMM ile bölünerek model başına 150–200 adlandırılmış mutfak modu elde edilir
- GMM modlarının ortalama tutarlılığı, rastgele çift taban çizgisinden daha yüksektir
- Cooc/Core/Chem için ortalama tutarlılık 0,611/0,833/0,703’tür
- Buna karşılık gelen rastgele çift taban çizgisi 0,097/0,348/0,115’tir
- Önceki gömme araştırmalarının bakış açıları da doğrulamada kullanılmıştır
- Mikolov et al. [2013]’ün word2vec doğrusal yönlülük yaklaşımı, 27 gözetimli mutfak probe’u, 20 FastICA faktörü ve SLERP döndürme işleminin temelini oluşturur
- Mu et al. [2017]’nin izotropi yaklaşımına göre, gömme izotropisi participation ratio ve ortalama ikili kosinüs ile doğrudan ölçülür
- Üç kardeş model, izotropi spektrumunda belirgin biçimde farklı konumlara yerleşir ve bu, girdi verisinin değil yürüyüş şemasının özelliği olarak ele alınır
- Caliskan et al. [2017]’nin WEAT yaklaşımı, adlandırılmış anlamsal eksenlerin geometrik yapıya yansıyıp yansımadığını teşhis eden yardımcı bir doğrulama olarak kullanılır
Keşif işlemleri ve kullanım olasılıkları
- Epicure, aynı 300 boyutlu gömme uzayında birbirini tamamlayan iki işlem ailesi sunar
-
En yakın komşu tabanlı eşleme
- top-K komşu aramasıyla bir malzemenin çevresindeki yakın öğeleri bulur
- Mod üyeliği sorgusuyla belirli bir mutfak moduna ait öğeler keşfedilir
-
SLERP yön aritmetiği
- Seed malzemeyi gözetimli pole vector’e ya da ortaya çıkan factor-mode pole’a doğru döndürür
- Sürekli açı θ, seed ağırlıklı arama ile target ağırlıklı arama arasında enterpolasyon yapar
- Örneğin
ricea South-Asian yönü eklenirsecurry leaf,urad dal,chana dal,fenugreek seedtarafına kayar - Hem gözetimli anlamsal yönler hem de gözetimsiz ortaya çıkan modlar, malzeme keşfinde kullanılabilir
- Şeflere yönelik araçlar, malzemeleri döndürürken, karıştırırken ve ararken duyusal, besinsel ve kültürel olarak tutarlı yönler boyunca keşif yapılmasını sağlayabilir
- Kimya tabanlı ilişkiler ile tarif bağlamı tabanlı ilişkiler, model seçimi ve yürüyüş şemasıyla ayarlanabilir
- Kod ve eğitilmiş çıktılar şu anda kamuya açık değildir
-
1 yorum
Hacker News görüşleri
Araştırmanın kendisi ilgi çekici ama başlık yanıltıcı
Daha iyi bir başlık muhtemelen “İnsanların kullandığı malzemeleri 1.800 temel öğeye sıkıştırmak” olurdu
Gerçek tarifler, yani hazırlama yöntemleri ya da oranlar konusunda neredeyse hiçbir şey yok; ama dünya genelinde domatesin dana etiyle iyi gittiği gibi bilgiler, lezzet eşleşmeleri oluştururken oldukça yararlı ve ilginç bir kaynak olabilir
1.800 malzemenin tüm kombinasyonlarını içermiyor ama yaygın kullanılan otlar, baharatlar, sebzeler ve etleri oldukça iyi kapsıyor. Bu kitabı sıkıştırsanız bile metin boyutu muhtemelen o kadar büyük olmazdı
LLM tarafından üretilen tariflerin sorunu, pişirme tekniğinin inceliklerini kaçırmaları. Başarı çoğu zaman tek bir adıma ya da tek bir orana bağlı oluyor; örneğin “fried chicken”ın dünya çapında sayısız çeşidi var ama tariflerin ortalamasını almak lezzetli bir fried chicken üretmiyor
11 veri kaynağı çeşitli yaygın yemekleri kapsıyor ama veri kümesinin %90'ını İngilizce ve Çince kaynaklar oluşturuyor. Afrika ve Arap dünyası da veride yok; bu ikisi tek başına bile dünya nüfusunun yaklaşık %25'i ediyor
İngilizce dışındaki tüm terimlerin yapay zeka ile İngilizceye çevrilmiş olması yöntem açısından anlaşılabilir ama hata payı olduğu da açık
Dana eti yanlış pişirilirse sertleşebiliyor ama domatesin asidi onu yeniden yumuşatıyor
İlginç
Tarifleri küçük şemalara sıkıştırmaya çalışıyorum: https://leontrolski.github.io/recipes.html
Hep böyle bir şeyi hayal etmiştim ve tariflerin malzemeleri devasa, ayrıştırılmamış bir liste halinde verip sonra da “kuru malzemeleri derin bir kapta karıştırın” demesine hep sinir olmuşumdur
Bir süre, bunu iyi uygularsan kârlı olabileceğini düşünmüştüm ama artık güçlü bir arayüz ortaya çıkar çıkmaz kolayca kopyalanacak gibi geliyor
Tablo, Modernist Cuisine tariflerini hatırlattı. Orada malzemeler adımlara göre gruplanıyor ve ağırlıklar, bazen hacim ve oranlarla birlikte veriliyor
Örnek: https://modernistcuisine.com/wp-content/uploads/2013/01/Mac-...
Bu arada https://publicdomainrecipes.com sitesinin tamamı https://browse.library.kiwix.org üzerinde 22MiB'lik tek bir dosya olarak sunuluyor: https://browse.library.kiwix.org/viewer#publicdomainrecipes....
Tarif ekleme işlemi https://github.com/ronaldl29/public-domain-recipes üzerinden yapılabiliyor
“İngilizce, Çince, Rusça, Vietnamca, İspanyolca, Türkçe, Endonezce, Almanca, Hint İngilizcesi gibi 7 dilde 11 kaynak” ise buna insanlığın tüm mutfağı demek zor
Ama dünya genelinde çok popüler olan İtalyan, Japon, Yunan ve Meksika mutfakları eksik; ayrıca Afrika ve Orta Doğu da tamamen yok, dolayısıyla eksik bir çalışma
Makale bunu hızlıca kabul ediyor ama bunun dengeli bir veri kümesi olmadığı açık
[1] içinde, bu makalenin anlattığı şeyin önceki bir yinelemesi gibi görünen bir demo görülebiliyor
Demonun hangi malzemeleri seçtiğini merak ettiğim için, Peter Gilmore[2]’un “Organum: Nature, Texture, Intensity, Purity” kitabında geçen alışılmadık birkaç malzemeyi denedim. Kendisi Avustralya’nın Sidney kentindeki Quay restoranıyla tanınıyor
Ardıç meyvesi, macadamia, nigella tohumu, portakal çiçeği suyu, lemon verbena gibi oldukça iddialı malzemeleri biliyor ve susam yağı ile kavrulmuş susam yağını da ayırt ediyor. Malzeme listesinde yalnızca “pirinç”, “siyah pirinç”, “esmer pirinç”, “yapışkan pirinç” olsa da, “pirinç” seçildiğinde kızarmış pilav için pişirilmiş yasemin pirincinin soğutulmasını, pilav içinse basmati pirincinin ıslatılıp durulanmasını önerecek kadar akıllı
“Kuzu eti”ni seçip yanında braising’de sık kullanılan sebzeleri de seçince, omuz veya incik gibi uygun parçaları öneriyor
Üzüm çekirdeği yağı, orzo, mangosten, lemon myrtle’ı bilmiyor; karkalla gibi muhtemelen ancak Peter Gilmore düzeyinde birinin kullanacağı ve çoğu şefin adını bile duymadığı malzemeleri de doğal olarak bilmiyor. Ama bunlar bölgesel ya da çok özel malzemeler olduğu için bunu büyük bir sınırlama saymıyorum
“Kabak çekirdeği”ni biliyor ama “pumpkin”i bilmiyor, onu “squash” altında ele alıyor; yani Britanya/Amerikan İngilizcesi kullanımını iyileştirmek için daha fazla yerelleştirme gerekiyor. “Kuzu eti” ve “avokado”yu birleştirip salata yapmasını bekledim ama başaramadı; sonra malzeme listesinde marul ya da roka olmadığını, sadece Amerikan İngilizcesindeki “salad greens” ifadesinin bulunduğunu fark ettim. Başka salata malzemeleriyle, tavukla ya da proteinsiz de denedim ama salata yapmak yerine, protein parçasının etrafına domates jölesi (agar) ve avokado püresi yerleştirilmiş sahte lüks tabaklar üretmeye devam etti
[1] https://epicure.kaikaku.ai/
[2] https://en.wikipedia.org/wiki/Peter_Gilmore_(chef)
Amerikalılar açısından yaygın kullanılan birçok squash türü var ve pumpkin bunlardan sadece biri. Aklıma gelenler acorn, butternut, spaghetti; titiz davranırsak zucchini de buna dahil
Bunu X/Twitter’da gördüm ama insanlığın yemeklerini, tüm teknikleri, malzemeleri ve kültürel bağlama göre pişirme biçimlerini 2 megabayt içine sıkıştırabileceğine inanmak zor
Bu, “araç çağrısı ve kodlama yapabilen 1GB model” denilip denenince neredeyse hiç çalışmamasına benziyor. Teknik olarak 1GB’lık bir kodlama modeli olabilir ama bu, iyi bir model olduğu anlamına gelmiyor
İngilizce ve Almancayı içerip İtalyanca ve Fransızcayı dışarıda bırakan bir yemek modeli/korpusuna güvenmek zor
Gerçek Fransızca yazılmış tarifler eksik olabilir ama İngilizce yazılmış bir Fransız soğan çorbası tarifi kesinlikle vardır
“Tüm malzeme sınıflandırması [Claude] tarafından deterministik decoding (temperature 0–0.1) ile yapıldı” deniyor; bu bağlamda büyük bir sorun değil ama düşük temperature deterministik olmakla aynı şey değil
Clickbait’i bir kenara bırakırsak oldukça ilginç bir kavram. Bu tür embedding’lerle malzemeler ya da tat profilleri için bir word2vec anı gelip gelmeyeceğini merak ediyorum
Başkalarının da isabetle belirttiği gibi, bu daha temsili veri kaynaklarıyla yeniden yapılabilir ve bu yaklaşımın ne kadar etkili olacağını görmek ilginç olur
İlgili veri ve bilgileri Claude Code’a verip uygulatmayı denedim, sonuç oldukça iyi görünüyor
Tarif üretmekten ziyade ikame malzeme önerileri için daha uygun olabilir: https://viz.roshangeorge.dev/recipe-model/