- Ana sayfa banner’ı, müşterinin ilk ekranında en önce görünen kritik alanlardan biri ve aşırı kişiselleştirilmiş öneri sistemi ile tıklama oranı (CTR) ile kullanıcı deneyimini en üst düzeye çıkarıyor
- Mevcut MAB (Multi-Armed Bandit) tabanlı basit CTR optimizasyonu yaklaşımından uzaklaşılarak, DeepFM·Two-Tower·HGNN gibi güncel algoritmalar ve grafik tabanlı embedding’lerle banner ve kullanıcı özellikleri daha hassas biçimde yansıtılıyor
- Banner yaşam döngüsünün kısa olması, gürültülü tıklama geri bildirimi, veri dengesizliği gibi alana özgü sorunlar, Continual Learning ile ayrı model ve birleşik modelin hibrit işletimi gibi yöntemlerle çözülüyor
- Sonuç olarak CTR’de %16’dan fazla artış sağlanırken, yeni banner’lar ve cold user senaryoları, gerçek zamanlı ve iş politikalarıyla bağlantılı sistematik bir öneri pipeline’ı kuruluyor
- Bundan sonra da gerçek zamanlı serving, Multi-Task Learning, embedding kalitesinin geliştirilmesi, çok boyutlu performans metriklerinin eklenmesi gibi alanlarda sürekli evrim planlanıyor
Müşteriye özel büyük banner ile daha iyi bir deneyim oluşturmak
- Müşteri zevkleri ve gösterilen içerik çeşitliliği arttıkça, tek tip banner gösterimiyle tatmin edici bir deneyim sunmanın sınırlarına gelindi
- Hedef CTR’yi en üst düzeye çıkarmak olduğundan, her mağaza ana sayfasının üst kısmındaki büyük banner’a kişiselleştirilmiş gösterim mantığı ekleyen bir proje yürütüldü
Ana sayfa banner’ının önemi ve özellikleri
- Ana sayfa banner’ı, Musinsa hizmetinde müşterinin ilk karşılaştığı ekranın en üstündeki kaydırmalı banner alanı (toplam 35 adet); uygulamada bir, web’de ise üç adet gösteriliyor
- Musinsa toplam trafiğinin yaklaşık %97’si, ana ekrana girişte ana sayfa banner’ıyla karşılaşıyor
- Ana sayfa banner tıklamaları, toplam tıklamaların %35’ini ve tıklama oluşan oturumların %37’sini oluşturacak kadar yüksek paya sahip
- Yüksek gösterim sıklığı nedeniyle iş dönüşümüne etkisi çok büyük bir alan
Mevcut öneri yönteminin sınırları
- Önceden MAB (Multi-Armed Bandit) algoritması kullanılarak CTR odaklı öneri yapılıyordu
- Exploration ve Exploitation dengesinin ayarlanması
- Üç temel sınırlama vardı:
- Tek bir CTR metriğine bağımlılık nedeniyle farklı müşteri tercihleri ve banner özellikleri yeterince yansıtılamıyordu
- Banner ilişkilerini yansıtmak zordu (bağımsız işleniyordu)
- Cold start sorunu vardı (yeni banner için tıklama verisi az olduğunda performans düşüyordu)
- Bu sınırları aşmak için yeni bir öneri sistemi tasarlandı
Öneri sistemi pipeline’ı
- Sistem çok aşamalı bir pipeline olarak yapılandırıldı
- Banner representation güçlendirme: Banner ile ilgili metin, görsel ve ilişkili ürünler tabanlı embedding’ler çıkarıldı (HGNN, GraphSAGE kullanıldı)
- Tıklama tahmin modeli eğitimi: DeepFM (özellik etkileşimi) ve Two-Tower (kullanıcı/banner ayrık embedding) modelleri aynı anda uygulandı
- Banner scoring ve uygulama: Kullanıcı bazında CTR tahmin skoru batch ve gerçek zamanlı olarak hesaplandı
- Verisi yeterli kullanıcılar için daha hassas kişiselleştirme
- Yeni ve cold user’lar için segment tabanlı öneri
- İş politikalarının yansıtılması: Sistem puanlamasına ek olarak şirket politikaları ve stratejileri, kampanya banner’ları, acil değişiklikler de gerçek zamanlı yansıtıldı
- Nihai banner gösterimi: Skoru yüksek Top-N banner’lar son öneri olarak seçilip gösterildi
Önerideki temel modellerin tanıtımı
- DeepFM: FM (2. derece etkileşim) + DNN (yüksek boyutlu etkileşim) paralel yapısıyla hem seyrek veriyi hem de karmaşık etkileşimleri etkili biçimde öğrenir; CTR tahmininde güçlüdür
- Two-Tower: Kullanıcı ve banner için ayrı sinir ağlarından embedding çıkarır; büyük ölçekli veri ve gerçek zamanlı serving’de güçlüdür, benzerlik tabanlı öneri sunar
DeepFM
- FM katmanı (2. derece özellik etkileşimi) + DNN katmanı (yüksek boyutlu doğrusal olmayan özellik entegrasyonu) birleşimi
- Seyrek veride güçlüdür ve End-to-End öğrenme yapısıyla tutarlı performans optimizasyonu sağlar
- Özellik olarak kullanıcı bilgisi, banner meta verisi ve embedding (64 boyutlu) bilgisi kullanılır
- Embedding vektörleri tek bir blok olarak işlenerek eğitim verimliliği ve kararlılığı sağlanır
- CTR tahmin sonucuna göre banner sıralaması oluşturulur
Two-Tower
- Kullanıcı ve banner ayrı sinir ağlarında (tower) embedding’e dönüştürülür ve benzerlik hesaplanır
- Büyük ölçekli veri için uygun ölçeklenebilirlik ve önceden vektörleştirilmiş hızlı yanıt (düşük gecikme) sağlar
- Her tower’da demografi, davranış log’ları, metin/görsel gibi çeşitli giriş bilgileri kullanılır
- Ayrık eğitim ve paralel işleme yapısıyla büyük öneri problemlerine hızlı ve esnek şekilde yanıt verir
Gerçek uygulamada karşılaşılan başlıca zorluklar
- Ana sayfa banner’larının yaşam döngüsü çok kısadır (2-3 gün, bazen saatlik düzeyde), bu yüzden gerçek zamanlı yansıtma gerekir
- Geri bildirim sinyali çoğunlukla tıklamaya dayandığından, kullanıcının gerçek tercihlerini ayırt etmek zordur
- Banner’larda ürün ve markalardaki gibi yapılandırılmış meta veri azdır; görsel ve metin gibi bağlamları anlamak zordur
- Mağaza bazlı veri dengesizliği (özel kategori mağazaları arasındaki trafik ve aktivite farkı) genel performansı düşürebilir
- Bu sorunları aşmak için sistem; ifade gücünü artırma, güncelliği koruma ve dengesizliği azaltma olmak üzere üç teknik eksen etrafında yeniden tasarlandı
Somut iyileştirme yöntemleri
Banner özelliklerini güçlendirme
- Ortalama PinSAGE embedding kullanımının sınırlarını (karmaşık banner temsili yetersizliği, yeni banner önerememe) aşmak için HGNN devreye alındı
- Kullanıcı davranış kalıplarına dayanarak, grafik yapısı içindeki banner-ürün ilişkileri GraphSAGE ile embedding’e dönüştürüldü
- Metin ve görsel bilgileri için LLM embedding kombinasyonları kullanıldı
- Gerçek zamanlı kullanıcı embedding güncellemesi ve Continual Learning ile güncel kullanıcı ilgi alanları yansıtıldı
- CTR’de %8,3 artış
Continual Learning
- Tüm veriyi toplu eğitme yaklaşımından çıkılıp, sürekli güncelleme getirildi (saatlik, son 3 saatin log’ları)
- Aktivite miktarına göre öğrenme oranı dinamik biçimde ayarlandı (hafta içinde en fazla 5 kat, gece 2 kat)
- Hızlı adaptasyon ve model eskimesini önleme ile performans kaybı olmadan hızlı öneri yansıtılması sağlandı
- CTR’de %24 artış
Stratejik model seçimi
- Mağaza bazında en uygun modelleme stratejisi belirlendi
- Ana mağazada DeepFM + Continual, özel mağazalarda ise ayrı Two-Tower modelleri kullanıldı ve CTR’de %19 artış sağlandı
Nihai sonuçlar
- Mevcut MAB’e kıyasla Two-Tower %11,2, DeepFM %16,1 CTR artışı elde edildi
- Musinsa ana sayfasında DeepFM + Continual Learning, özel mağazalarda ise Two-Tower modeli gerçek kullanımda uygulandı
Gelecek yönelim
- Gerçek zamanlı serving mimarisine geçiş, Multi-Task Learning eklenmesi (CTR + GGMV), embedding kalitesi ve grafik yapısının iyileştirilmesi, performans metriklerinin çeşitlendirilmesi gibi geliştirmeler planlanıyor
- Tek bir CTR metriğinden çıkıp, çeşitli iş hedefleriyle nitel deneyimi de değerlendiren bir modele evrilmesi hedefleniyor
1 yorum
Güzel bir yazı olmuş ~