2 puan yazan GN⁺ 2025-06-05 | 1 yorum | WhatsApp'ta paylaş
  • Ana sayfa banner’ı, müşterinin ilk ekranında en önce görünen kritik alanlardan biri ve aşırı kişiselleştirilmiş öneri sistemi ile tıklama oranı (CTR) ile kullanıcı deneyimini en üst düzeye çıkarıyor
  • Mevcut MAB (Multi-Armed Bandit) tabanlı basit CTR optimizasyonu yaklaşımından uzaklaşılarak, DeepFM·Two-Tower·HGNN gibi güncel algoritmalar ve grafik tabanlı embedding’lerle banner ve kullanıcı özellikleri daha hassas biçimde yansıtılıyor
  • Banner yaşam döngüsünün kısa olması, gürültülü tıklama geri bildirimi, veri dengesizliği gibi alana özgü sorunlar, Continual Learning ile ayrı model ve birleşik modelin hibrit işletimi gibi yöntemlerle çözülüyor
  • Sonuç olarak CTR’de %16’dan fazla artış sağlanırken, yeni banner’lar ve cold user senaryoları, gerçek zamanlı ve iş politikalarıyla bağlantılı sistematik bir öneri pipeline’ı kuruluyor
  • Bundan sonra da gerçek zamanlı serving, Multi-Task Learning, embedding kalitesinin geliştirilmesi, çok boyutlu performans metriklerinin eklenmesi gibi alanlarda sürekli evrim planlanıyor

Müşteriye özel büyük banner ile daha iyi bir deneyim oluşturmak

  • Müşteri zevkleri ve gösterilen içerik çeşitliliği arttıkça, tek tip banner gösterimiyle tatmin edici bir deneyim sunmanın sınırlarına gelindi
  • Hedef CTR’yi en üst düzeye çıkarmak olduğundan, her mağaza ana sayfasının üst kısmındaki büyük banner’a kişiselleştirilmiş gösterim mantığı ekleyen bir proje yürütüldü

Ana sayfa banner’ının önemi ve özellikleri

  • Ana sayfa banner’ı, Musinsa hizmetinde müşterinin ilk karşılaştığı ekranın en üstündeki kaydırmalı banner alanı (toplam 35 adet); uygulamada bir, web’de ise üç adet gösteriliyor
  • Musinsa toplam trafiğinin yaklaşık %97’si, ana ekrana girişte ana sayfa banner’ıyla karşılaşıyor
  • Ana sayfa banner tıklamaları, toplam tıklamaların %35’ini ve tıklama oluşan oturumların %37’sini oluşturacak kadar yüksek paya sahip
  • Yüksek gösterim sıklığı nedeniyle iş dönüşümüne etkisi çok büyük bir alan

Mevcut öneri yönteminin sınırları

  • Önceden MAB (Multi-Armed Bandit) algoritması kullanılarak CTR odaklı öneri yapılıyordu
    • Exploration ve Exploitation dengesinin ayarlanması
  • Üç temel sınırlama vardı:
    • Tek bir CTR metriğine bağımlılık nedeniyle farklı müşteri tercihleri ve banner özellikleri yeterince yansıtılamıyordu
    • Banner ilişkilerini yansıtmak zordu (bağımsız işleniyordu)
    • Cold start sorunu vardı (yeni banner için tıklama verisi az olduğunda performans düşüyordu)
  • Bu sınırları aşmak için yeni bir öneri sistemi tasarlandı

Öneri sistemi pipeline’ı

  • Sistem çok aşamalı bir pipeline olarak yapılandırıldı
    1. Banner representation güçlendirme: Banner ile ilgili metin, görsel ve ilişkili ürünler tabanlı embedding’ler çıkarıldı (HGNN, GraphSAGE kullanıldı)
    2. Tıklama tahmin modeli eğitimi: DeepFM (özellik etkileşimi) ve Two-Tower (kullanıcı/banner ayrık embedding) modelleri aynı anda uygulandı
    3. Banner scoring ve uygulama: Kullanıcı bazında CTR tahmin skoru batch ve gerçek zamanlı olarak hesaplandı
      • Verisi yeterli kullanıcılar için daha hassas kişiselleştirme
      • Yeni ve cold user’lar için segment tabanlı öneri
    4. İş politikalarının yansıtılması: Sistem puanlamasına ek olarak şirket politikaları ve stratejileri, kampanya banner’ları, acil değişiklikler de gerçek zamanlı yansıtıldı
    5. Nihai banner gösterimi: Skoru yüksek Top-N banner’lar son öneri olarak seçilip gösterildi

Önerideki temel modellerin tanıtımı

  • DeepFM: FM (2. derece etkileşim) + DNN (yüksek boyutlu etkileşim) paralel yapısıyla hem seyrek veriyi hem de karmaşık etkileşimleri etkili biçimde öğrenir; CTR tahmininde güçlüdür
  • Two-Tower: Kullanıcı ve banner için ayrı sinir ağlarından embedding çıkarır; büyük ölçekli veri ve gerçek zamanlı serving’de güçlüdür, benzerlik tabanlı öneri sunar

DeepFM

  • FM katmanı (2. derece özellik etkileşimi) + DNN katmanı (yüksek boyutlu doğrusal olmayan özellik entegrasyonu) birleşimi
  • Seyrek veride güçlüdür ve End-to-End öğrenme yapısıyla tutarlı performans optimizasyonu sağlar
  • Özellik olarak kullanıcı bilgisi, banner meta verisi ve embedding (64 boyutlu) bilgisi kullanılır
  • Embedding vektörleri tek bir blok olarak işlenerek eğitim verimliliği ve kararlılığı sağlanır
  • CTR tahmin sonucuna göre banner sıralaması oluşturulur

Two-Tower

  • Kullanıcı ve banner ayrı sinir ağlarında (tower) embedding’e dönüştürülür ve benzerlik hesaplanır
  • Büyük ölçekli veri için uygun ölçeklenebilirlik ve önceden vektörleştirilmiş hızlı yanıt (düşük gecikme) sağlar
  • Her tower’da demografi, davranış log’ları, metin/görsel gibi çeşitli giriş bilgileri kullanılır
  • Ayrık eğitim ve paralel işleme yapısıyla büyük öneri problemlerine hızlı ve esnek şekilde yanıt verir

Gerçek uygulamada karşılaşılan başlıca zorluklar

  • Ana sayfa banner’larının yaşam döngüsü çok kısadır (2-3 gün, bazen saatlik düzeyde), bu yüzden gerçek zamanlı yansıtma gerekir
  • Geri bildirim sinyali çoğunlukla tıklamaya dayandığından, kullanıcının gerçek tercihlerini ayırt etmek zordur
  • Banner’larda ürün ve markalardaki gibi yapılandırılmış meta veri azdır; görsel ve metin gibi bağlamları anlamak zordur
  • Mağaza bazlı veri dengesizliği (özel kategori mağazaları arasındaki trafik ve aktivite farkı) genel performansı düşürebilir
  • Bu sorunları aşmak için sistem; ifade gücünü artırma, güncelliği koruma ve dengesizliği azaltma olmak üzere üç teknik eksen etrafında yeniden tasarlandı

Somut iyileştirme yöntemleri

Banner özelliklerini güçlendirme

  • Ortalama PinSAGE embedding kullanımının sınırlarını (karmaşık banner temsili yetersizliği, yeni banner önerememe) aşmak için HGNN devreye alındı
  • Kullanıcı davranış kalıplarına dayanarak, grafik yapısı içindeki banner-ürün ilişkileri GraphSAGE ile embedding’e dönüştürüldü
  • Metin ve görsel bilgileri için LLM embedding kombinasyonları kullanıldı
  • Gerçek zamanlı kullanıcı embedding güncellemesi ve Continual Learning ile güncel kullanıcı ilgi alanları yansıtıldı
  • CTR’de %8,3 artış

Continual Learning

  • Tüm veriyi toplu eğitme yaklaşımından çıkılıp, sürekli güncelleme getirildi (saatlik, son 3 saatin log’ları)
  • Aktivite miktarına göre öğrenme oranı dinamik biçimde ayarlandı (hafta içinde en fazla 5 kat, gece 2 kat)
  • Hızlı adaptasyon ve model eskimesini önleme ile performans kaybı olmadan hızlı öneri yansıtılması sağlandı
  • CTR’de %24 artış

Stratejik model seçimi

  • Mağaza bazında en uygun modelleme stratejisi belirlendi
  • Ana mağazada DeepFM + Continual, özel mağazalarda ise ayrı Two-Tower modelleri kullanıldı ve CTR’de %19 artış sağlandı

Nihai sonuçlar

  • Mevcut MAB’e kıyasla Two-Tower %11,2, DeepFM %16,1 CTR artışı elde edildi
  • Musinsa ana sayfasında DeepFM + Continual Learning, özel mağazalarda ise Two-Tower modeli gerçek kullanımda uygulandı

Gelecek yönelim

  • Gerçek zamanlı serving mimarisine geçiş, Multi-Task Learning eklenmesi (CTR + GGMV), embedding kalitesi ve grafik yapısının iyileştirilmesi, performans metriklerinin çeşitlendirilmesi gibi geliştirmeler planlanıyor
  • Tek bir CTR metriğinden çıkıp, çeşitli iş hedefleriyle nitel deneyimi de değerlendiren bir modele evrilmesi hedefleniyor

1 yorum

 
codemasterkimc 2025-06-05

Güzel bir yazı olmuş ~