4 puan yazan GN⁺ 2025-01-19 | 1 yorum | WhatsApp'ta paylaş
  • Kültürel bağlam

    • StarCraft: Brood War (bundan sonra BW), Kore'de çok önemli bir oyun; profesyonel oyuncuların, takımların ve turnuvaların büyük bölümü Kore merkezli.
    • BW, satranca benzer bir strateji oyunu olduğu için yalnızca oynamak değil, oyunu incelemek de önemli.
    • Satrançtaki açılışlar gibi, BW'de de belirli stratejiler ve build'ler var; bunlar topluluk içinde gelişmiş, alana özgü bir dil oluşturuyor.
  • Yabancıların bilgiye erişim sorunu

    • Yabancı topluluğun büyük kısmı Koreceye hâkim değil.
    • Koreceyi akıcı konuşan yabancılar nadir olduğundan, yabancı topluluğun bilgiye erişimi Kore topluluğuna kıyasla daha sınırlı.
    • Makine çevirisi, alana özgü dili çevirmekte yetersiz kalıyor; bu da yabancı topluluğun Kore topluluğunun gerisinde kalmasına yol açan etkenlerden biri.
  • Yeni çeviri süreci

    • Yeni bir makine çevirisi süreci sayesinde daha doğru çeviriler sunmak mümkün hale geldi.
    • Günde yaklaşık 7 video çevrilebildi; bu da öncekine göre çok daha hızlı bir tempo.
  • Teknoloji yığını

    • Sistem, altyazı üretimi ve tüketimi olmak üzere iki parçaya ayrılıyor.
    • Videonun ses parçasını indirip altyazı üretmek için yt-dlp ve OpenAI Whisper kullanılıyor.
    • Google Colab, Whisper'ı çalıştırmak ve video URL'si girdisiyle Korece SRT dosyası üretmek için kullanılıyor.
    • Çeviri doğruluğunu artırmak için LLM ve argo sözlüğü kullanılıyor.
  • Altyazı tüketimi

    • TamperMonkey kullanılarak YouTube videolarına bir düğme ekleniyor ve çevrilmiş altyazıların indirilebilmesi sağlanıyor.
    • Altyazıları paylaşmak ve yönetmek için Pastebin ile Google Sheets + Apps Script kullanılıyor.
  • İyileştirmeler

    • Birden fazla dili destekleme özelliği eklenebilir.
    • Teknik iyileştirme olarak, düğmenin yalnızca belirli videolarda gösterilmesi özelliği eklenebilir.
  • Son düşünceler

    • Performans, ölçeklenebilirlik ve gecikme gibi konular önemli değil; mevcut çözümler birleştirilerek proje tamamlanmış.
    • Kullanıcı betiği ile Colab notebook'undaki Python kodu kısa ve bakımı kolay.
    • Bu proje en basit haliyle bir CRUD sistemi ve karmaşıklığın ciddi biçimde artması için bir neden yok.

1 yorum

 
GN⁺ 2025-01-19
Hacker News görüşleri
  • Koreli bir BW oyuncusu ve konuşma tanıma araştırmacısı olarak bu yazıyı ilginç buldum. Başta Korece transkripsiyonda çok hata vardı ama LLM'ler bunları etkileyici biçimde düzeltti. Örneğin, "12 anmadang build" aslında "12 apmadang build" idi. tuecheori build ifadesi tuhaecheori build olarak yazıya geçirilmeliydi.

    • Whisper'ın çıkarım sürecine doğrudan bir slang sözlüğü vermek yardımcı olabilir. En basit yöntem, son tahmin katmanında sözlükteki slang kelimelerin olasılığını belirli bir oranda artırmak. Bu, HuggingFace kütüphanesi kullanılarak kolayca uygulanabilir.
  • Başlığa aldanmayın. Bu yazı, StarCraft yorumlarını çevirmek ve erişilebilirliği artırmak için son derece kapsamlı ve yaratıcı bir yaklaşım sunuyor.

    • Oyun anlatımı 27 yıl boyunca kendine özgü bir alan dili haline gelmiş.
    • Otomatik betikleme ve AI kullanarak bunu yaklaşık olarak anlayıp tutarlı hale getirme yaklaşımı çok havalı.
  • İngilizce dışı bir dil kullanan biri olarak bu yazıyı okurken bilgisayar makaleleri ve yazılım geliştirme çevirisinin zorluklarını düşündüm.

    • Çevirmesi zor çok fazla terim var. Tek çözüm, terimleri dile uyarlayarak benimsemek gibi görünüyor.
    • Yazılım geliştirmeyi İspanyolca konuşurken İngilizceden alınmış çok sayıda terim kullanılıyor.
    • Otomatik çevirinin bunu nasıl ele alacağını merak ediyorum; toplumsal olarak iki dili karıştıran bir sürece ihtiyaç var.
  • Google Translate sürümünü gayet anlayabildim. Bunun nedeni BW'ye ve zerg 12hatch açılışına aşina olmam olabilir.

    • ChatGPT ve Claude, Korece metni çevirmede harika iş çıkarmış.
    • Claude'un çeviri örneği: 12 hatchery build'i açıklıyor ve Protoss ile Terran'a karşı build order'ı anlatıyor.
  • Çeviriyle ilgili bir yazıda signal-to-noise ratio'nun tamamen ters anlaşılmış olması komikti. Yüksek signal-to-noise ratio iyi bir şeydir.

  • Bant genişliğinden tasarruf etmek için yt-dlp ile daha düşük kaliteli video indirilebilir.

    • Örnek komut: yt-dlp -f "bv[height<=720]" <url>
  • Çocukken money map oynayan biri olarak binaların önündeki sayıların ne anlama geldiğini merak etmiştim.

    • 12 hatchery gibi sayılar muhtemelen build order içindeki konumu gösteriyor.
  • Google Translate gelişti ama Go oyunuyla ilgili Çince veya Japonca metinleri etkili biçimde çeviremiyordu.

    • Modern LLM'ler kullanılarak Go terimlerini içeren çeviri istekleri yapılabilir.
  • Bu yazıyı sevdim. World Cyber Games Amerika bölge elemelerini denediğimde diğer insanların ne kadar hızlı olduğuna şaşırmıştım.

    • Kore'deki canlı yayınları izleyip onların hızından etkilenmiştim.
    • Stratejik açıdan ne kadar temel şeyleri kaçırdığımı fark ettim.
  • "natural expansion" ifadesinin "courtyard" olarak çevrilmesi "yanlış", ama yine de hoşuma gitti.