3 puan yazan GN⁺ 2024-11-21 | 1 yorum | WhatsApp'ta paylaş
  • Niantic, büyük ölçekli makine öğreniminden yararlanarak sahneleri anlayan ve bunları dünya genelindeki milyonlarca farklı sahneyle ilişkilendiren büyük bir coğrafi uzamsal model (LGM) geliştiriyor
  • İnsanlar mekânsal kavrayışları sayesinde yapıları farklı açılardan hayal edebilir, ancak bu makineler için zor bir görevdir
  • Niantic'in Visual Positioning System'i (VPS), 1 milyondan fazla konumda çalışabilecek şekilde 5 milyardan fazla nöral ağı eğitti
  • Büyük coğrafi uzamsal model nedir?
    • LGM, bilgisayarların fiziksel dünyayı algılamasına, anlamasına ve içinde gezinmesine yardımcı olur
    • LLM'lere benzer şekilde LGM, çok büyük miktarda ham veri kullanılarak oluşturulur; bu da mekân, yapı ve fiziksel etkileşimlere dair konum tabanlı bir anlayış sağlar
    • 3D görme modellerinin ötesine geçen coğrafi uzamsal model, belirli coğrafi konumlara dayanır ve hassas ölçek birimleriyle ölçülebilir
  • Niantic'in çalışmasının durumu
    • Son 5 yılda Niantic, kullanıcıların dijital içeriği fiziksel ortama doğru şekilde yerleştirebilmesini sağlamak için VPS'yi inşa etti
    • VPS, kullanıcı taramalarıyla oluşturulur; bu taramalar yaya bakış açısından toplanan verilerden oluşur ve araçla erişilemeyen yerleri de kapsar
    • Şu anda dünya genelinde taranmış 10 milyon konum bulunuyor ve her hafta 1 milyon yeni tarama toplanıyor
  • Yerel sistemlerden paylaşılan anlayışa
    • Mevcut nöral haritalar kullanılabilir coğrafi uzamsal modeller olsa da LGM, birbirinden bağımsız yerel haritaların ötesine geçen bir vizyona sahip
    • LGM, yerel modeller arasında veri paylaşımını mümkün kılar ve belirli bir konumdaki bir binanın arka görünümünü çıkarabilir
    • Bu, coğrafi uzamsal ve görsel verilere dayalı merkezi bir dünya anlayışını hayata geçirir
  • İnsan benzeri anlayış
    • İnsanlar, gördükleri şeyi farklı açılardan da tanıyabilme yeteneğine sahiptir
    • Bu tür bir anlayış pratikte ancak büyük ölçekli makine öğrenimiyle elde edilebilir ve Niantic bunu hedefliyor
  • Tamamlayıcı foundation model'lere doğru gelişim
    • LGM, yalnızca konumlandırmanın ötesinde kullanılabilir; sahne temsili, manipülasyonu ve üretimi için yeni yöntemler mümkün kılar
    • Farklı türde foundation model'ler birbirini tamamlar ve bu sistemler fiziksel dünyayı algılayıp anlayarak onun içinde çalışabilir
    • Niantic, büyük coğrafi uzamsal model geliştirmede öncülük ederek kullanıcılara yeni deneyimler sunmayı hedefliyor

1 yorum

 
GN⁺ 2024-11-21
Hacker News görüşleri
  • Bir Pokémon GO oyuncusu olarak, oyun aracılığıyla eğitim verisi sağlamam onların benim emeğimden kâr etmesi gibi hissettiriyor. PokéStop tarama işi, verilen ödüle kıyasla çok fazla emek gerektirdiği için bunu yapmayı bıraktım. Eğer modeli ve ağırlıkları yayımlasalardı, daha büyük bir kamusal faydaya katkı sunduğumu hissederdim.

  • Pokémon GO’nun AR teknolojisi yavaş olduğu için pek kullanmıyordum; şimdi ise LGM eğitiminde kullanılacak kadar gelişmiş olması şaşırtıcı. Ekonomik açıdan da oyuncular ücretsiz bir oyun alıyor, Niantic gelir elde ediyor ve dünyaya yeni teknoloji sunuluyor.

  • MyFitnessPal’de kullanıcı barkod taradığında arka plan gürültüsü toplanıp eğitim verisi olarak kullanılıyor. Bu sayede ortalama bir kiler, buzdolabı ve süpermarket koridoru hakkında bilgi edinilebiliyor.

  • Bu blog yazısı ve HN’deki tepkiler kafa karıştırıcı. Aslında modeli eğittiklerini değil, buna dair bir plan açıkladılar. 50 milyon sinir ağını eğittiklerini söylüyorlar ama bu zaten daha önce yaptıkları işin bir parçası gibi görünüyor. Niantic’i bir yapay zeka şirketi olarak konumlandırmaya çalışan bir vizyon belgesine benziyor.

  • Coğrafi uzamsal verilerin kamusal bir varlık olması gerektiğine dair felsefi bir görüş var. Kitle kaynaklı veriler sıradan insanlardan geldiği için, bilgi ve olguların kamunun ortak varlığı olması gerektiği düşünülüyor.

  • Gerçek zamanlı olarak 3D sahneler üretmenin geleceğin haritası olduğunu düşünmüyorum. Binalar, yollar, tabelalar gibi şeyler oldukça statik ve çoğu kullanım senaryosunda büyük bir değişim yok. Doğru modeli buluttan almak daha faydalı olurdu.

  • Muhtemelen Google/Niantic toplantılarında, kitle kaynak kullanımıyla yeni nesil 3D modeller inşa etme fikri ortaya çıktı. Bunu hayata geçirmek için Pokémon haklarını satın aldılar.

  • Brian Maclendon (Niantic), Bellingfest sunumunda bununla ilgili ilginç ayrıntılar paylaştı.

  • LGM’nin ne olduğunu anlamak zor. Coğrafi uzamsal veriden çok, binaların arka yüzünü tahmin eden bir görsel modelin iyileştirilmesiyle ilgili gibi duruyor. Eğitim verisi, Pokémon yakalanırken üretilen görüntülerden geliyor.

  • CIA’in buna zaten erişimi olabileceği yönünde bir görüş var. Gizlilik endişeleri yıllardır dile getiriliyordu.