Google'daki bozulma
(baldurbjarnason.com)- Google ve Facebook kaynaklı web medya trafiğine artık istikrarlı biçimde güvenmek zorlaştıkça, tutumlu şekilde işletilen bağımsız yayınların da hayatta kalma temeli sarsılıyor
- Google, arama kalitesini iyileştirmek için makine öğrenimi tabanlı sıralama getirdi; ancak LLM üretimi spam’in süzgeçten geçtiği, blogların ve küçük sitelerin ise sonuçlardan geri itildiği eleştirilerine maruz kaldı
- 2024 Google Web Creator Summit katılımcılarından biri, önceki yıl gelirinin 250 bin dolar olduğunu ancak trafiğinin %97 azaldığını ve gıda bankasına bağımlı hale geldiğini söyledi
- Summit katılımcıları Google’ın “sorunun içerik olmadığını” söylediğini aktardı; Danny, örnekleri mühendislik ekibiyle debug etti ancak neden görünmediklerini bulamadı
- Arama sıralama sistemi Google içinde bile anlaşılması zor bir kara kutu haline geldikçe, tekel konumunda ürünün kullanışlılığındaki düşüşün iş sonuçlarına doğrudan yansımadığı eleştirisiyle ilişkilendiriliyor
Bağımsız web medyasının trafik çöküşü
- “The End Of Independent Publishing And Giant Freakin Robot”, Giant Freakin Robot’un kapanışını duyurarak son 2 yılda yüzlerce bağımsız yayıncının kapandığını ve binlercesinin daha aynı yolu izleyeceğini belirtiyor
- Çeşitli konulardaki bağımsız yayıncılarla temas sonucunda, iyi giden kimsenin olmadığı ve çoğunun yakında kapanmayı beklediği aktarılıyor
- Sorun Google’a doğrudan iletildi, ancak gelen mesaj Google’ın bunu umursamadığı yönündeydi; hatta “sektörümüz bitti” ifadesi kullanıldı
- Web medya şirketleri artık Google veya Facebook’tan gelen yönlendirme trafiğine istikrarlı biçimde güvenemiyor; elde kalan trafikle ayakta kalabileceklerin sayısı ise çok az
Arama sıralamasının kara kutuya dönüşme süreci
- Sorun yalnızca bazı sitelerin başarısızlığıyla sınırlı değil; Google’ın arama sonuçlarını düzeltmek için site sıralamasında makine öğrenimi kullanma süreciyle bağlantılı
- What we can learn from the Google creators summit for HCU impacted sites yazısına göre helpful content system, iyi ve kötü örneklerden öğrenerek daha önce görmediği bir örneğin hangisine daha yakın olduğunu tahmin eden bir makine öğrenimi sistemiydi
- Ancak son 1 yılda Google Search, çok sayıda LLM üretimi spam’i geçirdiği ve bloglar ile küçük siteleri çoğu sonuçtan neredeyse yok ettiği yönünde eleştirildi
- Bazı siteler makine öğrenimi modeli tarafından fiilen dışarıda bırakıldı ve bunun kesin nedeni kimsenin bilmediği bir durum olarak kaldı
- I Drank the Kool-Aid at the 2024 Google Web Creator Summit yazısında bir katılımcı, önceki yıl 250 bin dolar gelir elde ettikten sonra trafiğinin %97 düştüğünü ve şu anda yemek için gıda bankasına başvurduğunu söyledi
- Bu kişilerin Google’ın arama sonuçlarında görmek istediği içerikleri üreten insanlar oldukları için Summit’e davet edilmiş olması, sorunu daha belirgin hale getiriyor
- Twitter’daki konuşmada, Google tarafının birkaç kez “sorunun içerik olmadığını” söylediği; Danny’nin katılımcıların örneklerini alıp mühendislik ekibiyle debug ettiği ancak neden gösterilmediklerini anlayamadığı bilgisi paylaşıldı
- Arama algoritması, Google mühendislerinin bile kavramakta zorlandığı bir kara kutuya dönüşmüş görünüyor
Ürün bozulmasının iş sonuçlarına yansımadığı yapı
- Google’ın ML uzmanlarının, LLM’in ürünü karmaşık ve kontrol edilmesi zor hale getirebileceği konusunda uyarıp bundan kaçınılması gerektiğini söylemiş olması da bu sorunla bağlantılı
- Büyük çaplı işten çıkarmalarla iç sistemleri derinlemesine anlayan kişiler ayrıldığında, geride kalan sistemler daha kolay kara kutulaşabilir
- Bozulmanın sürmesinin temel nedeni, Google’ın iş sonuçlarını doğrudan etkilememesi; tekel şirketler ürünün kullanışlılığı azalsa bile çevrede oluşan değeri ele geçirebilir
- ABD’deki siyasi durum dikkate alındığında, teknoloji sektöründeki tekel ve oligopollerin daha da güçleneceği; ürünlerin gerçek üretkenliği, performansı ve etkisinin giderek daha az önemli hale geleceği öngörüsüne varılıyor
1 yorum
Hacker News yorumları
Temelde bunun, reklam tarafındaki insanların arama motoru tarafındaki insanlarla güç mücadelesini kazandığı andan itibaren başladığını düşünüyorum. Eskiden reklamlar, harika teknolojiler geliştirmeyi finanse eden bir araçtı; ayrıca inanılmaz zengin olmanın da bir yoluydu.
Şimdi ise sistemden son değer damlasına kadar emip rakamları sonsuza dek yukarı taşımaya yarayan bir araçtan ibaret ve Google’ın üst düzey liderliğinde vizyon ya da strateji de tamamen yok gibi görünüyor.
Google Docs da 2006’da şaşırtıcıydı ama neredeyse 20 yıl sonra bugün yalnızca küçük kullanılabilirlik iyileştirmeleri gördü; geri kalanların çoğu da ya kapatıldı, ya baştan beri pek yenilikçi değildi ya da başkalarının işlerini cansızca takip etmekten ibaret görünüyor.
Reklamlar üstteki sponsorlu sonuçları doldurabilir ama organik arama sonuçlarını etkilemez. “Reklam tarafı kazandı” sponsorlu slotların arttığı anlamına geliyorsa, bu sadece slotların arttığı anlamına gelir; organik sonuçların kalitesini açıklamaz.
Değilse, o harika teknoloji reklam hedeflerini çekmek için kullanılan yem, yani reklam hizmeti teknolojisinin bir bileşeni olabilir. Ayrıca neden reklam personeli işe almak yerine o teknolojiyi satmadıkları ya da lisanslamadıkları da merak konusu.
Morgan’ın söylediği gibi Danny’nin mühendis ekibiyle bir odada oturup örnekler göstererek “neden bu insanlar çıkmıyor?” diye sorması ve onların hata ayıklama prosedürünü izleyip nedeni bulamamış olması etkileyici.
Öte yandan İsveç’te bir kişi, oturma odasındaki masaüstü sınıfı tek bir makineyle, Google başarısız olduğunda sık sık geçiş yapacak kadar iyi bir arama motoru yaptı. Bugünlerde Kagi kullanıyorum; öncelik ve engelleme listeleri var ama sonuçlar varsayılan olarak iyi olduğu için bu özellikleri kullanmıyorum.
Kagi kendi dizinini oluşturuyor olsa da uzun süre Google+Bing sonuçlarını sarmalayıp yeniden satmaya daha yakın bir şeydi; buna rağmen çok daha iyi olması ilginç.
Olasılıklar iki tane: Kagi ya üstteki birkaç düzine sonucu okuyup yeniden sıralayan çok akıllı bir sisteme sahip ya da daha muhtemel olarak API erişimi sayesinde Google’ın giriş tarafındaki “sorgu genişletme ve aptallaştırma aygıtını” ve çıkış tarafındaki kişiselleştirme aşamasını atlayıp, Google aramasının hâlâ çalışan çekirdeğiyle doğrudan etkileşime giriyor.
Buradaki “aptallaştırma aygıtı”,
obscure-js-libyi adı benzer olanwell-knowm-js-lib-with-kind-of-similar-namee dönüştüren ya da Angular’ınmat-tableını aradığınızda Angular’la ilgisi olmayan, üzerinde paspas olan masalar istediğinize karar veren türden bir pipeline’ı ifade ediyor.exactly-this-thing.pyaradığınızda “Aslındasorta-related.jsdemek istediniz, buyurun” diye sonuç veriyor gibi. İnsanın içinden “Ben kekelemiş miydim?” demek geliyor.Yazarın tam olarak hangi sorundan söz ettiğini pek anlayamadım. Bazı sitelerin iş modelini arama sonuçları üzerine kurmuş olmasından mı, Google'ın arama algoritmasını değiştirmesinden ve bu önceliklendirmeyi beğenmemesinden mi, yoksa başka bir şeyden mi bahsettiği belirsiz.
Google'ın algoritma deneyleri kesinlikle yapmamasını beklemek biraz mantıksız; özünde bu daha çok sıfır toplamlı bir oyuna yakın. Bugün kazanan olan yarın kaybeden olabilir.
Gelir paylaşımı, trafik, reklam yerleşimi gibi konulardan endişe ediliyorsa, başarısı tamamen başka bir şirketin kaprislerine bağlı bir iş kurmak pek akıllıca değil.
Aramanın yavaş yavaş büyük dil modelleriyle ikame edildiğini ve yıllardır arama motoru optimizasyonuyla oyunlaştırıldığı için içerik keşfi yöntemi olarak giderek kötüleştiğini düşünüyorum.
İçerik keşfi için Hacker News gibi benzer ilgi alanlarına sahip toplulukların kolektif olarak bulduğu ya da kürasyon yapılan modeller daha uygun. Küratör ya da topluluk ilgi alanının dışına çıkarsa yenisini bulmak gerekir, ama tuhaf bir şekilde aynı çerçevenin içinde bu da mümkün.
Eski web siteleri web ring'lerden, dizinlerden ve birçok küçük arama motorundan trafik alırdı; ama şimdi neredeyse her şey Google ya da onun varlıkları ve daha küçük bir payla Meta'dan ibaret. Küratör ve topluluk temelli keşif modelleri Google'ın mağduru; çözüm değil.
Başka bir deyişle Google, tıklama oranını %0,2 artıran ve zararsız görünen 1000 deney yayınladı; sonuçta da yalnızca Reddit ve Quora bağlantıları vermek isteyen bir sisteme dönüştü.
Google'ın herkese açık olmayan Blind bölümünde bu konuşmayı birkaç kez gördüm; genellikle 2020 öncesi arama sorumlusunun bu tür sonuçlardan endişe edip daha temkinli bir yaklaşım benimsediğine dair sohbetlerle birlikte geçiyordu.
Eski bir Google çalışanı olarak Ekim 2023'te ayrıldım ve arama ekibinde çalışmadım; ama Google dışında bu teori pek anlaşılmıyor gibi görünüyor. Adlarını hatırlamıyorum ama meselenin özünü yakalayan iki kadar tanınmış blog yazısı istisna.
Google'ın kötü sonuç verdiği sorguların bir listesi var mı merak ediyorum. Arama geçmişime birkaç dakika baktım; çoğu kişi adları gibi basit sorgulardı ve Google bunları iyi halletmişti. Kişi aramalarında bazen Google'ın LinkedIn'den daha iyi olduğunu düşünüyorum.
Birkaç karmaşık sorguyu da Kagi ile karşılaştırdım. “How much bitcoin does microstrategy own” için Google buradaki doğru snippet'i döndürdü, Kagi ise yalnızca son birkaç günde ne kadar satın alındığına ilişkin makalelere bağlantı verdi.
“how to pronounce stratchery” için Google, Stratechery web sitesindeki doğru snippet'i gösterdi; Kagi'nin ilk sonucu yanlış telaffuz içeren spam bir öğeydi, ikinci sonuç ise doğru telaffuzu içeren bir tweet'ti.
Dan Luu'nun yazısı (https://danluu.com/seo-spam/) da aklıma geldi, ama arama geçmişime baktığımda onun kullandığı sorguların benim günlük aramalarımı hiç temsil etmediğini gördüm.
[0]https://www.forbes.com/sites/digital-assets/2024/11/29/micro...
[1]https://stratechery.com/category/about/#:~:text=UPDATE%3A%20...
[2]https://www.howtopronounce.com/stratechery
Ürün incelemeleri arama motoru optimizasyonu çöpleriyle, yani blog spam'inin “Top 10” listeleriyle dolu; seyahatle ilgili konularda ise organik sonuçlar gelmeden önce bir sayfa reklamla doluyor. Uğraşmaya değmediği için denemiyorsun bile ve sonuçta geriye yalnızca hâlâ çalışan sorgular kalıyor.
Google ile bulması zor, ama başka bir şeyle kolay olan somut örnekler var mı merak ediyorum.
Son küresel kullanım istatistikleri şöyle: Google %89,33, Bing %4,15, YANDEX %2,8, Yahoo! %1,33, Baidu %0,83, DuckDuckGo %0,69. Ekim 2024 itibarıyla https://gs.statcounter.com/search-engine-market-share
Google o kadar kötüyse, ben dahil insanların neden başka arama motorlarına tıklamadığını merak ediyorum. Giant Freakin Robot'un tıklama alamaması üzücü, ama kullanıcı açısından Google'ın kötü olması bundan farklı bir mesele.
Hepsine tıkladım ve hepsi çalışıyor. Baidu Çince açılıyor; The Sound of Music'i aradığımda Google Çeviri'ye göre “rahibe ve yedi yaramaz çocuk” gibi bir Çince sonuç çıktı, biraz komikti.
Google, müşteri değeri ve içerik üreticisi değerini öncelemekten uzaklaşıp, içerideki opak temel performans göstergelerini önceleyen bir yöne açıkça kaymış durumda. Reklamveren değil de üreticiyseniz bu daha da böyle.
Birkaç yıl önce DuckDuckGo’ya, geçen yıl da Kagi’ye geçtikten sonra ara sıra Google’a döndüğümde, ne kadar yollarını kaybettikleri çok net hissediliyor.
Hakimiyetlerini kaybetmeleri muhtemelen 10 yıl daha sürer, ama işaretler açık. Hâlâ zirvede olmalarının tek nedeni atalet ve pazar konumu. Öte yandan genç kuşak web aramasını neredeyse hiç kullanmıyor, teknolojiye hâkim kişiler de giderek daha hızlı uzaklaşıyor.
Startup’lar açısından umut verici. Google artık öğle yemeğinizi kapıp götürecek 800 kiloluk goril değil; kavramsal parçalarının toplanmasını bekleyen yürüyen ölü bir deve daha yakın.
Bu yıl Kagi’den
!gile Google’a gittiğim seferler bir elin parmaklarını geçmez; her seferinde de hemen pişman oldum.Birkaç yıl önce DuckDuckGo kullanırken
!giçgüdüsel bir şeydi ve muhtemelen yarısında Google sonuçları daha iyi geliyordu. DuckDuckGo’da kalmak idealist bir tercihti, kalite de ikinci sınıf gibi hissettiriyordu; Kagi’de ise böyle değil. Aylık 10 dolar, üretkenlik artışıyla fazlasıyla karşılığını veriyor.Kagi de Google arama dizinini kaynaklarından biri olarak kullandığına göre, Google’ın teknik olarak sonuçları ya da kullanıcı deneyimini iyileştiremiyor olması söz konusu değil. Sadece kurumsal olarak imkânsız görünüyor.
Büyük çaplı işten çıkarmaların yaygın sonuçlarından birinin, iç sistemleri kara kutuya dönüştürdüğüne dair bir uyarı vardı. Çünkü sistemi derinlemesine anlayan herkes ayrılmış oluyor.
Bilgili insanları doğrudan kaybetmek gerçek bir şey, ama bu sistemlerin kara kutuya dönüşmesinin ana nedeni bu değil.
İşten çıkarılan bilgili her bir kişiye karşılık, şirkette kalıp buradaki geleceğinin çok daha belirsiz hâle geldiği gerçeğine uyum sağlayan yaklaşık yirmi kişi var. Bu uyum kişiden kişiye değişir ama “Vay be, dokümantasyonu iyileştirip bilgiyi paylaşayım da işten çıkarılmam daha kolay olsun!” diyen kelimenin tam anlamıyla hiç kimse yok.
Bir ay sonra şirket benimle iletişime geçip sözleşmeli iş teklif etti, ama reddettim. Sonraki 1 yıl boyunca çalışanlar doğrudan bana ulaşıp yardım istedi; yardımcı olduğum her şey zaten dokümante edilmişti.
Şirketlerde düzgün bir bilgi aktarımı için gerçek bir çözüm olduğunu sanmıyorum. Bu yüzden insanların anlık kararlarla işten çıkarılmasını ilginç buluyorum; tek bir çalışandan çok daha fazlasını kaybediyorsunuz.
Bilgi siloları iş güvencesini garanti etmez. Aksine terfi etme becerisini, ekipler arası işbirliği yapma becerisini, uyum sağlama yeteneğini, başka işleri üstlenme becerisini ve delege etme becerisini sınırlar; işbirliğini ve proje başarı oranını düşürerek kurum içinde görünen performansı da azaltır. Yalnızca kurum için değil, o silonun içinde yaşayan mühendis için de kötü olmasının daha pek çok nedeni var ve konuyla ilgili birkaç araştırma da mevcut.
Yandex, yani Rusya’nın Google’ı, fiilen 2006’daki Google’a daha yakın. Yani bana Google’ın avukatlarının ve SF’deki terfi materyalleriyle ilgilenen insanların göstermek istediğini değil, benim istediğimi gösteriyor.
Rusya içi konular sansürleniyor olabilir, ama benim kullanım alanımın epey dışında kalıyor.
Yeni bir arama motorunu engelleyen şeyin ölçek ve sunucular dışında ne olduğunu bilmiyorum. İstediğimiz şey yalnızca 2006’da var olan sıradan eski aramaysa, yeniden üretilebilir görünüyor.
DuckDuckGo gibi başka motorlar da var ama gerçekte Bing’e daha yakın olduğunu öğrendim. O hâlde Google bu kadar kötüyse Bing’in neden hâkim olamadığı da merak konusu. Harika değil ama o kadar da kötü değil.
Biraz daha okuyunca Kagi’nin bunu yapıyor gibi göründüğünü anladım.
Google’ın içeriden nasıl yok edildiğini gösteren soğukkanlı bir yazı.
https://www.wheresyoured.at/the-men-who-killed-google/
Aslında beklediğimden daha geç oldu, ama etkileri bugüne kadar sürecek kadar belirgin bir olay gibi görünüyor.
Giant Freakin' Robot bir toplama sitesiydi. O “içerik” başka web sayfalarına giden bağlantılardan ve bunlarla ilgili uzun uzun laftan ibaretti. Google artık toplama sitelerini tanıyıp daha düşük sıralıyor gibi görünüyor.
Google’ın kendisi de bir toplama sitesi; başka toplama sitelerine neden trafik göndersin ki? Yelp gibilerini de aşağı çekse iyi olur.
İnterneti uzun süredir kullanan insanların internet aramasını ne amaçla kullandığını merak ediyorum. Benim durumumda üç şeyden biri:
Birincisi, bilginin hangi web sitesinde olduğunu bilirim ve doğrudan oraya giderim. Örneğin Wikipedia, Github, Google Maps.
İkincisi, gerçek insanların görüşlerine veya geri bildirimlerine ihtiyaç duyarım; bu yüzden genelde yalnızca Reddit alan adını hedefleyerek Google’da arama yaparım.
Üçüncüsü, doğrulaması kolay, yaygın olarak bilinen bilgiye ihtiyaç duyarım; bu da büyük dil modellerinin çok iyi yaptığı bir iştir.
Bu, benim “sörf” etkinliğimin %95’inden fazlasını oluşturduğu için, büyük arama motorlarından biri bir gün kapansa muhtemelen pek fark etmem.