35 puan yazan GN⁺ 2025-03-28 | 4 yorum | WhatsApp'ta paylaş

Chatbot devriminde geride kalan Google’da krizin başlangıcı

  • Aralık 2022’de Sissie Hsiao’ya, Google’ın ChatGPT’ye rakip ürününü 100 gün içinde geliştirme görevi verildi
  • Hsiao, 16 yılı aşkın süredir şirkette çalışan ve binlerce kişiyi yönetmiş bir kıdemli isimdi, ancak bu kadar ciddi bir kriz ortamıyla ilk kez karşılaşıyordu
  • OpenAI’nin ChatGPT’yi yayınlamasının ardından, olgusal hatalara ve matematik yanlışlarına rağmen kullanıcı sayısı hızla 1 milyonu aştı
  • Bazıları ChatGPT’yi Google Arama’nın yerine geçebilecek bir araç olarak görmeye başlamıştı; bu da Google’ın en büyük gelir kaynağı için bir tehditti
  • Google’ın kendi dil modeli LaMDA vardı, ancak genel erişim kısıtlıydı ve yapılan demolar bile “köpek hikâyeleri” ile sınırlıydı
  • Wall Street (finans piyasaları) tedirgindi; geçmişte CEO Sundar Pichai “AI-first” dönemini ilan ederek akıllı asistanların cihazların yerini alacağını söylemişti, ancak gerçekler beklentilerin gerisinde kalmıştı
  • Transformer mimarisini ortaya koyanlar da Google’daki 8 araştırmacıydı, fakat bunların bazıları şirketten ayrıldı ya da kayda değer sonuçlar elde edemeden gitti
  • Hsiao’nun yönettiği Google Assistant ise çoğunlukla zamanlayıcı kurmak ya da müzik çalmak için kullanılıyordu
  • Eldeki tek şey, Gen Z için yemek önerileri ve tarih bilgi yarışmaları sunan tamamlanmamış bir chatbot’tu
  • 2022 sonu itibarıyla Alphabet hissesi bir önceki yıla göre %39 düşmüştü ve Google’ın yapay zekada öncü şirket olma konumu sarsılıyordu

Google’ın yapay zeka krizine yanıtı ve strateji değişimi

  • 2023 başında Google yönetim kurulu, yapay zekayla ilgili gerçek zamanlı raporlama talep etti
    • Kurucu ortak ve büyük hissedarlardan Sergey Brin de strateji değerlendirmelerine bizzat katıldı
    • Çalışanlara “startup gibi hareket edin” mesajı verildi
  • Geçmişte kültür, çok sayıda çalışanın ürünlere itiraz edebilmesine ama onay yetkisine sahip olmamasına dayanıyordu
  • Artık şirket, daha büyük risk alan ve daha hızlı uygulayan bir kültüre geçiş yapıyordu
  • Sissie Hsiao, 100 günlük projeyi başlatırken ekibine alışılmadık bir ilke sundu:
    Hızdan önce kalite, ama hızlı (Quality over speed, but fast)
  • Bir diğer üst düzey yönetici James Manyika, yapay zeka stratejisinin temelden değişmesinde önemli rol oynadı
    • Oxford çıkışlı bir robotik doktoru ve eski McKinsey danışmanı olan Manyika, 2022’de Google’a katılmıştı
    • Pichai’ye DeepMind ile Google Brain’in birleştirilmesini önerdi
  • DeepMind (Londra, Demis Hassabis yönetiminde) ve Google Brain (Mountain View, Jeff Dean sorumluluğunda) ayrı çalışıyor ve kaynakları verimsiz biçimde tüketiyordu
    • OpenAI’nin çıkışından sonra üç lider, birleşme planını yönetim kuruluna sundu
    • Hassabis, proje adı olarak ‘Titan’ı önerdi ancak bu kabul edilmedi; sonrasında Jeff Dean’in önerdiği ‘Gemini’ adı benimsendi
  • Manyika daha sonra Google’ın cesur ve sorumlu tercihler yaptığını söyledi
    • Ancak “her zaman doğru tercihleri yapmadıklarını” da kabul etti
    • Gergin atmosferde çalışanlar arasında “Google, Yahoo gibi olabilir” endişesi bile yayılmıştı
    • Hsiao o dönemi “maratonu depar atarak koşmak gibi” diye anlattı
  • Ancak iki yıl sonra bugün, Alphabet hissesi tüm zamanların en yüksek seviyesine ulaştı
    • Yatırımcılar, Google’ın yapay zeka rekabet gücünü yeniden kazanmasına iyimser bakıyor
  • WIRED, bu dönemi Google tarihindeki en kaotik ve kültürel olarak en büyük değişimin yaşandığı zamanlardan biri olarak değerlendiriyor
    • Mühendislik, pazarlama, hukuk ve güvenlik dahil 50’den fazla mevcut ve eski çalışanla görüşüldü
    • Bu yazı, Google’daki dönüşümü ilk kez üst düzey yöneticilerin tanıklıklarıyla ayrıntılı biçimde ele alıyor

Bard geliştirme süreci: şirket genelinde öncelik ve kaynak seferberliği

  • Google, ChatGPT’ye yanıt vermek için yeni bir chatbot projesi başlattı; kod adı Bard
  • Sissie Hsiao, şirket genelinden yaklaşık 100 yeteneği doğrudan ekibe aldı
    • Yöneticiler itiraz edemiyordu ve Bard projesi en yüksek önceliğe sahipti
  • Hsiao, teknik yetkinliği ve duygusal zekâsı yüksek, büyük resmi görebilen kişileri seçti
  • Ekip üyelerinin çoğu California, Mountain View’da konumlandırıldı ve görev tanımı gözetmeksizin esnek çalıştı
    • Team Bard her işi üstlenen bir ekip” anlayışı vurgulandı
  • Ocak 2023’te Google tarihindeki ilk büyük ölçekli işten çıkarma açıklandı: yaklaşık 12.000 kişi, yani toplam iş gücünün %7’si
  • Bazı çalışanlar, gece çalışmaz veya ek iş yükünü kabul etmezlerse işten çıkarılabilecekleri korkusunu yaşadı
    • Çocuklarını yatırma saatinden vazgeçip gece toplantılarına katılan çok sayıda kişi oldu
  • Bard, mevcut LaMDA’yı temel alıyordu, ancak bilgi güncellemeleri ve yeni güvenlik önlemlerine ihtiyaç vardı
    • Altyapı ekibi, en iyi teknik uzmanları başka görevlerden kaydırarak sunucu kapasitesi sağlama ve sistem ince ayarına odaklandı
    • Veri merkezlerinde elektrik tüketimi neredeyse sınır seviyeye ulaştı ve ekipmanların aşırı ısınma riski ortaya çıktı
    • Bunun üzerine, elektrik talebini daha güvenli yönetebilecek yeni yönetim araçları da hızla geliştirildi
  • Gerginliği azaltmak için mizah da devreye girdi
    • Bir ekip üyesi özel poker fişleri yaptırıp üzerlerine belirli çip isimleri yazdırdı ve bunları mühendislerin masalarına yığarak “Hadi, çipinizi alın” diye şaka yaptı
  • Bard, ilk haftalarda artan hesaplama kaynağına rağmen mevcut sorunları tekrarlamayı sürdürdü
    • ChatGPT gibi Bard da sık sık halüsinasyon ve uygunsuz ya da rahatsız edici yanıtlar üretiyordu
    • İlk sürümlerde ciddi ölçüde gülünç ırksal stereotipler sıkça ortaya çıkıyordu
      • Hint kökenli isimlerin çoğu “Bollywood oyuncusu”, Çin kökenli erkek isimleri ise “bilgisayar bilimci” olarak betimleniyordu
    • Eski bir çalışana göre Bard’ın yanıtları “tehlikeli değildi ama düpedüz aptalcaydı
    • Bazı çalışanlar, Bard’ın saçma yanıtlarının ekran görüntülerini paylaşıp bunlarla dalga geçiyordu
      • Örnek: “Three 6 Mafia tarzında denize araba aküsü atmakla ilgili bir rap” istendiğinde, insanları aküye bağlayıp denize batırmayı anlatan içerik bile üretti
  • Google’ın elindeki tek seçenek, belirlenen 100 gün içinde mümkün olduğunca çok hatayı yakalamaktı
    • Çocuk istismarı görsellerinin tespiti gibi işlerde görev yapan harici sözleşmeli çalışanlar bile Bard testlerine dahil edildi
    • Pichai, boş zamanı olan tüm çalışanlardan Bard’ı test etmelerini istedi; sonuçta yaklaşık 80.000 kişi testlere katıldı
  • Hsiao ve yönetim, Bard’ın hatalarını tamamen engelleyemeyeceklerini görerek ürünü baştan bir ‘deney (Experiment)’ olarak konumlandırdı
    • Bu, OpenAI’nin ChatGPT’yi “research preview” olarak tanıtma stratejisine benziyordu
    • Kullanıcılara ve dış değerlendiricilere ürünün nihai sürüm olmadığı vurgulanarak marka zararını sınırlama hedeflendi
    • Bu yaklaşım, geçmişte Microsoft’un Twitter chatbot’u Tay’in Nazi söylemleri üretmesi sonrasında sektörde yaygın biçimde benimsenen bir riskten kaçınma yöntemiydi

Bard’ın lansman süreci ve kritik hata

  • Geçmişte Google, AI ürünlerini piyasaya sürmeden önce 'Sorumlu İnovasyon Ekibi' aylar boyunca önyargı ve kusur incelemesi yürütürdü
    • Bard örneğinde ise takvim baskısı nedeniyle inceleme süreci büyük ölçüde daraltıldı
    • Baş hukuk sorumlusu Kent Walker, hızlı lansmanı savundu
    • Yeni modeller ve özellikler o kadar hızlı ortaya çıkıyordu ki inceleme ekipleri gece mesaisi ve hafta sonu çalışmasına rağmen yetişemedi
  • Bard lansmanının ertelenmesini isteyen uyarılar vardı, ancak görmezden gelindi veya etkisiz hale getirildi
    • Buna karşılık Google, WIRED'a “hiçbir ekibin lansmana karşı resmi bir tavsiyede bulunmadığını” savundu
      • Birden fazla ekibin testlere katıldığını ve tam sorumluluğun tek bir ekibe ait olduğu bir yapı olmadığını açıkladı
  • 100 günlük projenin yaklaşık üçte ikisi geride kalmışken, Şubat 2023'te Google, ChatGPT'nin Bing aramaya entegre edileceği bilgisini edindi
  • Arama pazar payında Google hâlâ ezici üstünlüğe sahipti, ancak üretken yapay zeka özelliklerinin yokluğu uzun vadeli bir tehdit oluşturuyordu
  • Hisse düşüşünden kaçınmak için, Microsoft duyurusundan bir gün önce, 6 Şubat'ta Pichai, Bard'ın sınırlı test sürümünü aniden duyurdu
  • Pazarlama videosunda Bard, Google'ın “bilgiyi organize etme” misyonunu devralan bir AI yardımcısı olarak tasvir edildi
  • Videodaki soru: “James Webb Uzay Teleskobu'nun yeni keşiflerinden hangisini 9 yaşındaki bir çocuğa açıklayabilirsin?”
    • Bard'ın yanıtı: “JWST, Güneş Sistemi dışındaki bir gezegenin ilk fotoğrafını çekti”
  • Hemen ardından Reuters olgusal hatayı haberleştirdi: söz konusu fotoğrafı uzay teleskobu değil, yer tabanlı bir teleskop (VLT) çekmişti
  • Alphabet hissesi %9 düştü, piyasa değerinden yaklaşık 100 milyar dolar silindi
  • Ekip içinde şok yaşandı
    • Soruyu hazırlayan pazarlama çalışanı kendini suçladı; çalışma arkadaşları ise “hukuk ekibi ve PR ekibi de inceledi ama kimse hatayı fark etmedi” diyerek onu teselli etti
    • ChatGPT'de de çok hata olduğu için, böylesine küçük bir yanlış anlamanın hisse üzerinde büyük etki yaratacağını öngöremediler
  • Xiao bunu “naif bir hata” olarak niteledi
    • Bard, yanıtlarını Google arama sonuçlarına dayanarak kuruyordu ve NASA blogundaki “ilk fotoğraf” ifadesini yanlış yorumlamış olabilir
    • Liderlik, “bu yüzden kimse işten çıkarılmayacak. Ama bu olaydan hızla ders çıkarmamız gerekiyor” vurgusunu yaptı
  • Xiao: “Biz bir startup değiliz, Google'ız. Bunu teknik bir kusur deyip geçemeyiz. Mutlaka sorumlu biçimde karşılık vermeliyiz”
  • Bard ekibi dışındaki memnuniyetsizlik büyüdü
    • Dahili forum Memegen'de “Bard lansmanı ve işten çıkarmalar aceleye getirildi, berbat yönetildi ve dar görüşlüydü” şeklinde eleştirel bir paylaşım yapıldı
    • Google logosunun çöp kutusunda yandığı bir görsel de paylaşıldı
  • Buna rağmen Google, Bard'a daha fazla kaynak aktardı
    • Yüzlerce kişi daha görevlendirildi; ekip belgelerinde Pichai'nin profil fotoğrafı simgesinin her gün görünmesi doğrudan müdahil olduğunun göstergesiydi

GPT-4'ün gelişi ve teknolojik fark

  • Mart 2023 ortasında, OpenAI'ın GPT-4'ü piyasaya sürmesi Google içinde bir kez daha şok etkisi yarattı
    • Üst düzey bir araştırmacı: “Ağzımız açık kaldı ve Google'ın hızlanması gerektiğini derinden hissettik
  • Bundan bir hafta sonra Bard, ABD ve Birleşik Krallık'ta resmen kullanıma sunuldu
    • Kullanıcılar, e-posta yazımı ve rapor taslağı gibi işlerde yararlı buldu
    • Ancak ChatGPT aynı işleri daha iyi yapıyordu, bu yüzden kullanıcıların geçiş yapması için güçlü bir neden yoktu
  • Pichai, Hard Fork podcast'inde Google'ın “modifiye edilmiş bir Civic ile güçlü bir spor arabaya karşı yarıştığını” söyleyerek kendisiyle dalga geçti
    • Sonuç: “Daha iyi bir motora ihtiyacımız var

Gemini geliştirme: DeepMind ile Google Brain'in birleşmesi ve kültürel çatışma

  • İki AI araştırma organizasyonu arasındaki fark
    • DeepMind, Alphabet'in 'Other Bets' birimi altında sınıflandırılıyor ve uzun vadeli bilimsel ve matematiksel sorunların çözümüne odaklanıyordu
    • Google Brain ise Gmail otomatik tamamlama, belirsiz arama sorgularının işlenmesi gibi ticari açıdan pratik AI teknolojileri geliştiriyordu
  • Eski bir kıdemli mühendise göre:
    • Google Brain özerklik odaklıydı; Jeff Dean'in tarzı “insanları kendi başlarına yapmaları için serbest bırakmak”tı
    • Buna karşılık DeepMind düzenli bir ordu gibi hareket ediyordu; Demis Hassabis ise “tek komutan altında yüksek verimlilikle çalışan” bir organizasyon yürütüyordu
  • Dean, sinir ağı araştırmalarının kıdemli isimlerinden biri ve Google'ın ilk dönemlerinden beri şirketteydi
  • Hassabis, vizyon odaklı bir lider; AI ile hastalıkları tedavi etme hayali kuruyor ve “gören, duyan, yardım eden AI ajanları” tasarlıyordu
  • Google DeepMind (GDM)'in doğuşu

    • Nisan 2023'te Google, iki organizasyonu birleştirerek Google DeepMind (GDM)'i kurdu
      • Hassabis, birleşik organizasyonun CEO'su olarak atandı
      • İçerideki hava: “Amaç duygusu geri geldi”, “oyun bitti”
    • Gemini modelini hızla kurmak için 8 zaman dilimini aşan iş birliği gerekiyordu
    • Yüzlerce sohbet odası açıldı, sabahlara kadar çalışma kültürü yerleşti
      • Hassabis: “Her gün bir ömür gibi hissettiriyor
    • GDM, Mountain View'daki Gradient Canopy adlı güvenlikli binaya taşındı
      • Kubbe biçimindeki yapı, sanat heykelleriyle çevriliydi
      • Pichai'nin CEO ofisi de aynı kattaydı
    • Sergey Brin (Google'ın kurucu ortaklarından) sık sık uğrayıp ekibi teşvik etti
    • Ofise gelinen gün sayısının artırılması istendi; sıradan Google çalışanları bu binaya giremiyordu
    • GDM'in çekirdek koduna da diğer organizasyonlardan erişim yoktu
  • Gemini projesi Google'ın kaynaklarını emerken, sağlık ve iklim değişikliği gibi alanlardaki diğer araştırmacılar sunucu kıtlığı yaşamaya başladı
  • Makale yayımlama kısıtları da ortaya çıktı; araştırmacıların başlıca kariyer varlığı makaleler olduğu için memnuniyetsizlik arttı
    • Google, OpenAI'a bilgi sızma ihtimali nedeniyle kısıtlamaları sertleştirdi
    • Gemini'nin eğitim reçetesi şirketin hayatta kalması için kilit bir varlıktı
  • Gemini de Bard'a benzer sorunlarla karşı karşıyaydı
  • Google makine öğrenimi ve bulut AI bölümünden sorumlu başkan yardımcısı Amin Vahdat:
    • Ölçeği 10 kat büyüttüğünüzde her şey bozulur
  • Lansman öncesinde Vahdat, özel bir war room kurdu ve hatalar ile sistem arızalarını çözmeye odaklandı

Gemini lansmanı öncesi son kontroller ve etik kaygılar

  • Google DeepMind (GDM) içindeki sorumlu geliştirme ekibi, Gemini lansmanı öncesinde ürün incelemesine tüm gücüyle yüklendi
    • Model güçlüydü, ancak hâlâ garip veya uygunsuz yanıtlar üretebildiği durumlar vardı
  • Açıklanan rapora göre:
    • Özellikle tıbbi tavsiye ve zorbalıkla ilgili yanıtlar alanında daha fazla iyileştirme gerekiyordu
    • Görsel girdilerde “Bu kişinin eğitim düzeyi nedir?” gibi sorulara dayanaksız çıkarımlar yapma sorunu ortaya çıkıyordu
  • Sorumlu inovasyon direktörü Dawn Bloxwich, bunun “lansmanı durduracak düzeyde olmadığını” değerlendirdi
    • Ancak halkın yaratıcı (veya tuhaf) kullanım biçimlerini öngörmeye yetecek zaman yoktu
  • Bu noktada Google yavaşlayabilirdi, ama bunu yapmadı
    • OpenAI artık çoktan ‘AI'ın Kleenex'i’ haline gelmişti ve küresel ilginin odağındaydı
    • ChatGPT, teknolojinin umudunun ve toplumsal sorunlarının simgesi olmuştu
    • Çalışanlar işlerini kaybetme tehdidi hissediyor, içerik üreticileri ise verilerinin sömürülmesine karşı tazminat talep ediyordu
    • Ebeveynler, sohbet botlarının çocuklarına uygunsuz içerikler aktarabileceğinin farkına vardı
    • AI araştırmacıları arasında “p(doom)” — teknolojinin insanlığı tehdit etme olasılığı — tartışılıyordu
  • Efsanevi Google AI bilim insanı Geoffrey Hinton, etik kaygılar nedeniyle Mayıs 2023'te şirketten ayrıldı
    • AI'ın dezenformasyon ve sofistike zehirler yoluyla insanlığı tehdit edebileceği uyarısında bulundu
  • Hassabis de daha fazla zamana ihtiyaç olduğunu hissediyordu, ancak yine de her işe yarayan bir AI yardımcısı ve hastalıkların tedavisi hayaline doğru ilerlemeyi sürdürdü

Gemini'nin tanıtımı ve ilk başarı

  • Aralık 2023’te Google, Gemini’yi resmen tanıttı
    • Lansmanın ardından hisse yükseldi
    • 32 standart testin 30’unda ChatGPT’yi geçti
    • Makaleleri ve YouTube videolarını analiz etme, matematik ve hukuk sorularını yanıtlama becerisi güçlendirildi
  • Hassabis, Londra ofisinde küçük çaplı bir kutlama partisi düzenledi
    • Sonradan bunu, “Kutlama yapma konusunda iyi değilim. Hep sıradaki şeyi düşünürüm” diye anlattı
  • Aynı ay Jeff Dean, 'Goldfish' adlı yeni bir sohbet odasına davet edilince bir sonraki teknolojik ilerlemeyi öğrendi
    • İsim bir şaka olsa da içerik tam tersiydi: uzun hafızaya sahip bir Gemini sürümü geliştirmek
  • Yüksek hızlı çip ağı üzerinde dağıtık işleme sayesinde binlerce sayfalık metinler ya da bir TV dizisinin tamamı bile analiz edilebiliyordu
    • Bu teknolojiye “long context” deniyordu
  • Dean, Hassabis ve Manica bunu Google’ın yapay zeka ürün ailesine entegre etmenin yollarını aradı
  • Manica’nın ilk istediği özellik, PDF’leri otomatik olarak podcast formatında özetleyen bir özellikti
    • WIRED’a, “arXiv’e her hafta yağan makalelerin hepsini takip etmek zor” dedi

Gemini dönüşümünden sonra istikrar ve yeni kriz

  • Kırmızı koddan bir yıl sonra, Google’daki hava toparlanmaya başladı
    • Yatırımcılar sakinleşti; Bard ve LaMDA, “Gemini” adlı tek bir marka altında birleşti
  • Sissie Hsiao’nun ekibi, metinden görsel üretme özelliği geliştirerek OpenAI ile aradaki farkı kapattı
  • Gemini Live adlı yeni bir özellik de hazırlanıyordu
    • Kullanıcının bir arkadaş ya da danışmanla konuşur gibi uzun sohbetleri sürdürebilmesini sağlayacaktı
  • Güçlenen Gemini modeli sayesinde yöneticiler özgüvenini yeniden kazandı
  • Ancak istikrar havasına rağmen CEO Pichai yeni bir yeniden yapılanma daha istedi
    • Reklam gelirleri artmıştı ama Wall Street beklentilerinin altında kaldı
    • Gizlilik ve uyumluluk sorumluları bile tasfiye edildi
      • Kullanıcı korumasından sorumlu üst düzey isimlerin gönderilmesi, “endişe dile getirilebilir ama ilerlemeyi engellemek yasak” mesajı olarak yorumlandı
  • Görsel üreticinin kendisi kolay kuruldu ama inceleme süreci yorucu bir tekrar testi angaryasına dönüştü
    • Sorunlu yanıtların çıkmaması için filtreleme komutları yazılması gerekiyordu
  • Testlere tüm çalışanlar erişemediği için, aşırı yük küçük bir ekibin üstüne bindi
    • Örneğin “rapist” isteminde koyu tenli kişilerin daha sık üretilmesi ırksal önyargı endişesi doğurdu
    • Bunun üzerine insan görsellerinin tamamen üretilememesi yönünde şirket içinde talep de geldi, ancak dikkate alınmadı
  • Eski bir incelemeci, “her koşulda yayımlama havası vardı” diye anlattı
    • İnceleme ekibinden bazıları, kaygıları dikkate alınmadığı için şirketten ayrıldı
  • Şubat 2024’te görsel üretici, Gemini uygulaması içinde resmen kullanıma sunuldu
    • Beklenen ırkçı ve cinsiyetçi görsel sorunları büyük ölçüde görülmedi, ancak bu kez ters yönde başka bir sorun ortaya çıktı
  • Örneğin “1800’lerde ABD senatörü” görseli istendiğinde Siyah bir kadın, Asyalı bir erkek ve Yerli bir kadın üretildi
    • Hiç beyaz erkek üretilmedi
  • Daha da çarpıcı bir örnekte, Nazi Almanyası askerleri renkli insanlar olarak üretildi
  • Bunun üzerine ABD’li Cumhuriyetçi siyasetçiler ve Elon Musk gibi isimler, Google’ın “woke AI”ını sert biçimde eleştirdi
    • Musk, ilgili ekip üyesini adıyla hedef göstererek yoğun bir saldırı başlattı; söz konusu çalışan sosyal medya hesabını kapattı ve kişisel güvenliği konusunda endişe duymaya başladı
  • Google, insan görseli üretme özelliğini tamamen durdurdu ve Alphabet hissesi bir kez daha düştü
  • Tartışmanın hemen ardından Google yöneticilerinden onlarcası acil görüşmelere başladı
    • Başkan yardımcıları ve direktörler, Hassabis’le yüz yüze görüşmek için Londra’ya uçtu
  • Sonuç olarak:
    • Hassabis’in ekibine (Gemini modeli) ve Hsiao’nun ekibine (Gemini uygulaması) güvenilirlik ve güvenlik uzmanları işe alma onayı verildi
    • Toplam 15 yeni ‘Trust & Safety’ pozisyonu açıldı
  • Gradient Canopy merkezinde Sissie Hsiao, ekibine görsel üretim sorunlarını çözmeleri için yeterli zamanı verdi
  • James Manica ile birlikte, Gemini için yeni kamuya açık ilkeler oluşturdu
  • Bu ilkelerin tamamı kullanıcı merkezli ifadelerle (“you”) yazıldı:
    • Gemini “talimatlarınızı izler
    • ihtiyaçlarınıza göre uyarlanır
    • deneyiminizi korur
  • Temel vurgulardan biri şuydu:
    • Gemini’nin yanıtları Google’ın duruşunu veya inançlarını yansıtmayabilir
    • Gemini’nin çıktıları çoğunlukla sizin istediğiniz şeye dayanır—Gemini sizin yarattığınız bir şeydir
  • Bu, ileride sorun çıktığında Google’ın sorumluluğunu en aza indirmeye yarayabilecek mantıksal bir çerçeveydi
  • Ancak bu ilkeler karşısında Google’ın kendi sorumluluğunu nasıl üstleneceği açıkça belirtilmedi

Yapay zeka podcast deneyi: Westminster Watch

  • Mart 2024’te akşam 18.30 civarında, Gradient Canopy’nin Yellow Zone alanında ilgi çekici bir deney tanıtıldı
  • Google Labs’tan iki çalışan, Josh Woodward’a yeni bir proje gösterdi
    • Woodward, Google’ın deneysel yeni ürünlerini hızla hayata geçiren Google Labs’in başındaydı
  • Projenin içeriği şuydu:
    • Birleşik Krallık parlamento görüşme dökümleri ile long context özelliğine sahip Gemini kullanılarak
    • AI sunucular Kath ve Simon’ın sunduğu ‘Westminster Watch’ adlı bir podcast üretmek
  • İlk bölümde Simon açılışı şöyle yaptı:
    • “Bu hafta da Meclis’te bolca drama, tartışma ve biraz da tarih vardı”
  • Woodward bu deneyden çok etkilendi ve ardından bunu Pichai dahil önemli isimlerle doğrudan paylaştı

Yapay zeka sesli özetleri ve arama inovasyonu, ardından gelen yeni tartışma

  • AI’nin belgeleri veya toplantı notlarını podcast formatında özetleyen özelliği olan NotebookLM Audio Overviews,
    Mayıs 2024’teki Google I/O etkinliğinde resmen duyuruldu
  • Josh Woodward’a göre çekirdek ekip, gece gündüz binlerce AI podcast’ini test ederek geliştirmeyi sürdürdü
  • Ancak tanıtım sahnesinde iki farklı duyuru daha fazla ilgi gördü:
    • Astra: Gerçek zamanlı video analizi yapabilen yeni nesil AI asistanı (bizzat Brin gösterdi)
    • AI Overviews: Arama sonuçlarını özetleyip sayfanın üst kısmında gösteren özellik
  • Project Magi ekibinin geliştirdiği AI Overviews, arama sonuçlarını özetleyerek özet kutusunda (Box) gösteriyordu
  • İlk sorumlu inovasyon ekibi, önyargı-doğruluk sorunları ve trafik düşüşünün etik etkileri konusunda endişe duyup denetim talep etti
    • Ancak proje, ekiplerin yeniden yapılandırılması ve dağıtık çalışma nedeniyle sistematik denetimi zorlaştırdı
  • Lansman sonrası çok sayıda tuhaf yanıt örneği ortaya çıktı:
    • “Günde kaç taş yemeliyim?” → “UC Berkeley jeologlarına göre günde 1 küçük taş tüketilmesi önerilir”
    • “Pizzada peynir tutunmuyor” → “Sosa 1/8 bardak toksik olmayan yapıştırıcı ekleyin”
  • Bu yanıtlar çoğunlukla Reddit şaka gönderileri gibi internet meme’lerinden türemiş olsa da,
    AI Overviews bunları olgu gibi sundu ve güvenilirlik sorunu yarattı
  • Google, bu özelliğin görünürlüğünü geçici olarak azaltıp yeniden ayarlama yaptı
  • Google içindeki tepkiler ve kullanıcı geri bildirimi

    • Arama baş bilim insanı Pandu Nayak:
      • “Tüm sorunları önceden engelleyemeyiz. Yalnızca sürekli iyileştirme sözü verebiliriz”
      • “İnsanlar iyi çalıştığında sessiz kalıyor, garip olduğunda ise sadece şikayet ediyor”
    • İçeride, doğrulukla ilgili kaygıları dile getiren çalışanlar hayal kırıklığına uğradı
      • Bard→Gemini, görsel üretici ve AI Overviews’a kadar bunu “halüsinasyon makinelerinin art arda gelişi” olarak değerlendirdiler
      • Bilgiye erişimi artırma yönündeki Google misyonunun “saçmalık dikte ettirme aracına” dönüşmekte olduğu yönünde endişeler de dile getirildi
    • Buna karşılık arama ekibi, kullanıcı memnuniyetine odaklandı
      • AI Overviews, kapatma seçeneği olmadan tamamen korunmaya devam etti
      • Sonrasında Google Maps, hava durumu uygulaması gibi yerlere de AI özet özelliği eklendi
    • Pixel için hava durumu uygulaması örneği:
      • Bazı mühendisler mevcut grafiklerin zaten yeterli olduğunu düşünse de, testlerde %90 “beğendim” geri bildirimi çıktı
  • Toparlanma işaretleri ve geri dönen yetenekler

    • Aralık 2024’te, ChatGPT etkisinin başlamasından 2 yıl sonra Jeff Dean, WIRED röportajında daha olumlu bir hava yansıttı
      • Gemini modeli açık kıyaslamalarda 1. sıraya yükseldi
      • Bir yönetici, işe gidip gelirken kız kardeşi yerine Gemini Live ile konuştuğunu anlattı
    • NVIDIA CEO’su Jensen Huang, NotebookLM Audio Overviews’i güçlü biçimde tavsiye etti
    • Geçmişte temkinli kültürden memnun olmayıp ayrılan yetenekler de geri dönmeye başladı
      • Transformer’ın yaratıcılarından Noam Shazeer de yeniden katıldı
        • Geçmişte LaMDA’nın dışarı açılmamasına ilişkin şirket politikasından hayal kırıklığına uğrayıp ayrılmıştı

Gemini’nin geleceği, zorluklar ve süren AI savaşı

  • Google içindeki hava ve büyüme özgüveni

    • Jeff Dean röportajda geçmişteki muhakeme hatalarını kabul ederken, artık Google’ın riskten kaçınmayı bırakıp daha ileri gittiğini söyledi
    • Şu anda Google’ın 7 büyük hizmeti (Chrome, Gmail, YouTube vb.) Gemini tabanlı özellikleri devreye alıyor
    • Dean, Noam Shazeer ve diğer liderler şirket genelindeki gereksinimleri koordine ediyor:
      • Japonca çeviriyi iyileştirme
      • Kodlama yeteneklerini güçlendirme
      • Astra’da kullanılacak gerçek zamanlı video analizini geliştirme vb.
    • Dean ve Shazeer, fikir paylaşmak için Gradient Canopy’nin microkitchen alanında sık sık buluşuyor
  • Stratejinin AI içerik üretimi merkezli genişlemesi

    • Shazeer: “Bilgiyi organize etmek 1 trilyon dolarlık bir pazar ama şu anda havalı olan şey 1 katrilyon dolar”
    • Alphabet hissesi, ChatGPT’nin çıkışı sırasındaki dip seviyeye göre neredeyse iki katına yükseldi
    • Hassabis artık Xiao’nun Gemini uygulama ekibini de birlikte yönetiyor ve AI ile hastalıkları tedavi eden geleceğin uzak olmadığına inanıyor
      • WIRED’a, “Herhangi bir organizasyondan daha geniş ve daha derin bir araştırma temeline sahibiz” dedi
  • Karlılık sorunu ve reklam modeline dönüş

    • Şu anda kullanıcıların çoğu AI özellikleri için doğrudan para ödemeye istekli değil
    • Google, Gemini uygulamasına reklam yerleştirme yöntemini değerlendiriyor
    • Bu, Silikon Vadisi’nin geleneksel stratejisi:
      • “Verinizi, zamanınızı ve dikkatinizi verin; bizim yaptığımız havalı aracı ücretsiz kullanın”
      • Sadece feragat kutusunu işaretlerseniz, Google’ın sorumluluğu kalmaz
  • Pazar rekabeti ve altyapı yükü

    • Sensor Tower verileri:
      • ChatGPT uygulamasının toplam indirme sayısı: yaklaşık 600 milyon
      • Gemini uygulaması: yaklaşık 140 milyon
    • Çok sayıda AI rakibi bulunuyor:
      • Claude, Copilot, Grok, DeepSeek, Llama, Perplexity vb.
      • Bunların çoğu Google’ın doğrudan rakibi ya da yatırım yaptığı girişimler
    • Üretken AI, milyarlarca dolarlık yatırım ve devasa enerji tüketimi gerektiriyor
      • Eski kömür santrallerinin ya da nükleer reaktörlerin ömrünü uzatmayı gerektirecek düzeyde enerji kullanımı
      • Sektörün tamamı henüz net bir gelir modeli bulabilmiş değil
  • Google’ın karşı karşıya olduğu ek riskler

    • Önümüzdeki birkaç yıl içinde arama reklam gelirlerinin en fazla %25’i antitröst davaları nedeniyle kaybedilebilir (JP Morgan analizi)
    • İçeride de mali açığı kapatma baskısının farkındalığı yüksek
      • Xiao ekibinden bazıları 3 yıldır üst üste kış tatili yapmadan çalıştı
      • Kurucu ortak Brin yakın zamanda çalışanlara, “Haftada 60 saat çalışma, AI yarışında en etkili sweet spot” dedi
    • WIRED’a konuşan çalışanlar: sürekli işten çıkarmalar, tükenmişlik ve hukuki risklere dair kaygılar derin
  • AGI takıntısı ve felsefi meydan okuma

    • Hassabis, hâlâ AGI (yapay genel zeka) geliştirme hedefinde ısrar ediyor
      • Elinde Astra prototipiyle Londra’da yürürken, dünyanın her şeyini algılayan bir geleceği hayal ediyor
    • Ancak AGI için akıl yürütme, planlama ve icra yeteneğinin hep birlikte gelişmesi gerekiyor
  • OpenAI ile ‘ajan AI’ rekabeti

    • Ocak 2025’te OpenAI, Operator hizmetini duyurdu
      • Gerçek web sitelerinde tıklayıp yazarak işleri sizin yerinize yapan ajan tipi AI
      • Seyahat rezervasyonu, form doldurma gibi işler yapabiliyor ama yavaş ve hata oranı yüksek
      • Fiyatlandırma: aylık 200 dolar
    • Google da aynı yönde yeteneklerini genişletiyor:
      • Bugün Gemini yemek planı hazırlayabiliyor; sonraki sürümler malzemeleri alışveriş sepetine ekleyecek,
        bir sonraki aşamada ise soğan doğrama için gerçek zamanlı geri bildirim verme hedefi var
  • Hatalar tekrarlanacak ama hız kesilmeyecek

    • Ocak 2025’te, Super Bowl öncesi reklamda Gemini “dünya genelindeki peynir tüketiminin yarısından fazlası Gouda’dır” diyerek trajikomik bir hata yaptı
    • Buna rağmen Google, Gemini’yi yalnızca bir bilgi makinesi değil hayatın bir parçası, yaşam koçu ve her işe koşan bir yardımcı haline getiriyor
    • Pichai şunu söyledi: “Dikkatli ilerliyoruz”
    • Ancak o ve yönetim ekibi zirveye çıktığında bir daha asla geride kalmak istemeyecek
  • AI yarışı sürüyor

4 yorum

 
joone 2025-05-24

Peki, bu tür hikâyeler nasıl haberleştiriliyor? Biraz Google’ın tanıtım amaçlı bir yazısı gibi duruyor.
"Çok çalışıyoruz"...

 
halfenif 2025-03-28

Bir dizi izliyormuşum gibi hissettiriyor.

Peki ama Apple nereye kayboldu?

 
ide127 2025-03-28

Sanki o zamanlardaki Sputnik şokunu yaşamışız gibi görünüyor.

 
GN⁺ 2025-03-28
Hacker News görüşleri
  • Başta şüpheciydim, ancak Google'ın OpenAI ile rekabette iyi iş çıkardığını düşünüyorum. Gemini 2.0 Pro ve Flash modelleri harika. Derin araştırma özelliği iyi uygulanmış. Bağlam penceresi hâlâ sektörün en iyisi. Arama, Gmail, Google ofis paketi, Google Meet, Android vb. ile entegrasyonu mükemmel

    • Artık yeterince iyi modellere sahipler; mevcut ürün portföylerine, bulut altyapılarına ve modern iş yaşamına derinlemesine yerleşmiş durumdalar
    • Apple'ın aksine, daha az katı gizlilik politikaları sayesinde eğitim verisine erişimde daha az kısıtlamaları var
  • Google'ın karşı karşıya olduğu en büyük sorun, herkese yönelik hafif modeller sunma eğilimi. Aramada kullandıkları model muhtemelen yaklaşık 8B seviyesinde ve Flash 2.0 fena değil ama hâlâ hafif bir model

    • İnsanlar artık Google AI/Gemini'yi berbat arama sonuçları ve kötü yanıtlarla ilişkilendiriyor
    • Buna karşılık, en ileri düzey modeller güçlü ve Gemini 2.5 yapay zeka tahtını ele geçirmiş olabilir
  • OpenAI halka açık bir şirket değil ve kâr etmiyor. Google ise kâr ediyor. Buna rağmen, Google Meet/Zoom örneğinde olduğu gibi Transformer decoder'ları ürünleştirememiş olması bir hataydı. (BERT gibi encoder'lar yaygın biçimde kullanılıyor)

  • Google liderliği temkinli bir yaklaşım benimsiyor ve ürün lansmanları daha olgun görünüyor. 2000'lerdeki Apple'a benzer şekilde, 0'dan 1'e geçişte çekici bir enerji hissediliyor

  • Google'ın temel sorunu, birden fazla grubun aynı ürünü yapması ve kullanıcı ilgisini çekmek için birbiriyle rekabet etmesi

    • Google AI Studio, Gemini uygulaması, Gemini Advanced kullanıcıları için Gemini uygulaması, Vertex AI, NotebookLM gibi çeşitli ürünler var
    • Bu durum ChatGPT.com ile karşılaştırılıyor
    • Google Arama. Arama. Bugünkü gibi sağ sütunda reklamlarla birlikte arama sonuçlarını gösterip, solda Gemini'yi konumlandırmak basit olurdu
  • Küçük bir yatırımcı olarak: Alphabet/Google'ın, CEO olarak Sundar dışında biriyle daha iyi performans gösterebileceğini düşünüyorum

    • Ayrıca: Abonelik çeken hizmetler işleten şirketlere yatırım yapmayı düşünmek gerekir (ör. YouTube Premium, eskiden Netflix)
  • Google'ın sorunu, teknolojiye aşina olmayan insanların yapay zekayı Google'dan (arama) ve diğer ürünlerden ayrı bir şey olarak görmeye başlaması

    • Arama yerine yapay zeka kullanmaya çalışıyorlar (ör. ChatGPT) ve Google bu algı savaşını kaybediyor. Hızla çözülebilecek bir sorun değil
    • Google'ın yapay zeka alanında genel kamuya sunduğu şey önce Bard'dı (hatırlayan var mı?), şimdi ise Gemini oldu
    • Fark yaratan şey ne? Google rakiplerinden daha fazla ücretsiz hizmet mi sunuyor? Ortalama kullanıcı bunun matematik problemi çözüp çözmediğiyle ilgilenmiyor
    • İnsanlar yapay zeka ile aramayı ayrı şeyler olarak gördüğü sürece, Google sorun yaşayacak
  • Google'ın yapay zeka stratejisine güven duyan bir Googler ile hiç karşılaştınız mı? Benim konuştuğum herkes ciddi endişeler taşıyor gibi görünüyordu ama bu küçük bir örneklem olabilir

  • Sanırım Eric Schmidt yaklaşık 10 yıl önce "herkesin bir asistana ihtiyacı olacak" demişti (muhtemelen 2016 civarı). İnsanlarla konuşmaya benzer bir şeyi hayata geçirebilecek durumdayken neden bunu yapmadıklarını bilmiyorum. Bunun yerine mailbox vb. ile ilgili işlere gömüldüler