6 puan yazan GN⁺ 6 일 전 | 3 yorum | WhatsApp'ta paylaş
  • Gerçek zamanlı isteğe bağlı üretim ile her sayfayı bir görüntü olarak oluşturuyor; görüntü içindeki bir nesneye tıklanınca onu daha derinlemesine keşfeden yeni bir ekran üretiliyor
  • Ekranda HTML veya giriş alanları yok; metinler bile görüntü modeli tarafından piksel olarak doğrudan render edilen piksel merkezli bir arayüz olarak çalışıyor
  • Sayfa bilgileri, agentic web search ile görüntü modelinin dünya bilgisini birlikte kullanarak oluşturuluyor; doğruluk düzeyinin ChatGPT, Gemini ve Claude'dan beklenen seviyeye benzer olduğu belirtiliyor
  • live video stream özelliği keşif görüntülerini canlandırıp geçişleri daha akıcı hale getiriyor; ancak şu anda öngörülmesi zor ve kaynak tüketimi yüksek olduğu için bir aç/kapa düğmesinin arkasında tutuluyor
  • Şimdilik daha çok deneysel bir keşif/öğrenme aracına yakın; ancak görüntü ve video modellerinin doğruluğu ve performansı arttıkça daha fazla gerçek veriyle etkileşimi, görev yürütmeyi ve veri depolamayı içeren bir ortama genişleyebilir

Genel Bakış

  • Gerçek zamanlı isteğe bağlı üretim ile çalışan sonsuz bir görsel tarayıcıdır ve kullanıcının ulaştığı her sayfayı görüntü olarak oluşturur
  • Ekranda HTML, kod, belirli bağlantılar veya giriş alanları yoktur; görüntü içindeki nesnelere tıklanınca o nesneyi daha derin inceleyen yeni bir görüntü üretilir
  • Web'i belge ve UI öğeleri kümesi olarak değil, ekranda üretilen piksel merkezli bir arayüz olarak yeniden kurgular

Nasıl Çalışıyor ve Nereye Genişleyebilir

  • Ekrandaki tüm metinler de görüntü modeli tarafından piksel olarak doğrudan render edilir; görüntünün üstüne ayrı bir metin katmanı bindirilmez
    • Bunun sonucu olarak metinler bazen eksik olabilir veya yanlış konumda görünebilir; model geliştikçe bunun iyileşebileceği belirtiliyor
  • Görüntüdeki bilgiler, agentic web search ile görüntü modelinin kendi dünya bilgisini birlikte kullanarak üretilir
    • Bazen hatalı olabilir, ancak çoğu zaman çevrimiçi gerçek verilere dayanan faydalı bir başlangıç noktası olarak sunuluyor
    • Olgusal doğruluğun, ChatGPT, Gemini ve Claude kullanırken beklenebilecek düzeye benzer olduğu belirtiliyor
  • Metin ve renkli dikdörtgen ağırlıklı ekranlar yerine, bilgiyi zengin görsel anlatımla aktaran bir bilişim deneyimi hedefleniyor
  • Yalnızca sabit kod ve kurallarla karmaşık ve incelikli fikirleri aktarmanın zor olduğu görüşünden hareketle, duruma göre tek bir kelime, illüstrasyon veya gerçekçi render gibi en etkili ifade biçimini seçen bir yönelim vurgulanıyor
  • live video stream, statik görüntüleri daha sürekli bir video akışına dönüştüren deneysel bir özelliktir; her keşif görüntüsünü canlandırır ve aralarındaki geçişleri daha akıcı hale getirir
    • Şu anki davranış biraz öngörülemez ve kaynak tüketimi de yüksek olduğu için açılıp kapatılabilen bir düğmenin arkasında tutuluyor
    • Şimdilik son derece optimize edilmiş özel bir video üretim modeli ile iki görüntü üretim sisteminin birlikte kullanıldığı, ileride ise bunun tek bir sistemde birleştirilmesinin planlandığı belirtiliyor
  • Şu anda deneysel bir keşif/öğrenme aracı olarak tasarlanmış olsa da, görüntü ve video modellerinin doğruluğu ile performansı arttıkça daha fazla gerçek veriyi içeren, etkileşim kuran, doğrudan görev yerine getiren ve kendi verisini saklayan sayfalara genişleyebilir
    • Örnek olarak, bir sonraki seyahati araştırıp başka bir yerde rezervasyon yapma düzeyinden, tüm süreci Flipbook içinde yürütme düzeyine geçilebileceği veriliyor
    • Bugün ayrı uygulama ve web siteleri gerektiren işler bile gelecekte Flipbook gibi görünen ve çalışan bir ortam içinde daha fazla yapılabilir deniyor
  • Gömülü videoyu desteklemeyen tarayıcılarda oynatılmaz
  • Demo, önceden oluşturulmuş videolar kullanır ve hız için düzenlenmiştir

3 yorum

 
xguru 6 일 전

Tanıtım videosuna bakınca bir denemek istiyor insan ama... 3 saat bekleyin diyor. Herhalde inanılmaz bir yığılma var.

 
arthurk 6 일 전

https://x.com/DongwooKim/status/2047499005580738657
Seul Namsan’ı çevirdim; oldukça sevimli ve güzeldi.

 
GN⁺ 6 일 전
Hacker News yorumları
  • Bu gerçekten şaşırtıcı. Bir yerden bulduğum bir hidroponik sistem diyagramını yükledim,
    borulama, besin tedariki, elektrik kablolaması gibi ayrıntılı parçaları ayrı ayrı yüksek kaliteli diyagramlar olarak üretti.
    Tamamen doğru değildi ama kavramın kendisini çok beğendim.

  • Arabanın süspansiyon tork spesifikasyonları diyagramını oluşturmasını istedim; aşina olduğum bir konu olduğu için kontrol ettim.
    Neredeyse her şeyi doğru çizmişti ve tork değerleri de doğruydu.
    Tek tek parçalara tıklayıp daha fazla yakınlaşabiliyor ve ek spesifikasyonları görebiliyordunuz.
    Uzun zamandır gördüğüm en etkileyici demolardan biriydi ve yaşayan bir Haynes servis kılavuzu gibi kullanılabilirdi.

    • Bahçe kulübesi için bir 12V güneş enerjisi sistemi tasarlamasını istedim; genel çerçeve doğruydu ama geri kalan her şey yanlıştı.
      Güneş paneli, şarj kontrol cihazı, batarya ve yük gerektiğini bilmesi dışında kablolama anlamsızdı.
      Şarj kontrol cihazı ayarları gibi ayrıntılara inince tamamen dağıldı.
      Gerçekten güvenilecek bilgi olarak asla kullanılamaz ama izlemesi eğlenceliydi ve uygulama etkileyiciydi.
    • Arka bahçedeki eski kapıyla bir bisiklet barınağı yapmayı planlıyorum, bunun için tasarım oluşturdum.
      Sonuç, sadece üzerine upcycled door eklenmiş sıradan bir kulübe gibiydi.
      Bisikletin nereye girdiği bile görünmüyordu ve gerçek nihai forma da benzemeyen bir yapı önerdi.
      Diğer AI demolarda olduğu gibi dışarıdan inandırıcı görünüyor ama sistem yaptığı şeyi temelden anlamıyor.
    • Bizzat denedim.
      Jeep Wrangler JK motor bölmesi üzerindeki parçalara etiket koymasını istedim, ilk başta makul görünen bir diyagram çıktı.
      Ama fren hidroliği haznesi karşı taraftaydı, onun yerinde soğutma sıvısı taşma deposu etiketi vardı ve gerçek taşma deposu çizilmiş olmasına rağmen etiketsizdi.
      Bataryanın yeri de yanlıştı, ön ızgaranın üst kısmında yağ filtresi kapağı yazıyordu ve yağ dolum kapağının yeri de hatalıydı.
      Bataryanın yarısı sigorta kutusu diye etiketlenmişti ama gerçek sigorta kutusu karşı tarafta doğru çizilmiş olmasına rağmen etiketsizdi.
      Ön cam yıkama sıvısı deposu da birbirine bitişik iki depo gibi görünüyordu.
      Yanlış etiketlenmiş soğutma sıvısı deposuna tıklayınca başka bir sayfaya gidiyordu; bu kez konum doğruydu ama tankın görünüşü tamamen farklıydı ve radyatör kapağını da tankın üstüne koymuştu.
      Oysa gerçekte radyatörün üstünde olması gerekir.
      Konuyu bilen biri her yerde hata bulabilir ama bilmeyen birinin gözünde epey güvenilir görünüyor; tam bir LLM hikayesi.
    • Masamın üzerinde tamamen sökülmüş bir Mac Pro 5,1 varken iç diyagramını oluşturdum;
      dışarıdan Mac Pro’ya benziyordu ama tüm görsel unsurlar yanlıştı.
      Metin de ilk bakışta ancak doğru gibi duruyordu, tıklayıp girilen içeriklerin neredeyse hepsi yanlıştı.
      Görsel olarak havalıydı ama AI’ın bu kadar sürekli yanlış yapmasını 2023’ten beri ilk kez görüyorum.
    • "your mom" yazdım, bana anneliğin tarihsel toplumsal zaman çizelgesi üstüne bindirilmiş bir plasenta yaptı.
      Bunu onaylıyorum.
  • Harika bir proje ama böyle bir şeyi yapıp halka açık bir servis olarak çalıştıracak kaynak ve paranın nereden geldiğini hep merak ediyorum.
    Kendi GPU’ları vardır ya da GPT/Gemini API’sini kurumsal destekli inference ile kullanıyorlardır diye düşünüyorum,
    ama tutumlu yaşamaya alışkın biri olarak yine de bunu kafamda tam oturtamıyorum.

    • Ne yazık ki bunu tamamen cebimden ödüyorum.
      Bunun bu kadar patlayacağını hiç beklemiyordum.
    • Bir kez HN hug of death yiyip bir gecede 50 bin dolar inference faturası gelirse yakında kapanır gibi duruyor.
    • Bir üniversiteye bağlı olabilir diye düşünüyorum.
    • İnsanların hobilerine para harcadığını düşününce o kadar da tuhaf değil.
      Kimisi oyun, resim ya da marangozluğa para harcar,
      kimisi de içki veya spor yerine FAANG seviyesinde maaşından kalan boş zaman bütçesini bir GenAI sanat projesine ayırır.
      Sizin zevkiniz olmayabilir ama dışarıdan lüks görünen bir harcama kalemi herkesin bütçesinde bir şekilde vardır.
    • Ben de benzer bir sebeple buna hiç girişmemeyi düşünüyordum.
      Burada buna immigrant mentality deniyor; küçümseyici anlamda değil, hayatına sıfırdan başlamak zorunda kalmış insanlara özgü bir tutumluluk gibi.
      Üstelik aşırı yavaştı, bu yüzden sonunda beklemedim.
      Yaratan kişiyi suçlamıyorum, sadece gerçekten çok yavaştı.
  • İlk başta bunun diyagram değil, web sayfasının kendisini gerçek zamanlı ürettiğini sandım.
    Kullanıcının ihtiyacına göre uygulamaların anında oluşturulduğu bir geleceği hep ilginç bulmuşumdur;
    bunu gerçekten hayata geçirmiş örnekler var mı merak ediyorum.

  • Mac Neo, 2 adet M4 quantum çip, solid state battery, graphene connector gibi şeyler çıktı.
    https://flipbook.page/n/942776fea47c4274a9a4589134924ef5

  • Sneed's Feed and Seed çıktı. Üzerinde Formerly Chuck's da yazıyor.
    https://flipbook.page/n/4a5e1797903b478c876a35e64c6c57fe

    • Mülkiyet geçmişini takip ettim, en son soyadını Chuck's Feed and Seed yapmış.
      Bunu gerçekten doğru yapsaydı çok etkilenirdim.
    • Dürüst olmak gerekirse bunun The Simpsons tarihindeki en iyi şakalardan biri olduğunu düşünüyorum.
  • Kendi eğitim verilerinde yok gibi görünüyor.
    https://flipbook.page/n/d739a0bbc3664ba2aad331c90fef7406

  • Fikir ilginç ama şu anda neredeyse tamamen başarısız oluyor.
    Muhtemelen HN hug of death yüzündendir.
    Gemini generateContent request failed ile birlikte 429 RESOURCE_EXHAUSTED çıkıyor
    ve mevcut kotanın aşıldığını, plan ve fatura bilgilerini kontrol etmem gerektiğini söylüyor.
    Ayrıntılı limit bilgisi bağlantısı da gösteriliyor.

  • Ana sayfa demosunda Paris Travel Overview / Visiting Notre Dame gösterildiği için,
    gerçekten gittiğim birkaç şehir ve mekânla denedim.
    İlgi noktalarının kendisini sık sık doğru yakalıyor ama birbirlerine göre mekânsal konum ilişkileri tamamen berbattı.
    Gerçekliğe hiç yaklaşmıyordu.

  • Böyle bir şey HN hug of death yaşamak için epey pahalı bir ürün gibi görünüyor.
    Tweet’lerde paylaşılan örnek videolar gerçekten harikaydı.
    Ama şu anda düzgün çalışmıyor; trafik biraz düşünce birkaç gün sonra tekrar denemeyi planlıyorum.