Flipbook - Modelden Doğrudan Canlı Olarak Yayınlanan Web Sitesi
(flipbook.page)- Gerçek zamanlı isteğe bağlı üretim ile her sayfayı bir görüntü olarak oluşturuyor; görüntü içindeki bir nesneye tıklanınca onu daha derinlemesine keşfeden yeni bir ekran üretiliyor
- Ekranda HTML veya giriş alanları yok; metinler bile görüntü modeli tarafından piksel olarak doğrudan render edilen piksel merkezli bir arayüz olarak çalışıyor
- Sayfa bilgileri, agentic web search ile görüntü modelinin dünya bilgisini birlikte kullanarak oluşturuluyor; doğruluk düzeyinin ChatGPT, Gemini ve Claude'dan beklenen seviyeye benzer olduğu belirtiliyor
- live video stream özelliği keşif görüntülerini canlandırıp geçişleri daha akıcı hale getiriyor; ancak şu anda öngörülmesi zor ve kaynak tüketimi yüksek olduğu için bir aç/kapa düğmesinin arkasında tutuluyor
- Şimdilik daha çok deneysel bir keşif/öğrenme aracına yakın; ancak görüntü ve video modellerinin doğruluğu ve performansı arttıkça daha fazla gerçek veriyle etkileşimi, görev yürütmeyi ve veri depolamayı içeren bir ortama genişleyebilir
Genel Bakış
- Gerçek zamanlı isteğe bağlı üretim ile çalışan sonsuz bir görsel tarayıcıdır ve kullanıcının ulaştığı her sayfayı görüntü olarak oluşturur
- Ekranda HTML, kod, belirli bağlantılar veya giriş alanları yoktur; görüntü içindeki nesnelere tıklanınca o nesneyi daha derin inceleyen yeni bir görüntü üretilir
- Web'i belge ve UI öğeleri kümesi olarak değil, ekranda üretilen piksel merkezli bir arayüz olarak yeniden kurgular
Nasıl Çalışıyor ve Nereye Genişleyebilir
- Ekrandaki tüm metinler de görüntü modeli tarafından piksel olarak doğrudan render edilir; görüntünün üstüne ayrı bir metin katmanı bindirilmez
- Bunun sonucu olarak metinler bazen eksik olabilir veya yanlış konumda görünebilir; model geliştikçe bunun iyileşebileceği belirtiliyor
- Görüntüdeki bilgiler, agentic web search ile görüntü modelinin kendi dünya bilgisini birlikte kullanarak üretilir
- Bazen hatalı olabilir, ancak çoğu zaman çevrimiçi gerçek verilere dayanan faydalı bir başlangıç noktası olarak sunuluyor
- Olgusal doğruluğun, ChatGPT, Gemini ve Claude kullanırken beklenebilecek düzeye benzer olduğu belirtiliyor
- Metin ve renkli dikdörtgen ağırlıklı ekranlar yerine, bilgiyi zengin görsel anlatımla aktaran bir bilişim deneyimi hedefleniyor
- Yalnızca sabit kod ve kurallarla karmaşık ve incelikli fikirleri aktarmanın zor olduğu görüşünden hareketle, duruma göre tek bir kelime, illüstrasyon veya gerçekçi render gibi en etkili ifade biçimini seçen bir yönelim vurgulanıyor
- live video stream, statik görüntüleri daha sürekli bir video akışına dönüştüren deneysel bir özelliktir; her keşif görüntüsünü canlandırır ve aralarındaki geçişleri daha akıcı hale getirir
- Şu anki davranış biraz öngörülemez ve kaynak tüketimi de yüksek olduğu için açılıp kapatılabilen bir düğmenin arkasında tutuluyor
- Şimdilik son derece optimize edilmiş özel bir video üretim modeli ile iki görüntü üretim sisteminin birlikte kullanıldığı, ileride ise bunun tek bir sistemde birleştirilmesinin planlandığı belirtiliyor
- Şu anda deneysel bir keşif/öğrenme aracı olarak tasarlanmış olsa da, görüntü ve video modellerinin doğruluğu ile performansı arttıkça daha fazla gerçek veriyi içeren, etkileşim kuran, doğrudan görev yerine getiren ve kendi verisini saklayan sayfalara genişleyebilir
- Örnek olarak, bir sonraki seyahati araştırıp başka bir yerde rezervasyon yapma düzeyinden, tüm süreci Flipbook içinde yürütme düzeyine geçilebileceği veriliyor
- Bugün ayrı uygulama ve web siteleri gerektiren işler bile gelecekte Flipbook gibi görünen ve çalışan bir ortam içinde daha fazla yapılabilir deniyor
- Gömülü videoyu desteklemeyen tarayıcılarda oynatılmaz
- Demo, önceden oluşturulmuş videolar kullanır ve hız için düzenlenmiştir
3 yorum
Tanıtım videosuna bakınca bir denemek istiyor insan ama... 3 saat bekleyin diyor. Herhalde inanılmaz bir yığılma var.
https://x.com/DongwooKim/status/2047499005580738657
Seul Namsan’ı çevirdim; oldukça sevimli ve güzeldi.
Hacker News yorumları
Bu gerçekten şaşırtıcı. Bir yerden bulduğum bir hidroponik sistem diyagramını yükledim,
borulama, besin tedariki, elektrik kablolaması gibi ayrıntılı parçaları ayrı ayrı yüksek kaliteli diyagramlar olarak üretti.
Tamamen doğru değildi ama kavramın kendisini çok beğendim.
Arabanın süspansiyon tork spesifikasyonları diyagramını oluşturmasını istedim; aşina olduğum bir konu olduğu için kontrol ettim.
Neredeyse her şeyi doğru çizmişti ve tork değerleri de doğruydu.
Tek tek parçalara tıklayıp daha fazla yakınlaşabiliyor ve ek spesifikasyonları görebiliyordunuz.
Uzun zamandır gördüğüm en etkileyici demolardan biriydi ve yaşayan bir Haynes servis kılavuzu gibi kullanılabilirdi.
Güneş paneli, şarj kontrol cihazı, batarya ve yük gerektiğini bilmesi dışında kablolama anlamsızdı.
Şarj kontrol cihazı ayarları gibi ayrıntılara inince tamamen dağıldı.
Gerçekten güvenilecek bilgi olarak asla kullanılamaz ama izlemesi eğlenceliydi ve uygulama etkileyiciydi.
Sonuç, sadece üzerine upcycled door eklenmiş sıradan bir kulübe gibiydi.
Bisikletin nereye girdiği bile görünmüyordu ve gerçek nihai forma da benzemeyen bir yapı önerdi.
Diğer AI demolarda olduğu gibi dışarıdan inandırıcı görünüyor ama sistem yaptığı şeyi temelden anlamıyor.
Jeep Wrangler JK motor bölmesi üzerindeki parçalara etiket koymasını istedim, ilk başta makul görünen bir diyagram çıktı.
Ama fren hidroliği haznesi karşı taraftaydı, onun yerinde soğutma sıvısı taşma deposu etiketi vardı ve gerçek taşma deposu çizilmiş olmasına rağmen etiketsizdi.
Bataryanın yeri de yanlıştı, ön ızgaranın üst kısmında yağ filtresi kapağı yazıyordu ve yağ dolum kapağının yeri de hatalıydı.
Bataryanın yarısı sigorta kutusu diye etiketlenmişti ama gerçek sigorta kutusu karşı tarafta doğru çizilmiş olmasına rağmen etiketsizdi.
Ön cam yıkama sıvısı deposu da birbirine bitişik iki depo gibi görünüyordu.
Yanlış etiketlenmiş soğutma sıvısı deposuna tıklayınca başka bir sayfaya gidiyordu; bu kez konum doğruydu ama tankın görünüşü tamamen farklıydı ve radyatör kapağını da tankın üstüne koymuştu.
Oysa gerçekte radyatörün üstünde olması gerekir.
Konuyu bilen biri her yerde hata bulabilir ama bilmeyen birinin gözünde epey güvenilir görünüyor; tam bir LLM hikayesi.
dışarıdan Mac Pro’ya benziyordu ama tüm görsel unsurlar yanlıştı.
Metin de ilk bakışta ancak doğru gibi duruyordu, tıklayıp girilen içeriklerin neredeyse hepsi yanlıştı.
Görsel olarak havalıydı ama AI’ın bu kadar sürekli yanlış yapmasını 2023’ten beri ilk kez görüyorum.
"your mom"yazdım, bana anneliğin tarihsel toplumsal zaman çizelgesi üstüne bindirilmiş bir plasenta yaptı.Bunu onaylıyorum.
Harika bir proje ama böyle bir şeyi yapıp halka açık bir servis olarak çalıştıracak kaynak ve paranın nereden geldiğini hep merak ediyorum.
Kendi GPU’ları vardır ya da GPT/Gemini API’sini kurumsal destekli inference ile kullanıyorlardır diye düşünüyorum,
ama tutumlu yaşamaya alışkın biri olarak yine de bunu kafamda tam oturtamıyorum.
Bunun bu kadar patlayacağını hiç beklemiyordum.
Kimisi oyun, resim ya da marangozluğa para harcar,
kimisi de içki veya spor yerine FAANG seviyesinde maaşından kalan boş zaman bütçesini bir GenAI sanat projesine ayırır.
Sizin zevkiniz olmayabilir ama dışarıdan lüks görünen bir harcama kalemi herkesin bütçesinde bir şekilde vardır.
Burada buna immigrant mentality deniyor; küçümseyici anlamda değil, hayatına sıfırdan başlamak zorunda kalmış insanlara özgü bir tutumluluk gibi.
Üstelik aşırı yavaştı, bu yüzden sonunda beklemedim.
Yaratan kişiyi suçlamıyorum, sadece gerçekten çok yavaştı.
İlk başta bunun diyagram değil, web sayfasının kendisini gerçek zamanlı ürettiğini sandım.
Kullanıcının ihtiyacına göre uygulamaların anında oluşturulduğu bir geleceği hep ilginç bulmuşumdur;
bunu gerçekten hayata geçirmiş örnekler var mı merak ediyorum.
Mac Neo, 2 adet M4 quantum çip, solid state battery, graphene connector gibi şeyler çıktı.
https://flipbook.page/n/942776fea47c4274a9a4589134924ef5
Sneed's Feed and Seed çıktı. Üzerinde Formerly Chuck's da yazıyor.
https://flipbook.page/n/4a5e1797903b478c876a35e64c6c57fe
Bunu gerçekten doğru yapsaydı çok etkilenirdim.
Kendi eğitim verilerinde yok gibi görünüyor.
https://flipbook.page/n/d739a0bbc3664ba2aad331c90fef7406
Fikir ilginç ama şu anda neredeyse tamamen başarısız oluyor.
Muhtemelen HN hug of death yüzündendir.
Gemini generateContent request failedile birlikte 429 RESOURCE_EXHAUSTED çıkıyorve mevcut kotanın aşıldığını, plan ve fatura bilgilerini kontrol etmem gerektiğini söylüyor.
Ayrıntılı limit bilgisi bağlantısı da gösteriliyor.
Ana sayfa demosunda Paris Travel Overview / Visiting Notre Dame gösterildiği için,
gerçekten gittiğim birkaç şehir ve mekânla denedim.
İlgi noktalarının kendisini sık sık doğru yakalıyor ama birbirlerine göre mekânsal konum ilişkileri tamamen berbattı.
Gerçekliğe hiç yaklaşmıyordu.
Böyle bir şey HN hug of death yaşamak için epey pahalı bir ürün gibi görünüyor.
Tweet’lerde paylaşılan örnek videolar gerçekten harikaydı.
Ama şu anda düzgün çalışmıyor; trafik biraz düşünce birkaç gün sonra tekrar denemeyi planlıyorum.