- En yeni görüntü üretim modeli Gemini 3 Pro Image (kod adı "Nano Banana Pro"), mimari görselleştirme sektöründe aynı anda hem heyecan hem de kaygı yarattı
- Mevcut yapay zeka araçlarından ayrışan temel nokta, plan okuryazarlığı (blueprint literacy); kat planlarını soyut çizgiler olarak değil, mimari talimatlar olarak yorumlaması
- Midjourney "hayalperest", DALL-E 3 "iletişimci", Nano Banana Pro ise "mühendis" olarak konumlanıyor
- Reddit'teki r/ArchViz topluluğunda baskın görüş, yapay zekanın konsept sanatında yararlı olduğu ancak uygulama dokümanı düzeyindeki doğruluğa ulaşamadığı yönünde
- Şimdilik bir fikir üretme aracı, dokümantasyonun yerini alan bir çözüm değil; önümüzdeki 5 yıl içinde yapay zeka okuryazarlığının AutoCAD ve Revit gibi mimarlık sektörünün temel yetkinliklerinden biri haline gelmesi bekleniyor
Topluluk tepkisi: heyecan vs. kaygı
- Reddit r/GeminiAI ve r/ArchViz topluluklarında Nano Banana Pro ile ilgili başlıklar oldukça hareketli; iş akışı paylaşımlarının yanında "İnsan sanatçılar demode mi olacak?" gibi rahatsız edici sorular da gündeme geliyor
- r/ArchViz'deki bir kullanıcı, yapay zekanın güçlü olduğunu ancak yüksek riskli profesyonel işler için gereken doğruluktan yoksun olduğuna dair nüanslı bir görüş sundu
- "Meclis onayı, paydaş toplantıları ve yerel yönetim başvurularında çevrenin doğru şekilde tasvir edilmesi gerekir; bu düzeyde ayrıntı ve kontrol yapay zekayla mümkün değil"
- Yapay zeka halüsinasyonları (modelin var olmayan ayrıntılar üretmesi) konsept sanatında tolere edilebilir olsa da uygulama dokümanlarında ölümcül bir sorun
- Belirli bir üreticinin kumaşını ya da birleşim detayını belirtmek zorunda olan iç mimarlar için, yapay zekanın cevabı "tahmin ederek" üretmesi yeterli değil
Uzman bakışı: plan okuryazarlığı
- Mimar ve yapay zeka savunucusu Ismail Seleit, LinkedIn'de deney sonuçlarını paylaştı
- Grafik kalitesinden derinden etkilendiğini ve vektör tabanlı bir model olmamasına rağmen çizimleri yorumlama biçimine şaşırdığını belirtti
- Nano Banana Pro'nun çizimleri sadece güzel görüntüler üretmek için değil, gerçek mimari fikir üretimi yaratacak şekilde yorumladığını söyledi
- X (Twitter) kullanıcısı @ai_for_success da benzer bir tepki verdi
- "Bu çizimi gerçekçi bir 3D görüntüye dönüştürdü; bu sadece görüntü üretimi değil, önce çizimi gerçekten okuyup ardından tüm ayrıntıları yansıtan nihai çıktıyı üretmek"
- Sadece "hayal kurmak" değil, "okumak" bu nesil yapay zekayı farklılaştıran temel unsur
Deney: resmi test
- Ham bir konseptten render'a kadar Nano Banana Pro ile doğrudan deney yapıldı
- Pek çok kullanıcının önerdiği prompt formülü: Subject + Action + Environment + Style + Lighting + Details
Adım 1: Konsept
- Gemini'den bir müze için metin tabanlı kavramsal kat planı üretmesi istendi
- 1. kat: merkezi atrium lobi, büyük merdiven, geniş sergi salonu, kafe, hediyelik eşya mağazası
- 2. kat: ikincil sergi salonları, sınıflar, personel ofisleri
- Dış alan: organik ve kıvrımlı yürüyüş yollarına sahip bir bahçe
Adım 2: "mühendis"e geçiş
- "Ön cephe görünüşü" istendiğinde modelin tutarlılığı korumakta zorlandığı görüldü
- Çizim yüklenip render istendiğinde Nano Banana Pro, "render dosyasını doğrudan üretemem ama prompt mühendisi rolü üstlenebilirim" diye yanıt verdi
- Bu süreç, "human in the loop" yaklaşımının hâlâ vazgeçilmez olduğunu gösterdi — yapay zeka görsel veriyi betimleyici bir prompta dönüştürürken insan yönlendirmesi ve onayı gerekiyor
Adım 3: Uygulama
- Topluluktaki formül ile "prompt mühendisi"nin önerileri birleştirilerek nihai prompt oluşturuldu
- Subject: düz çatılı ve kireçtaşı kaplamalı modern iki katlı sanat müzesi
- Environment: kıvrımlı yürüyüş yolları ve soyut metal heykellerin bulunduğu bahçe
- Style: fotogerçekçi mimari render, 8K çözünürlük, sinematik geniş açı
- Lighting: golden hour, pencerelerden taşan sıcak yapay ışık
- Details: taşın yıpranması, çatı üstü HVAC üniteleri, ölçek referansı için silüet insanlar
Sonuç
- Çıktı "iyiydi ama kusursuz değildi"
- Farklı açılar veya belirli mimari diyagramlar (izometrik cutaway gibi) istendiğinde model sık sık yönünden sapıyordu
- Heykel bahçesinin konum tutarlılığını ya da pencere mullion'larının birliğini korumak için sürekli yeniden prompt yazmak gerekti
Nano Banana Pro vs. Midjourney vs. DALL-E
- Nano Banana Pro'nun gelişiyle yapay zeka üretimli görsellerin "büyük 3"ü ayrı rollere yerleşti
- Midjourney: "hayalperest" — sinematik ışık, sanatsal detay ve atmosferde güçlü
- DALL-E 3: "iletişimci" — kullanım kolaylığı ve prompta sadakat açısından güçlü, ancak nihai gerçekçilikte zayıf
- Nano Banana Pro (Gemini): "mühendis" — daha teknik bir niş açıyor
- Gerçekçi görselleştirme ve ayrıntılı düzenleme potansiyeli belirgin biçimde daha yüksek
- Belirli kireçtaşı aşınması ya da doğru cam yansımaları gibi gerçek dokuları uygulayarak çizimden çok fotoğrafa yakın sonuçlar veriyor
- Temel fark yaratan unsur plan okuryazarlığı (blueprint literacy)
- Midjourney, kat planlarını soyut çizgiler kümesi gibi ele alıp yapısal olarak tutarsız "sanatsal" yorumlar üretiyor
- Nano Banana Pro ise çizgileri mimari talimatlar olarak yorumlayıp amaçlanan mekânsal mantığa saygı duyan çıktılar üretiyor
Sonuç: bir ilham aracı, ikame değil
- Şu an için tasarımcıların konumu güvende; Nano Banana Pro fikir üretim motoru olarak çok başarılı, ancak dokümantasyonun yerini almıyor
- Önümüzdeki 5 yıl içinde mimarlık ve inşaat sektöründe yapay zeka okuryazarlığının AutoCAD veya Revit bilmek kadar standart bir yetkinlik haline gelmesi mümkün
- Sektörün, erken aşamada "mood" ve "atmosfer" üzerinde yinelemeli keşif için yapay zekayı kullanan, gerçek inşa için gereken hassasiyeti ise geleneksel BIM yazılımlarıyla sağlayan hibrit iş akışlarına yönelmesi bekleniyor
- Bu deneyde dışarıda bırakılan önemli bir soru: büyük ölçekli model eğitiminin çevresel maliyeti ve her çıktı için harcanan enerji
- Nano Banana Pro bir mimar ya da tasarımcı değil, bir "ayna" — fikirleri daha net ve daha parlak yansıtıyor, ancak onu güvenle tutacak insan eli hâlâ gerekli
Henüz yorum yok.