ChatGPT webin bulanık bir JPEG'i
(newyorker.com)- Yaşayan en iyi bilimkurgu yazarlarından biri olarak görülen Ted Chiang'ın yazısı
- ChatGPT'nin bilgiyi sıkıştırarak depoladığı, bu yüzden orijinalin değil bulanık bir JPEG'ine bakmaya benzediği fikri
- 2013'te bir Xerox fotokopi makinesinin çizimleri kopyalarken sayıları başka sayılarla değiştirdiği fark edildi
- Kopyalama için dijitalleştirme sürecinde
JBIG2kayıplı sıkıştırma uygulanırken benzer rakamlardan yalnızca biri saklanıp yeniden kullanıldığı için ortaya çıkan bir sorun - Bu örnekle OpenAI'nin ChatGPT'sinin açıkça aynı şey olduğunu söylemek zor olsa da, web bilgisini depolarken benzer bir senaryo oluşabilir
- İnternete erişimi kaybettiğinizi hayal edersek
- Web'deki tüm metni sıkıştırıp bir kopya oluşturmak istersiniz
- Ama depolama alanınız gerekenin yalnızca %1'i kadarsa sıkıştırmanız gerekir; bu yüzden kayıplı bir algoritma kullanmanız muhtemeldir
- Artık her şeyi arayabilirsiniz ama metin fazla sıkıştırıldığı için tam alıntıları bulamazsınız
- ChatGPT'yi web'deki tüm metinlerin bulanık bir JPEG'i olarak düşünmek gerekir
- JPEG gibi, webdeki bilginin büyük kısmını korur ama bit düzeyinde tamamen aynı diziyi korumaz
- Elde ettiğiniz her şey bir yaklaşımdır
- Ancak bu yaklaşım, ChatGPT'nin ürettiği olağanüstü derecede düzgün dilbilgisel metin biçiminde sunulduğu için genellikle kabul edilir
- Bu kayıplı sıkıştırma benzetmesi ChatGPT'nin işlevini anlamanın tek yolu değildir
- Ama ChatGPT'nin ürettiği "halüsinasyonları" ya da gerçekle ilgisiz saçma yanıtları anlamanın bir yoludur da
- Bu halüsinasyonlar, Xerox fotokopi makinesinin ürettiği yanlış sayılar gibi, gerçek hatayı ayırt etmek için orijinaliyle karşılaştırmayı gerektirecek kadar inandırıcıdır
- Büyük dil modelleri metindeki istatistiksel düzenlilikleri tanımlar
- "Arz düşüktür" gibi bir ifade, "fiyatlar yükselir" cümlesine yakın şekilde görünür
- Bu ilişkileri çok kez görmüş bir sohbet botu, arz yetersizliğinin etkisi sorulduğunda fiyat artışıyla ilgili bir yanıt üretir
- Bir LLM'nin (büyük dil modeli) ekonomik terimler arasındaki sayısız korelasyonu toplaması, onun gerçekten ekonomi teorisini anladığı anlamına gelir mi?
- ChatGPT gibi modeller kayıpsız sıkıştırma yapmaz; yani orijinal metni tam olarak yeniden kurmaz
- GPT-3, iki sayıyla toplama çıkarma yaparken 2 basamaklı işlemlerde neredeyse her zaman doğru yanıt verirken, sayılar 5 basamaklı olduğunda doğruluğu ciddi biçimde düşerek %10'a iner
- Çünkü webde
245 + 821gibi metinler içeren çok fazla sayfa yoktur - Muazzam miktarda bilgiyi toplamış olsa da "aritmetiğin ilkelerini" çıkaramamıştır
- ChatGPT'nin kayıpsız bir algoritma olduğunu hayal edin
- O zaman sorulara ilgili web sayfalarından parçaları aynen alıntılayarak yanıt verirdi
- Muhtemelen bunun mevcut arama motorlarına göre yazılım açısından küçük bir iyileştirme olduğunu düşünür ve daha az etkilenirdik
- ChatGPT'nin webdeki materyali kelimesi kelimesine alıntılamak yerine başka sözlerle yeniden ifade etmesi, bir öğrencinin okuduğunu ezberden tekrarlaması yerine düşüncesini kendi sözleriyle ifade ediyor gibi görünmesini sağlar
- Bu da ChatGPT'nin materyali anladığı yanılsamasını yaratır
- LLM'ler için birçok kullanım önerildi; onları bulanık bir JPEG gibi düşünmek neyin uygun olup olmadığını değerlendirmeyi sağlayabilir
- Büyük dil modelleri mevcut aramanın yerini alabilir mi?
- LLM'lere güvenebilmek için propaganda ya da komplo teorileri duymadıklarını bilmemiz gerekir; yani tuhaf verilerle eğitilmediklerinden emin olmalıyız
- JPEG'in webin doğru bölümünü yakaladığını bilmemiz gerekir
- Ama LLM yalnızca istediğimiz bilgiyi içerse bile hâlâ bulanıklık sorunu vardır
- Kabul edilebilir bir bulanıklık türü varsa, bu bilginin başka sözcüklerle yeniden anlatılmasıdır
- Ve gerçekleri ararken asla kabul edilemeyecek, açık tahrifat gibi bulanıklıklar da vardır
- Kabul edilemez bulanıklıkları kaldırıp kabul edilebilir olanları korumanın teknik olarak mümkün olup olmadığı net değil, ama bunu yakında öğreneceğimizi umuyorum
- LLM'lerin sahtecilik yapmasını engelleyebileceğimizi varsaysak bile, onları web içeriği üretiminde kullanmalı mıyız?
- Bu ancak hedefimiz, webde zaten mevcut olan bilgiyi yeniden paketlemekse anlamlıdır
- Bazı şirketler tam da bunun için vardır; bizim içerik çiftlikleri dediğimiz türden
- Muhtemelen LLM'lerin bulanıklığı telif hakkı ihlalinden kaçınmanın bir yolu olarak onlar için yararlı olacaktır
- Ama genel olarak, içerik çiftlikleri için iyi olan şeyin bilgi arayan insanlar için iyi olmadığını söylemek isterim
- Bu tür yeniden paketlemeler arttıkça bugün çevrimiçi bir şey bulmak daha da zorlaştı
- LLM tarafından üretilen metin webde daha çok yayımlandıkça web daha bulanık bir sürüme dönüşür
- GPT-4 hakkında çok az bilgi var ama tahmin edersek, OpenAI'deki kişilerin bunun için gerekli metni toplarken ChatGPT veya diğer LLM'lerin ürettiği materyalleri dışlamaya çalışmış olmaları muhtemel
- Eğer bu doğruysa, LLM ile kayıplı sıkıştırma arasındaki benzetmenin yerinde olup olmadığını görmüş olacağız
- JPEG tekrar tekrar sıkıştırıldığında daha fazla bilgi kaybolur, dolayısıyla daha fazla sıkıştırma artifaktı oluşur
- Eskiden fotokopi kopyasının yeniden fotokopisini çekmek gibi, sadece görüntü kalitesi daha da düşer
- LLM'ler insanların özgün eserler üretmesine yardımcı olabilir mi?
- Benim görüşüm, orijinal yerine bulanık bir kopyayla başlamanın özgün bir eser üretmek için iyi bir yol olmadığı yönünde
- Eğer yazarsanız, özgün bir şey yazmadan önce özgün olmayan çok sayıda metin yazarsınız
- Özgün olmayan işe harcanan zaman ve emek boşa gitmez
- Tam tersine, sonunda özgün bir şey yaratabilmenizi sağlayan şey budur
- Doğru kelimeleri seçip cümleleri iyi akacak şekilde yeniden düzenlemek için harcadığınız zaman, düzyazının anlamı nasıl ilettiğini öğretir
- Öğrencilere makale yazdırmak yalnızca materyali ne kadar anladıklarını test etmenin bir yolu değildir
- Onlara düşüncelerini açıkça ifade etme deneyimi kazandırır
- Gelecekte yalnızca dünyaya dair kendi deneyimlerine dayanarak iyi yazabilen bir yapay zeka kurmak mümkün olabilir
- Bu önemli bir an olurdu, ama buna ulaşacağımız gün tahmin ufkumuzun ötesinde
- İnternete erişim olmadan, alanı sınırlı bir sunucuda onun bir kopyasını saklamak zorundaysanız, ChatGPT gibi büyük dil modelleri iyi bir çözüm olabilir
- "Ama internete erişimimizi kaybetmedik. Orijinal elimizdeyken neden bulanık bir JPEG kullanalım?"
26 yorum
5 basamaktan uzun toplama-çıkarma işlemlerini tekrar tekrar sorup denedim ama sürekli doğru cevap veriyor.
Asıl hangi noktada doğruluğun düştüğü söyleniyor?
Ted Chiang’ın gözden kaçırdığı nokta, şimdiye kadar internette gezinmenin başlıca yöntemi olarak kullanılan Google Arama’nın son birkaç yılda düşük kaliteli web içeriği enflasyonundan etkilenip kalitesinin ciddi biçimde düşmüş olmasıdır.
ChatGPT bulanık bir JPEG olsa bile, bunun alternatifi yalnızca gürültüyle dolu bir Google Arama ise, şu anda bilgi edinmek için en iyi araç olarak ChatGPT’yi kullanmak makul olabilir.
"İnternete erişim hakkımızı kaybetmedik" denmişti ama yanlış öncül tam da burada. Web’in devasa ölçeği düşünüldüğünde, keşfetme yeteneğini kaybetmenin fiilen erişim hakkını kaybetmekle aynı anlama geldiğini düşünüyorum. İstediğim bilgiyi bulamıyorsam, erişim hakkımın olmasının ne anlamı var?
Yani durum giderek "orijinal"in olmadığı bir hale yaklaşıyor ve bence insanların şu anda "bulanık JPEG kullanmak zorunda kalmasının" sebebi de tam olarak bu.
Aşağıdaki lightgreenmaesil kullanıcısının bıraktığı yorumun, Ted Chiang'ın bakış açısıyla onun karşısında duranların arasındaki farkı gösterdiğini düşünüyorum.
"Öncelikle boyutu daha büyük ve bakması da daha uzun sürüyor. Fotoğraf olunca zaman pek somut gelmeyebilir ama bunu bir kitapla, o kitabın özünü tek sayfada özetleyen bir metin olarak düşünürsek daha iyi hissedilir."
YouTube'daki 15 dakikalık film özetleri ya da kitap özetleri gibi şeylerin popülerliğine ve izlenme sayılarına bakarsak, insanların gerçekten bunları sevdiği açık. Shorts da öyle. Ancak bu özetlerin aslı bütünüyle ifade edip edemeyeceğini düşününce, cevabın hayır olması daha doğru gibi görünüyor. Orijinali görüp etkilenmiş biri için, özette eksik kalan şeyler çok daha belirgin hissedilecektir.
Bir romancı olan Ted Chiang açısından bakıldığında, ChatGPT ya da LLM'lerin yaptığı şeyler, kendi romanının 1-2 sayfalık özetlerini okuyormuş gibi hissettirecektir. Ve o kısa yazının içinde bu romanın tamamının yer aldığını söyleyen ya da buna inanan insanları görünce, bunun gerçekten doğru olup olmadığını sorgulaması doğal olur.
Aynı şekilde film yönetmenleri ya da oyuncular, orijinal yerine yalnızca 15 dakikalık film özetlerini izleyen insanları sever mi? O insanları kendi eserini izlemiş sayar mı? Daha da ileri gidip neredeyse herkes 15 dakikalık özeti gerçek filmden daha çok film gibi algılarsa ne olur? Bu yüzden artık film üretilemez hale gelinirse, 15 dakikalık özetler hangi filmi izleyip özetleyecek?
Video da yazı da özetlenip hızlı ve sıkıştırılmış şekilde tüketilmeyi seven bir çağda yaşıyoruz ama ilginç biçimde müzik tek başına olduğu gibi kalıyor. Müziği özetleyerek dinleyen, 2x hızda dinleyen ya da sıkıcı kısımları 10'ar saniye atlayarak dinleyen kimse yok.
Peki o zaman, çağın ruhuna uygun şekilde NewJeans'in Ditto şarkısını 2x hızda ve 1 dakikalık ön dinlemeyle dinleyen ben, NewJeans hayranı olabilir miyim? Sıkıştırıp özetleyerek dinleyen ben de o şarkıyı dinlemiş sayılır mıyım? Sayılmaz mıyım? Yoksa bunun bir önemi yok mu?
Ted Chiang’ın kendisi de dil modellerini açıklarken JPEG gibi kayıplı sıkıştırma benzetmesini kullandığı için, orijinal mevcut olsa bile sıkıştırma bilgisine ihtiyaç vardır.
Ayrıca dil modeli kendi ürettiği sonuçlarla yeniden eğitilse bile bilgi kaybı neredeyse yoktur. (İç model parametrelerinde neredeyse hiç güncelleme olmaz. Zaten bildiği bilgi olduğu için öğrenme etkisi ortaya çıkmaz.)
Son soruya yapılan çeviride özgün metinle nüans farkı var gibi görünüyor; sanırım yalnızca çeviriye bakıldığı için özgün metnin niyetinden farklı çok sayıda yorum yapılmış.
So just how much use is a blurry jpeg, when you still have the original?
Elinizde orijinali varken, bulanık bir JPEG ne kadar işe yarar?
Bana bu, Raw dosyasına sahipken JPEG’in ne kadar faydalı olduğunu sorgulayan bir ifade gibi görünüyor.
Bunu "kullanmak için ne sebep var" diye yorumlayınca, "RAW varken JPEG gibi bir şeyi neden kullanasınız" anlamına kayıyor gibi duruyor.
Elbette gerçekte JPEG’in raw’a göre daha yaygın olmasının sebepleri var; dolayısıyla bunun o bakış açısını da içeren bir soru olduğunu düşünüyorum.
Bazen açık kaynak resmî dokümantasyonuna ya da AWS’nin resmî dokümantasyonuna bile güvenemeyip doğrudan çalıştırarak doğrulamak veya hatta kaynak koduna kadar bakmak gereken durumlar çok oluyor; ChatGPT’de artık varın siz düşünün... Bilgi miktarı arttıkça, insanların yapması gereken çapraz doğrulama yükü gereksiz yere daha da artıyormuş gibi geliyor bana.
JPEG ile orijinalini ayırt edemiyor musunuz?
Görüntünün özelliklerine ve sıkıştırma oranına göre değişir. Fotoğraf çeken biriyseniz, JPEG’den ayrı olarak orijinal dosyayı da elinizde tutmayı tercih edersiniz. Çünkü daha sonra düzenleme ve rötuş yaparken, bunu JPEG dosyasıyla yapmakla orijinal dosyayla yapmak arasında düzenlenebilir aralık açısından büyük fark vardır.
https://www.keptlight.com/does-size-matter/
Şu anda bile çoğu insanın geçimini sağlamak için yaptığı iş, tam da o bulanık JPEG’i üretmek değil mi?
ChatGPT gerçekten çok etkileyici, ancak fazla insansı olduğu için arama ve bilgi aktarma açısından pek uygun değilmiş gibi geliyor.
Bunun, orijinali değil de bulanık bir JPEG’e bakmaya benzemesine gerçekten çok katılıyorum. Mesela çeviri bir kitap okurken, çevirmenin serbest yorumunun çok fazla yansıdığı durumlarda, ortada çeviride tuhaf bir şeyler olduğunu hissetsem bile, kelimeler sanki akıcı biçimde birbirine bağlanıyormuş ve genel bağlam da kabaca tutuyormuş gibi gelirse çoğu zaman sayfaları çevirmeye devam ediyorum (hepsini okuduktan sonra gerçekten anlayıp anlamadığım ise ayrı bir mesele). Ama o tuhaf gelen çeviri aslında saçma sapan bir şey de olabilir; bu yüzden bu göz ardı edilecek bir sorun değil. Böyle bir çeviri bazıları için kabul edilemez olabilirken, bazıları için katlanılabilir bir düzeyde olabilir.
Hm. Görüntü kalitesi berbat.
Belki de bunun bir uyarı anlamı taşıdığını düşünebiliriz. Ben de işte, tavsiyeye ihtiyaç duyduğumda ya da bir cümleyi cilalarken onu sıkça kullanıyorum ama belli ki kulağa oldukça makul gelen, yine de yanlış cevaplar verdiği durumlar da var. Kullanıcının bu cevabın yanlış olduğunu anlayabilmesi için o alana dair bilgiye ya da ek araştırmaya ihtiyaç duyması da bir gerçek. Bazen ancak beklenmedik ölçüde detaylı bakınca fark edilebilen hatalar da oluyor. (Kod ürettiğinde gerçekte var olmayan bir fonksiyon kullanması gibi)
Böyle hataları fark edene kadar, bu yapay zekanın bana bu tür cevaplar verebileceğini açıkçası hiç düşünmemiştim. Yalnızca ya hiç cevap verememesini ya da alakasız cevaplar vermesini aklıma getirmiştim.
Bu tür teknolojilere dair anlayışı görece daha yüksek insanların bulunduğu Stack Overflow gibi yerlerde bile AI cevaplarıyla bağlantılı sürtüşmelerin azar azar yaşandığını görünce, kullanıcılar arasında sanıldığından daha kusursuz bir doğrulama yapılmadığı anlaşılıyor. AI tarafından üretilen verilerin doğrulanması insan müdahalesi gerektirir ve açıkça emek ile bilgi isteyen bir iştir. Aksi olsaydı Microsoft da kendi yapay zekasının ürettiği kulağa makul gelen hataları gözden kaçırmazdı. Bu yüzden bu teknolojiyi şimdilik bir araç olarak kullanmamız gerektiğini biliyoruz. Ancak telefondaki yapay zekaya bugünün havasını sorduğumuzda, bu cevabın bir bug ya da başka bir hata nedeniyle yanlış olabileceğini varsaydığımız pek olmaz. ChatGPT gibi yapay zekalar giderek genel amaçlı yapay zeka olarak gündelik hayatla daha iç içe geliştiğinde, kullanıcıların bu cevapları büyük bir şüphe duymadan kabul etme olasılığı yüksek değil mi?
Bu aralar okullarda ChatGPT vb. kullanılarak essay yazdırma örnekleri çok. Sadece hataları işaret ettirmek, yazı için konu fikri almak ya da metni genişletmek düzeyinde değil; problem üzerine düşünmeden AI'ın cevabındaki kelimeleri biraz değiştirip teslim ederek yüksek not alan vakalar haber oldu. Doğrudan araştırılmış materyallere dayanarak kişinin kendi düşüncesinin sorulduğu bir durumda düşünmeyi, kurguyu ve yazımı yapay zekaya bırakmak kesinlikle yeni bir paradigma.
Yapay zekadan bağımsız olarak da internette bazen yanlış bilgilerin yığınla arama sonucunda çıktığı çok oluyor; buna ek bir doğrulama yapmadan gerçek diye inanan birçok insan var. Ben de her birini tek tek doğrulayarak okumazsam, fark etmeden yanlış bilgileri kabul ettiğim çok olmuştur.
Sıklıkla veri aşınması diye şakayla karışık söylenen bir şey var ya; internette bir fotoğrafın jpg olarak çeşitli sitelerde dolaşıp paylaşılması sürecinde yeniden boyutlandırma ve dosya sıkıştırması tekrarlandıkça görüntü kalitesi bazen mahvoluyor. Bembeyaz arka planın bile masmavi bir renge dönüştüğü oluyor.
Sanırım endişe edilen şey, buna benzer bir bilgi bozulması. Hani derler ya, kötü para iyi parayı kovar.
Çizim paylaşım siteleri şimdiden AI'ın ürettiği görsellerle dolup taşıyor. Bunun yanlış olduğunu söylemiyorum ama internet AI'ın yazdığı yaklaşık değer niteliğindeki makalelerle tıka basa dolarsa ve buna dayanan AI'lar yeniden makale üretmeyi sürdürürse, bilgi üzerindeki çarpılma da yavaş yavaş birikmez mi? Böyle düşünüyorum.
30 yıldan uzun süredir SF okuyorum ve son 10 yılda okuduğum yeni SF eserleri arasında 'Hayatının Hikâyesi'ni en tepeye koyan sıkı bir hayranım; ama 20 yılı aşkın süredir geliştirici olarak çalışmış bir sektör çalışanının bakış açısından buna itiraz etmek zorundayım.
Temelde bu söz, kibir denebilecek bir bakış açısından çıkmış. İnsanlar (cahil oldukları için) ChatGPT başta olmak üzere yapay zeka platformlarının yaratım alanına ulaştığını sanacaklar; ama ben bunun böyle olmadığını biliyorum, o yüzden onlara doğru sözle doğru gerçeği anlatmam gerekiyor, diyen bir bakış açısı bu.
Asıl gerçek ise bunun böyle olmadığını yalnızca sektör çalışanlarının değil, insanların büyük çoğunluğunun da biliyor olmasıdır. AlphaGo'dan sonra yapay zeka uzun zamandır kamunun gündem maddesi hâline geldi. Herkes yapay zekanın yeteneklerini de sınırlarını da belli ölçüde biliyor. Bugün yapay zeka baduk dünyasında AlphaGo'yu emzikli bebek sayacak kadar güçlü oyuncular cirit atıyor ama bunu kimse şok edici bulmuyor. Bunun ne anlama geldiği ve nasıl karşılanması gerektiği konusunda insanlar epey şey öğrenmiş durumda.
Bence Ted Chiang'ın bu sözü, tam tersine, halka dair cehalet ve önyargıdan kaynaklanan bir hata. ChatGPT'ye hayranlık duyan kitle bunu bizim zihinsel faaliyetlerimizin yerini alacağına inandığı için yapmıyor. Herkes bunun bizim zihinsel faaliyetlerimize "yardımcı" olacağını gayet iyi biliyor ve onu bu şekilde kullanıyor. Prompt örnekleri adeta kılavuzlaştırılıp paylaşılıyor. Buradan bunun bir araç olduğunun açıkça farkında olunduğu anlaşılabiliyor.
İnsanlar resim çizen yapay zekayı nasıl karşılıyor? Ondan kendi yaratıcılığımın yerine geçmesini isteyip sihirli lamba gibi ovuşturuyorlar mı? Benim son zamanlarda gördüğüm AI görsellerinin yaklaşık %90'ı erotik görsellerdi. Elleri iyi çizemediği için bulanık denebilirse bulanık, ama geri kalan kısımları son derece temiz ve netti.
Söylenecek çok şey var ama çok fazla olduğu için tek bir şey söyleyip bitireceğim.
"Müdür Bey. Naçizane bir tavsiye vermek isterim. Başka bir şey değil, Excel fonksiyonlarını fazla kullanmayın. Bir yerde rahatlık varsa, risk de artar. Öküz kesmeye uygun bir bıçak vardır da tavuk kesmek için de bıçak gerekir mi?...... Benim görüşüm, zihinden hesap daha hızlı olabilir ve elbette kişiden kişiye değişir ama hesap makinesi iyi olabilir. Bilgisayar öküz kesen bıçak değil midir diye fikrimi arz ederim."
Son soru yanlıştı. Karşılaştırma nesnesi bulanık bir JPEG değil, bir JPEG fotoğrafın sözel özeti olmalıydı. Örneğin 'dilini çıkaran bir köpek' metni ile bunun gerçek fotoğrafı gibi. Bu da bir tür kayıplı sıkıştırmadır. Bilginin büyük çoğunluğu silinip yalnızca birkaç baytlık metne sıkıştırılmıştır. Peki elimizde özgün fotoğraf varken bu tür bir kayıplı sıkıştırmanın değersiz olduğu anlamına mı gelir? Hayır. Her şeyden önce boyutu daha büyüktür ve bakması da daha uzun sürer. Fotoğraf olunca zaman farkı çok hissedilmeyebilir ama bir kitap ile o kitabın ana fikirlerinin tek sayfada özetlenmiş hali derseniz daha somut olur.
Peki o zaman elimizde bir makale varsa, o makalenin kayıplı sıkıştırması olan özetine bakmak için bir neden var mı? Elbette var ve duruma göre son derece faydalıdır. Elinizde bir kitap varsa, o kitabın bir bölümünde geçen belirli bir iddiaya ilişkin özeti kullanmak için bir neden var mı? Tabii ki var. Bir bakıma insanların okula gidip onlarca saat ders dinlemesi, sonra bunu notlara ya da cheating sheet'e özetleyip düzenlemesi de videodan yazıya yapılan muazzam bir kayıplı sıkıştırmadır. Öğrenmenin kendisi kayıplı sıkıştırmadır. Bu işe yaramaz mı?
' Sıkıştırma'yı fotoğraf sıkıştırmasına benzeterek sanki çok trivial ve büyük anlamı olmayan bir şeymiş gibi yazmış ama aslında sıkıştırma, insanın öğrenmesinde son derece özsel ve anlamlı bir iştir. Fotoğraf gibi alanlarda sıkıştırma yöntemleri belli ölçüde epey çözülmüş durumda ama dilin sıkıştırılması son derece non-trivial ve önemli bir iştir.
Son sorunun cevabı şu:
GPT aracılığıyla bize sunulan bilgi bozulmuş bir JPEG sürümü olsa bile, çoğu zaman istediğimiz bilgi bir kolaj versiyonu ve bu kolajı oluşturmak için gereken emek oldukça fazla.
Bu kolaj yapma çabasının yerini alıyor ve bazen genel tamamlanmışlık düzeyi benim el becerimden daha iyi oluyor; görüntü kalitesindeki düşüşü fazlasıyla göze alınabilir kılıyor.
Ted Chiang'ın hayal gücünü ve teknoloji anlayışını benim değerlendirebilecek konumda olmadığımı söyleyebilirim, ama genel olarak bunun bu teknolojinin bazı özelliklerini aşırı yorumlamış bir sonuç olduğunu ve gerçekten önemli özellikleri gözden kaçırdığını düşündürüyor.
Son soruya verilecek cevap muhtemelen 'rahat olduğu için' değil mi?
Ne kadar yerinde bir benzetme emin değilim ama, bugünlerde film/dizi maratonu gibi orijinalin sıkıştırılmış hâllerine yönelik memnuniyetin yüksek olması gibi.
Bence bu çok iyi bir benzetme, ama sektörün içinde olmayanların asla anlayamayacağı türden bir benzetme.
Bunu, (uzmanmış gibi davrananlar dahil) uzman olmayanlara nasıl anlatabiliriz?
Super Resolution, orijinalden daha iyi olabilir
Elbette daha iyi olabilir ama bunun her durumda mutlaka daha iyi olmadığını yazı da belirtmiyor mu?
Daha iyi olabileceği söylendi ama elbette bu her zaman daha iyi olacağı anlamına gelmiyor. Ancak yazı yalnızca çözünürlüğün bulanık olduğunu söylüyor; tersine daha net hâle gelme olasılığını ise dışarıda bırakıyor. CCTV görüntü kalitesi de iyileştiriliyor ve siyah beyaza renk de ekleniyor, ama başlıktaki JPEG bunları desteklemiyor.
Görüntü kalitesini iyileştirmek, yani CCTV görüntü kalitesini artırmak, bazı açılardan aslında bir iyileştirme değildir. İnsana görüntünün iyileştirildiğine dair bir 'duygu' verir. Siyah beyaza renk eklemek de aynıdır. Siyah beyaz görüntüye renk 'üreterek' insana renkli görüntünün 'duygusunu' verir. Bu nedenle, günümüzde görüntü kalitesi artırma teknolojilerinin ele aldığı 'iyileştirme', çok dar bir çerçevede ele alınması gereken bir meseledir. CCTV görüntü kalitesi iyileştirmesi konusunda, JPEG'in böyle bir şeyi desteklemediğini söyleyerek yapılan karşılaştırma ise son derece haksız bir karşılaştırmadır.
Yorumunuz için teşekkürler. Ama aynı mantıkla bakarsak, bulanık olmanın kendisi de bir açıdan bozulma değil; bozulmuş olanı "üreterek" bir "duyum" sunduğu için, bu da çok dar bir çerçevede ele alınması gereken bir mesele. O halde ChatGPT'nin matematik yeteneğini JPEG bozulmasıyla karşılaştırmak da oldukça haksız bir benzetme olmaz mı? Bilgi miktarının kendisini artırırken özellikle insan "duyumu" gibi şeylerden söz etmeye gerek olmadığını düşünüyorum. Nasıl ki orijinal renkler siyah-beyaz sıkıştırılırken dosya boyutu azalırsa, tersine yeniden renk eklemek yalnızca bit boyutunu değil, bilgi miktarını da artırır; bu yüzden bu durum sıkıştırmadan çok sıkıştırmayı açmaya ya da hatta orijinali geri yüklemeye benziyor. Bunun orijinalin kendisi olmaması nedeniyle bulanık olduğunu söylemek bana çok daha haksız bir karşılaştırma gibi geliyor. Sadece başlığa bakınca insan, sanki DALL-E de yalnızca düşük kapasiteli düşük çözünürlüklü görseller üretiyor ve HD üretemiyormuş gibi yanlış anlayabilir. Metinde dendiği gibi, JPEG tekrar tekrar sıkıştırıldığında genelde boyut küçülür, kalite düşer ve görüntü kaçınılmaz olarak bulanıklaşır; ama derin öğrenmenin, veri az olan matematiksel hesaplamalarda bulanık kalsa bile, tersine bazı alanlarda daha belirgin, daha doğru ve daha iyi performans gösterebildiği gerçeğinin göz ardı edilmemesini isterim.
Söyledikleriniz arasında benim gözden kaçırdığım tek bir nokta bile yoktu. Siz orijinali üretirken, benim 'orijalin kendisini değil, orijinal gibi algılanan şeyi' üretiyor olmam sizi epey öfkelendirmiş gibi görünüyor. Öyle de olsa böyle de olsa, basit gerçek bu; ne yapabiliriz ki.
Dediğiniz gibi ben çok öfkeli olduğuma ya da bunun çok haksız olduğuna dair bir duygu ifadesinde bulunmadım, değil mi? Sadece Ted Chiang adlı kişinin söylediği bu haber başlığını halkın görüp gözden kaçıracağından endişelendim. Görünüşe göre çoğunuz katılıyorsunuz; en azından bunu kişisel olarak bildiğinize sevindim. Dijitalle analog üretmenin zor olduğuna katılıyorum. Metin konusu olduğu için bu ise ayrı bir mesele.
Xerox fotokopi makinesi sorunu, 2022'de öğrendiğim 52 şey #33'te de gördüğüm bir konuydu.
Bunun buraya bağlanması ilginç ve bir anda çok anlamlı geliyor!