- Metin, insanlık tarihindeki en güçlü iletişim teknolojisidir; ifade gücü ve verimlilik açısından diğer tüm mecraları geride bırakır
- Resim, video ve sesten daha çok soyut kavramları ve karmaşık düşünceleri hassas biçimde aktarmaya en uygun araçtır
- Binlerce yıl önceki kayıtların bugün hâlâ okunabilmesi sayesinde dayanıklılığı ve istikrarı kanıtlanmış bir teknolojidir
- Depolama ve iletim maliyeti açısından ezici derecede verimlidir ve iletişim teknolojilerinin gelişiminde defalarca başlangıç noktası olmuştur
- Arama, çeviri, özetleme ve işbirliği gibi alanlarda toplumsal kullanım kapsamı ve derinliği bakımından başka hiçbir mecra onunla yarışamaz
Metne dair temel yaklaşım
- Video, 3D, oyunlar ve dinamik multimedya sistemleri hakkında ne zaman soru gelse, hep aynı görüşü yinelemiş
- Görsellerin, fotoğrafın, sinemanın ve müziğin değerini inkâr etmese de, metnin üstünlüğünün mutlak olduğunu savunur
- Metni en güçlü, en kullanışlı ve en etkili iletişim teknolojisi olarak tanımlar
En eski ve en istikrarlı teknoloji
- Konuşma ve işaret dili insan toplumlarında doğal olarak bulunur; ancak metin, öğrenme ve aktarım yoluyla edinilen bir teknolojidir
- Yaklaşık 5 bin yıl önceki kayıtların bugün okunabilmesi kadar zamana dayanıklı bir yapıya sahiptir
- Taş gibi fiziksel mecralara kazındığında, insanlıktan daha uzun süre varlığını sürdürme ihtimali bile vardır
En esnek ifade aracı
- Görseller bazı durumlarda güçlüdür, ancak rastgele soyut cümleleri görsel olarak ifade etmek imkânsızdır
- İnsan haklarının tanımı gibi kavramsal cümleler resimle ikame edilemez
- Metin, fikirleri aktarırken kesinlik ve belirsizlik düzeyini kontrol etmeyi mümkün kılar
- Edebiyatın, felsefenin, tarihin, matematiğin, mantığın, programlamanın ve mühendisliğin metin temelli olması tesadüf değildir
En verimli iletişim biçimi
- Metin, depolama alanı ve iletim maliyeti bakımından bambaşka bir verimlilik düzeyi sunar
- Birkaç bin baytlık metin, basit bir ikon görselinden bile daha küçük olabilir
- Optik telgraftan elektrikli telgrafa, teleprinter'dan ilk bilgisayar ağlarına kadar önce hep metin ortaya çıkmıştır
- Ses, görsel ve video ancak bant genişliği yeterince ucuzladıktan sonra yaygınlaşmıştır
- Tüm Wikipedia'yı bir akıllı telefona sığdırabilecek kadar yoğundur
Toplumsal açıdan en kullanışlı teknoloji
- 1:1, 1:N ve M:N iletişimin tamamında verimli biçimde çalışır
- El yordamıyla bile olsa arama ve indeksleme yapılabilir
- Çeviri, karşılaştırma, diff, kümeleme, düzeltme, özetleme ve filtreleme gibi algoritmik işlemeye son derece uygundur
- Asenkron kullanıma uygundur ve hız ayarı serbesttir
- Ortak düzenleme, alıntılama, açıklama ekleme, dallanan tartışmalar, özet, inceleme ve türev üretimi destekler
- Kütüphanelerin ve internet gönderilerinin sahip olduğu toplumsal ve bilişsel karmaşıklık düzeyini ikame edecek bir teknoloji yoktur
Sonuç
- Bu yüzden metne dair görüş nettir: her zaman önce metni seçmek gerekir (always pick text first)
- Eski bir patronun sözüyle, her zaman metne bahse girmek gerekir (always bet on text)
- Bir işi metinle yapmak mümkünse öyle yapılmalıdır. Metin neredeyse hiç hayal kırıklığına uğratmaz
3 yorum
Metnin gerçekten iyi bir ifade aracı olduğu doğru ve çok önemli olduğu da doğru ama......
Her şeyi metin olarak saklayamazsınız.
Metin sonuçta sıkıştırılmış bir ifadedir. Hissedebildiğimiz beş duyuyu (görme, işitme, dokunma, tatma, koku alma) toplumsal olarak uzlaşılmış bir biçime sıkıştırıp ifade ederiz.
Ama o asıl biçimi oluşturan nesne hakkında bilgi yoksa, veriyi ne kadar metin olarak saklarsanız saklayın, daha sonra o asıl nesnenin ne olduğunu bilmiyorsanız o metin anlamını yitirir.
Biz kasetin ne olduğunu biliyoruz, ama yakın zamanda doğmuş küçük çocuklara yalnızca "kaset" metnini gösterip bunun ne olduğunu sorsanız gerçekten kaç tanesi doğru düzgün cevap verebilir? Kasetin biçimi, işlevi ve çalışma şekli hakkında ne kadar özenle açıklama yazarsanız yazın, sırf o metne bakarak birkaç bin yıl sonra o kaseti kusursuz biçimde yeniden üretebilir misiniz?
Böyle durumlarda birkaç kaset fotoğrafı ya da çizim, hatta kasetin kullanıldığı birkaç dakikalık bir video daha faydalı olabilir.
Metnin kesinlikle istikrarlı olduğu açık, ama ne kadar sezgisel olduğundan pek emin değilim.
Hacker News yorumları
Bu tartışmadaki ikili karşıtlığı anlamıyorum
Neden UTF-8 ile piyano performansı kaydı arasında seçim yapmam gereken bir durum olsun, anlamıyorum
Sanki konuya fazla kapılmış biri her şeyi “Ford vs. Chevy” tarzı basit bir karşıtlık olarak anlatıyormuş gibi geliyor
Hepimiz metni seviyoruz, o yüzden kimsenin bizi ikna etmeye çalışmasına gerek yok
Metnin sonsuz esnekliği ve dayanıklılığı konusunda hemfikirim, ama Bret Victor’ın işlerini gördükten sonra metnin sınırlarını da hissettim
Piyano öğrenirken anında bir geri bildirim döngüsü vardı ve bu tür bir öğrenme biçimini metinle kurmak zor
Victor’ın asıl söylemek istediği, geri bildirim merkezli bu öğrenme biçimini mühendislik ve eğitimin geneline yaymak
Metin hâlâ önemli, ama başka duyusal sezgileri kullanan yöntemlerde de büyük potansiyel olduğunu düşünüyorum
Bret Victor’ın demoları etkileyici, ama gerçek uygulama muazzam bir emek gerektiriyor
Fikrin kendisi harika, ama hayata geçirilmesi için büyük yatırım ve adanmışlık gerektiğini kabul etmek lazım
Veriyi ya da sonuçları metinle açıklamak zor, ama grafikler bir anda çok fazla bilgi aktarabiliyor
Metin asenkron olduğu için iyi, ama insanlar içgüdüsel olarak konuşmayı ya da görsel ifade biçimlerini tercih ediyor
Sonuçta tek bir iletişim tarzındansa karma bir yaklaşım daha doğal
Çocuk sadece bakıp öğrenir ve bunu fiziksel sezgiyle kavrar
Bisiklet sürmek gibi bedenle öğrenilen bilgi, metinle neredeyse hiç aktarılamaz
Metin semboliktir, görüntü ise duyusaldır
Norman Rockwell’in bir tablosunu metinle kusursuz biçimde ifade etmek imkânsızdır
Nota yazımı ya da Feynman diyagramları gibi metin tabanlı sembolik sistemler ise hâlâ çok güçlüdür
OP’nin yazısını 30 saniyede özetledim, ama Bret Victor’ın videosu 54 dakika ve çoğu kişi muhtemelen onu izlemeyecek
Metin, verimlilik ve dönüştürülebilirlik açısından hâlâ en iyi ortam
Diğer ortamların yardımcı araçlar olarak kullanılması daha mantıklı bence
Kendimi bir metin maksimalisti olarak tanımlıyorum
Metin, insanla makine arasındaki doğal temas noktası ve verimlilik ile şeffaflık arasındaki denge noktasıdır
Her şey string olarak saklanabilir; base64, JSON, HTML, CSS, SQL vb. ile ifade edilebilir
Sonuçta sektörün peşinden koştuğu gümüş kurşun (silver bullet) string’miş
Karmaşık ikili formatlar okunabilirliği kaybediyor ve GZIP sıkıştırmasından sonra avantajları da neredeyse kalmıyor
Metin tabanlı protokoller, Postel yasası sorunları nedeniyle kırılganlaşıyor
%30 bant genişliği farkı asla küçük değil ve HTTP3’ün ikili formata geçmesinin nedeni de bu
base64’ü sıkıştırsanız bile okunabilirlik zaten kaybolmuş oluyor
İlgili bağlantılar: Robustness principle, Regex sorunu, ReDoS
Zaten gzip’lenmiş JSON’u insan doğrudan okuyamaz, dolayısıyla bir araçtan geçmesi büyük bir sorun değil
İnsanların düzenlediği yapılandırma dosyaları için text proto ya da JSON daha uygun
grep, git ve dönüştürme işlemlerinin hepsi kolay
Eski makalelerimi Lotus Word Pro ile yazmıştım ve artık okuyamıyorum; metin olsaydı sorun çıkmazdı
Büyük sistemlerde çok sayıda metin dosyası dolaşır ama şeffaflık neredeyse yoktur
Büyük ölçekli ortamlarda birkaç bit tasarrufu bile ciddi maliyet düşüşü sağladığı için, self-labeled alanlar elenir
Metin sonuçta yalnızca baytların bir gösterimidir
Ama metne bu kadar bağlı kalmamızın nedeni, ikili formatların kapalılığı ve araç eksikliğidir
CSV içinde yüz milyonlarca base64 sütunu olsa bile, uygun araç yoksa bu ikili formattan daha iyi olmaz
Standardizasyon sayesinde anlam paylaşılabilir ve LLM gibi modeller bunu öğrenebilir
“Rastgele bir wiki cümlesini resimle ifade etmeyi dene” denildiği gibi, her şeyi metinle ikame etmek mümkün değil
Tersine, bir film klibini metinle eksiksiz anlatmak da imkânsız
Metin tüm ortamların üst kümesi değildir, sadece farklı bir ifade türüdür
Örnek: Flight management system, NOTAM
“Metin en eski ve en istikrarlı iletişim teknolojisidir” iddiasına gelince
Aslında dilin kendisi daha eski bir teknolojidir
Sözlü gelenekler kuşaklar boyunca bilgiyi aktardı ve insan dili bunların en karmaşığıdır
Örneğin Avustralya yerlisi Gunditjmara, 30 bin yıl önceki bir volkan patlamasını hikâyelerle aktarıyor (Budj Bim)
Metin, bilgiyi kuşaklar boyunca bozulmadan aktarabilmesi bakımından benzersizdir
Sonuçta varılan nokta “Dile yatırım yap” oluyor
LLM’lerin bu kadar etkileyici olmasının nedeni, insanlığın binlerce yıldır tüm bilgisini metin olarak kaydediyor olması
Görüntü modelleri de metin ile görsel arasındaki ortak embedding alanı sayesinde ilerledi
Kullanışlı olabilir, ama buna gerçekten “etkili” bir model demek zor
Bir dilbilimci olarak, yok olma tehlikesi altındaki dilleri kaydederken metnin (Unicode) en sürdürülebilir format olduğuna inanıyorum
Binlerce yıl önce yazılmış Yunanca ya da Sanskritçe dilbilgisi kitapları bugün hâlâ okunabiliyor
Ekibimiz PDF olarak yayımladı ama içeride XML olarak korudu
Umarım 2000 yıl sonra da okunabilir
UTF-16, SJIS, EUC gibi kodlama karmaşaları çoktu; buna karşılık PDF ve JPEG hâlâ kusursuz açılıyor
Depolama alanı izin veriyorsa görüntü formatında arşivlemek daha güvenliymiş gibi geliyor
Ayrıca Unicode ile de hâlâ ifade edilemeyen karakterler var
Mağara resimleri, niyeti aktarmada metinden daha başarılıdır
Future Text Publishing serisine bakınca,
“metin” özünde iki boyutlu bir resimdir
Bilgisayarlar metni anlamaz; sadece sayıları işler
O sayılara anlam yükleyip semboller ve dil sistemleri kuran insanlardır
DNA/RNA da fiziksel olarak kurulmuş evrensel bir yazı sistemi örneği olarak görülebilir
Bu yazı daha önce de HN’de defalarca paylaşılmıştı
2014, 2015 ve 2021’de de her seferinde yüzlerce yorum almıştı
2014 sürümü, 2015 sürümü, 2021 sürümü