ISBN'nin Tuzağı

(rygoldstein.com)

8 puan yazan GN⁺ 2026-02-21 | 4 yorum | WhatsApp'ta paylaş

Letterboxd gibi sade ve kullanışlı bir kitap kayıt uygulaması yapma girişiminde, ISBN sisteminin yapısal sorunları temel engel oldu
Kitap arama özelliği için kullanılan Google Books API'nin aynı eserin farklı ISBN sürümlerini ayrı kayıtlar olarak döndürdüğü fark edildi
Bunun nedeni, bibliyografik yapı (FRBR modeli) içinde 'eser (work)', 'ifade (expression)' ve 'tezahür (manifestation)' ayrımının bulunması; bu yüzden kullanıcı sadece 'bir kitabı okudum' bilgisini kaydetmek istese bile veri fazlasıyla parçalanmış durumda
OpenLibrary 'eser' merkezli bir veri yapısı sunsa da, hâlâ tekrarlar ve eksiklikler içerdiği için tam bir alternatif olamıyor
Film veritabanı TMDB'de olduğu gibi, kitap alanında yüksek kaliteli açık metadata altyapısı bulunmuyor; bu da kitap odaklı sosyal platform geliştirmede başlıca engellerden biri

Letterboxd ile kitap platformlarının karşılaştırması

Letterboxd, sade arayüzü ve rahatsız etmeyen sosyal özellikleri sayesinde film izleme kayıtlarını kolayca yönetmeyi sağlıyor
- Kullanıcılar izledikleri filmi ve zamanı basitçe kaydedebiliyor
Buna karşılık GoodReads, karmaşık arayüzü ve çok adımlı tıklama yapısı nedeniyle kitap kaydını zorlaştırıyor
- 'Okunan kitaplar' ile 'okunacak kitaplar' aynı ekranda karışıyor; okuma challenge'ları, bültenler ve diğer ek unsurlar da alan kaplıyor
- GoodReads'in bu kadar kullanışsız olmasının nedeni, Amazon'un kitap satış işinin düşük öncelikli bir yan ürünü olması
Storygraph da benzer sorunlar taşıyor; bu yüzden kullanıcı sonunda kişisel kayıtlarını Obsidian dosyalarıyla tutmaya yöneliyor

Google Books API ve ISBN sorunu

Kitap arama özelliğini oluşturmak için Google Books API kullanıldı, ancak aynı eserin farklı ISBN'lerle yinelenerek arandığı görüldü
- Örneğin “The Last Unicorn” arandığında ciltli, karton kapaklı, e-kitap, gözden geçirilmiş baskı gibi sürümler ayrı ISBN'lerle dönüyor
Her ISBN farklı bir formatı ya da baskıyı ifade etse de, kullanıcı aslında sadece 'bu kitabı okudum' bilgisini kaydetmek istiyor
Bu yapı, arama ve veri bütünleştirmeyi zorlaştırdığı için tekil eser düzeyinde bir kayıt sistemi kurmaya uygun değil

FRBR modeli ve 'eser' düzeyinde yaklaşım

Kütüphanecilikte kullanılan FRBR modeli, kitap verisini dört katmana ayırıyor
- Work (eser): Soyut yaratımın kendisi (ör. roman "The Last Unicorn")
- Expression (ifade): Belirli bir sürüm
- Manifestation (tezahür): O sürümün belirli fiziksel formatı (karton kapaklı, ciltli vb.)
- Item (öğe): Koleksiyondaki tekil fiziksel nesne
Google Books çoğunlukla 'ifade' veya 'tezahür' düzeyindeki verileri döndürüyor, oysa kullanıcıların ihtiyaç duyduğu şey 'eser' düzeyindeki soyut birim
OpenLibrary 'eser' merkezli bir veri yapısı sağlasa da, hâlâ yinelenen kayıtlar bulunuyor
- Örneğin Yoko Ogawa'nın Hotel Iris kitabı arandığında aynı eser dört kez yinelenmiş görünebiliyor

Veri kalitesi ve ekosistemin sınırları

Letterboxd, The Movie Database (TMDB) temelinde çalışıyor ve TMDB yaklaşık 1 milyon film verisi barındırıyor
Buna karşılık OpenLibrary, 40 milyondan fazla eser içerse de çok sayıda eksik ve yeterince temizlenmemiş veri barındırıyor
Film verileri, ticari platformlar ile topluluk katkılarının birleşmesi sayesinde yüksek kaliteye ulaşırken, kitap verilerinde ölçek çok büyük ve finansman yetersiz
Bunun sonucu olarak, kitaplara odaklanan Letterboxd benzeri bir hizmet oluşturmak için gereken temel veri mevcut değil

Sonuç ve gelecekteki denemeler

Tam teşekküllü bir açık kaynak kitap metadata altyapısı bulunmadığı için, kitap kayıt platformu geliştirmek filmlere kıyasla çok daha zor bir problem
Yazar yine de bağımsız bir kitap kayıt sistemi kurmayı denemeyi sürdürecek
Film zevkini keşfetme deneyimine benzer biçimde, kitap kaydında da kişiselleştirilmiş bir yaklaşım gerekli

4 yorum

nemorize 2026-02-21

Sonuçta... ISBN, içeriğin değil yayının tanımlayıcısı...
Başlık tam bir clickbait olmuş lol

roxie 2026-02-27

İçeriğin tanımlayıcı kısmı boş görünüyor sanırım :(

yeobi222 2026-02-22

ISBN sisteminin, sistematik sınıflandırmayı pek de gözetmemesi de aslında bir gerçek...
Kurallar gereği her yeni baskıya ayrı bir numara verilmesi gerekiyor ama en alt kategori yayınevi olunca, eser bazlı sınıflandırma ihtiyacına rağmen yönetimi kolay olmuyor.

GN⁺ 2026-02-21

Hacker News yorumları

MusicBrainz'in veritabanı yapısını hatırlatıyor
Örneğin Nirvana'nın Nevermind albümü tek bir release group olarak ele alınıyor; kaset, CD, LP, promosyon gibi farklı mecralarda ya da ülkelere göre yeniden basım sürümleri bulunuyor
Bazı durumlarda katalog numarası ya da barkod farklı olduğu için ayırt edilebiliyor, bazı durumlarda ise aynı kod yazsa bile gerçekte farklı sürümler olabiliyor
Aynı kayıt bile remastering, kurgu ya da sansür gibi nedenlerle farklılaşabiliyor
MusicBrainz bu tür farkları ayrıntılı biçimde takip ediyor ve aynı kayıt olup olmadığını açıkça ayırıyor
Cover şarkılar veya standart eserler gibi birden çok sanatçının kaydettiği durumlarda ise besteci ve söz yazarı bilgilerini 'work' düzeyinde bağlıyor
Bu tür ince düşünülmüş ilişkisel veritabanı tasarımının, yaratıcı eserlerde aynılık ve farklılığı kaydetmede çok faydalı olduğunu düşünüyorum
İlgili bağlantı
- Son dönemde kitaplar için BookBrainz adlı bir veritabanı da alfa sürümünde işletiliyor
  bookbrainz.org/about
  Eğer MusicBrainz'e benzer bir şeması varsa veri çıkarmanın çok kolay olmasını bekliyorum
- Bach'ın çift keman konçertosu CD'sini MusicBrainz'e kaydetmeye çalışırken CD-ID indeksleme hatası yaşamıştım
  Hesap açıp veriyi doğrudan yükledim ve birkaç düzeltmeden sonra kaydı tamamlamayı başardım
  Çin'deki bir web sitesinde aynı Avustralya baskısı CD'nin bilgisini bulup referans aldım; bunun sayesinde pazara göre ince farklılıklar taşıyan sürümler olduğunu fark ettim
  İnsanların 'benzersiz tanımlayıcıları' güncelleme konusunda ne kadar gevşek davrandığı açısından MusicBrainz ekibiyle güçlü bir empati kuruyorum
- 10000 Maniacs'ın In My Tribe albümü buna iyi bir örnek
  1987 baskısı ile 1989 baskısının ('Peace Train' çıkarılmış sürüm) UPC numarası aynıydı
  90'ların ortasında ikinci el CD dükkânlarında kaldırılmadan önceki sürümü bulmak için uğraştığımı hatırlıyorum
- Yakın zamanda CD barkodlarını taradım; MusicBrainz bunların %90~95'ini tanıdı
  Geri kalanlarda bölgeye göre parça sayısı değişen birden fazla sürüm vardı ve bu kafa karıştırıcıydı
  Parça bazında sanatçı bilgisini belirtebilen bir özellik olsaydı arama doğruluğu daha yüksek olurdu gibi geliyor
- Kindle Press üzerinden yayımlanan bir kitap söz konusu olduğunda, ISBN aynı olmasına rağmen en az 3 resmi revize sürüm ve çeşitli küçük düzeltme sürümleri bulunuyor
  Yalnızca yazım hatası düzeyindeki farklar bile ayırt etmeyi zorlaştırıyor
Wikidata, FRBR uyumlu açık bir veritabanı ve son birkaç yılda kitaplarla ilgili kalitesi ciddi biçimde arttı
Örnek verilen Yoko Ogawa'nın Hotel Iris'i aynı eser değil, birbirinden farklı çeviriler
Çeviri, özgün eserden farklı bir türev eser olarak görülmeli
Ancak listeler birbirine karıştığı için hata çok
- FRBR'de çeviriler de genel olarak aynı eser (work) kabul edilir
  OpenLibrary bunları tek bir work altında toplar ve dil ile çevirmen bilgisini edition içinde saklar
  Mevcut tekrarlar büyük olasılıkla dillere göre yapılan otomatik birleştirme sürecinde ortaya çıkan bir sorun
- Çeviriyi ayrı bir türev olarak görseniz bile, aramada tek bir varlık altında gruplanması gerekir
  Kullanıcının özgün metin ile çevirileri birlikte gezebilmesi ideal olur
LibraryThing'i öneriyorum
Bana göre Goodreads'ten çok daha iyi
Kitaplarda WEMI yapısını (work, expression, manifestation, item) ayırmak önemli
"Don Kişot'u okudum" demek work düzeyinde bir ifade, "Benim kitabımda kahve lekesi var" demek ise item düzeyinde bir ifade
Eyalet düzeyindeki bir okuma yarışmasında kitaplar yalnızca ISBN ile yönetiliyordu ve bu yüzden öğrencilerin bulması zordu
Bu nedenle WorldCat'in ISBN eşleme veritabanını kullanarak aynı içeriğe sahip farklı ISBN'leri bağlayan bir SQL join ekledim
Sonuçta 10 yıl içinde öğrenciler ek olarak bir milyondan fazla kitap okudu
- SQL sorgusunu merak eden bir soru da geldi
Anna’s Archive, ISBN ile ilgili verilerin toparlanmasına büyük katkı sağlıyor
WorldCat'i scrape ederek kullandı ve şu anda ISSN (süreli yayınlar) veritabanını da kuruyor
ISSN tarafı kitaplara kıyasla çok daha yetersiz durumda
Open Library'nin, Brewster Kahle (Internet Archive'ın kurucusu) ile Aaron Swartz'ın ilk çalışmalarından doğduğunu hatırlatıyor
İlgili blog
Gerçek bir kitapçıda kitabı görüp satın aldım, sonra eve gelince aynı baskıya zaten sahip olduğumu fark ettiğim durumlar sık oldu
Koleksiyonumda ISBN ile arama yapabilseydim bu tür mükerrer satın alımların önüne geçebilirdim
- Yalnızca e-kitaplardan oluşan, bine yakın kitabım var; hangi kitaplara sahip olduğumu net biçimde bildiğim için böyle bir şey yaşamıyorum diyen bir yanıt var
Kişisel bir projede ISBNDB API kullanarak bir kitap yönetim sitesi yapmıştım
Başlığa göre arama yapınca sayısız baskı, dil ve cilt türü birbirine karışıyor ve sonuçlar çok karmaşık hale geliyordu
Sonuçları Jaccard benzerliğine göre düzenledim ama kusursuz değildi
OpenLibrary'yi alternatif olarak değerlendiriyorum
StoryGraph uygulaması fena değil gibi geliyor
Yapay zeka özelliklerinden kaçınmak isteyen kullanıcıları gözeten arayüzü hoş
Arama işlevi de başarılı
- Hardcover.app da iyi bir alternatif
  Ben şahsen 2017'den beri kullanıyorum ve bunu oligopoliden çıkış hedefiyle seçtim
ISBN içinde yayıncı tanımlayıcısı bulunur; bu yüzden aynı kitap pazara göre farklı ISBN'lere sahip olabilir
- Yeni Zelanda'da ISBN'ler devletin kütüphane hizmeti üzerinden veriliyor ve yayıncı adını kaydettirmeniz gerekiyor
  Ücretsiz bir hizmet, dolayısıyla ülkeye göre değişebilir
- ISBN'ler yayıncılar veya şirketler tarafından blok halinde satın alınır ve içeride farklı imprint'lere atanır
  Bu yüzden yayıncı adı doğrudan yer almasa da, yapısı gereği tanımlama mümkündür