6 puan yazan GN⁺ 2025-06-16 | 1 yorum | WhatsApp'ta paylaş
  • Bilgisayarlı görmenin temellerini, görüntü işleme ve makine öğrenimi perspektifinden ele alan; başlangıç ve orta seviye okurlar için bir kitap
  • Temel kavramlara odaklanmak için her bölüm kısa ve net biçimde yapılandırılmıştır
  • Derin öğrenme devrimi sonrasında yaşanan değişimleri ve klasik fikirlerin yeniden nasıl şekillendiğini, kitabın yazım deneyimiyle birlikte açıklar
  • 15 bölümde görüntü işleme, sinir ağları, üretici modeller, dizi işleme, sahne anlama gibi bilgisayarlı görmenin genelindeki konuları ele alır
  • Güncel araştırma eğilimleri ya da belirli uygulamalardan çok, temel teori ve sezgi geliştirmeye odaklanan bir yapıya sahiptir

Önsöz

  • Tüm piksellere adanmıştır

Bu kitap hakkında

  • Bu kitap, bilgisayarlı görmenin temel konularını görüntü işleme ve makine öğrenimi bakış açısından ele alır
  • Okurun sezgisini geliştirmek için çeşitli görselleştirme materyalleri içerir
  • Başlıca hedef kitle, bilgisayarlı görmeye yeni başlayan lisans ve yüksek lisans öğrencileri olsa da, deneyimli uygulayıcılar için de yararlıdır
  • Başlangıçta kapsamlı bir içerik hedeflenmiş olsa da, bilgisayarlı görme alanının çok geniş olması nedeniyle her bölüm 5 sayfayı geçmeyecek şekilde sınırlandırılarak temel kavramlara odaklanılmıştır
  • Kısa bir kitap yazma hedefi olmasına rağmen sonunda hacmin büyüdüğünü dürüstçe paylaşır

Kitabın yazım süreci

  • Yazıma başlarken sahip olunan niyet ile gerçek sürecin doğrusal olmayan yapısını verilerle gösterir ve tamamlanmasının 10 yıldan fazla sürdüğünü belirtir
  • Yazım sürecinde derin öğrenme devrimi (2012) gerçekleşmiş, geleneksel yöntemlerle modern yaklaşımlar arasında bir bütünleşme süreci yaşanmıştır
  • Derin öğrenmenin ilk popülerliği nedeniyle önceki fikirler bir süre geri planda kalsa da, zamanla özsel kavramlar yeniden öne çıkmıştır
  • Yazım yolculuğu zorlu olsa da, çeşitli örnekler ve deneyleri bizzat yaparak çok şey öğrendiğini ifade eder
  • Bilgisayarlı görme ve yapay zeka alanındaki önemli olayların, kitabın yazım dönemiyle birlikte nasıl değiştiğini görsel olarak gösterir

Kitabın yapısı

  • Bilgisayarlı görme alanı son 10 yılda hızlı bir gelişim yaşamış olsa da, bugünkü yaklaşımlar geçmişten tamamen kopukmuş gibi görünse bile tarihsel süreklilik vurgulanır
  • Kitap boyunca birleşik temalar ve bakış açıları ile farklı perspektiflerin önemi tekrar tekrar ele alınır
  • Kitap 15 bölümden oluşur ve her bölüm bilgisayarlı görmenin tutarlı bir temasına odaklanır

Bölümlerin tanıtımı

  • Part I: Bilgisayarlı görme problemlerine yönelik motivasyon, toplumsal bağlam ve matematiksel temellerin tanıtımı
  • Part II: Görüntü oluşum süreci
  • Part III: Görüntü örnekleri üzerinden makine öğreniminin temel kavramlarının açıklanması
  • Part IV: Sinyal ve görüntü işlemeye giriş
  • Part V: Yararlı doğrusal filtreler (Gauss çekirdeği, ikili filtre, görüntü türevleri, Laplasyen, zaman filtreleri) ve uygulamaları
  • Part VI: Çok ölçekli görüntü gösterimleri
  • Part VII: Bilgisayarlı görme için sinir ağları (evrişimli sinir ağları, yinelenen sinir ağları, transformer'lar)
  • Part VIII: Görüntülerin istatistiksel modelleri ve grafik modeller
  • Part IX: Üretici modeller ve temsili öğrenmeye (vektör gömmeleri vb.) odaklanan modern yaklaşımlar
  • Part X: Öğrenme tabanlı görme sistemleri kurarken ortaya çıkan zorluklar
  • Part XI: 3D yapı yeniden oluşturma için geometrik araçlar
  • Part XII: Dizi işleme ve hareket ölçümü
  • Part XIII: Sahne anlama ve nesne tespiti
  • Part XIV: Genç araştırmacılar için sunum, makale yazımı ve etkili araştırma zihniyetine dair öneriler
  • Part XV: Part I’de sunulan problemlerin, kitapta ele alınan çeşitli yöntemlerle çözülmeye çalışılması

Ele alınmayan içerikler

  • Bilgisayarlı görmedeki en güncel eğilimler veya çeşitli pratik uygulama alanları (şekil analizi, nesne takibi, hareket analizi, yüz tanıma vb.) ele alınmaz
  • Bu tür ayrıntılı uygulamalar için konferans makaleleri ya da uzmanlaşmış kitaplara başvurmak daha etkilidir

Teşekkür

  • Bilgisayarlı görme eğitimi ve araştırmasına katkıda bulunan çeşitli öğretim üyeleri, öğrenciler ve meslektaşlara teşekkür edilir
  • Farklı konferanslardaki ders materyalleri, deneyler, bölüm bazlı destek, kapak tasarımı gibi çeşitli katkılar için özel teşekkürler sunulur
  • Her yazar, ailesine ve yakın çevresine de sürekli destekleri için teşekkür eder

Atıf bilgisi

  • Kitaba atıf yaparken kullanılabilecek BibTeX biçimi sunulur

Eğitmenler için kaynaklar

  • Kitabın basılı sürümü MIT Press üzerinden satın alınabilir
  • Kitapla bağlantılı ders slaytları çevrimiçi olarak sunulur

Kaynakça

  • Bilgisayarlı görme, makine öğrenimi, sinyal işleme, geometri, görme bilimi gibi ilgili alanlarda önemli klasik ve güncel kitapların listesi verilir

1 yorum

 
GN⁺ 2025-06-16
Hacker News yorumları
  • "On Research, Writing and Speaking" adlı kitapta ilginç bir bölüm var. "Bu zor görünüyor." Evet. Artık sadece zeki olmak yetmiyor. Lisansüstü eğitimde çok çalışanlar öne geçiyor diye bir görüş paylaşılmış

    • Gerçekten çok içgörülü bir yorum. Bir noktadan sonra herkes yalnızca bilginin yeterli olmadığını fark ediyor. Birçok kişi üniversiteye giderken böyle bir duvarla karşılaşıyor. Ama üniversitede öğrenme kapsamı belli olduğu için bir şekilde yetenekle idare edilebiliyor. Doktora sürecinde ise öğrenilecek şeylerin sınırı yok. Belirlenmiş bir okuma listesi ya da “sınav kapsamı dışında” diye bir şey yok. Çalışma, deney yapma, makale okuma gibi konularda yapabildiğin kadar sınırsız ilerlemen gerekiyor. Sadece zeki olmakla bitmiyor; sosyal beceriler, ağ kurma ve topluluk bağlamını anlama da gerekiyor. Topluluktaki insanlarla toplantı yapmak, yemek yemek, network kurmak ve iletişimi sürdürmek önemli. Kendi kendini motive edip son teslim tarihlerini ve rutinini yönetmen gerekiyor. Resmî derslerin ve sınavların verdiği motivasyondan farklı olarak, burada her şeyi kendin yönetmelisin. Ölçütler belirsiz, beklentiler ise sınırsız. Öncekinden farklı olarak reddedilme deneyimleri de yaşayabilirsin. Doktora, hemen herkes için sınırlarını zorlayan zorlu bir dönem. Amaç sadece mezun olmaksa bir şekilde geçiştirilebilir; fakat genelde akademik kariyer hayali kuran öğrenciler daha büyük hedefler taşıyor
  • Son 2 yıldaki teknolojik değişim nedeniyle, makine öğrenmesi ve özellikle bilgisayarlı görü alanındaki mevcut klasik içeriğin hâlâ geçerli olup olmadığına dair sektörde çalışan birinden yorum istenmiş

    • Hâlâ son derece geçerli. En yeni yöntemler de temelde aynı yapı taşlarının üzerine kurulu gelişmeler. Hatta temel kavramları ve geleneksel algoritmaları daha fazla okumak daha da faydalı. Hough transform, canny edge, sift, Harris corner gibi klasik teknikleri iyi bilmek, gerçek bir uzman olmanın parçası. Sadece popüler teknoloji anahtar kelimelerini ezberleyip API birleştiren geliştiricilerden ayrışan beceri farkı burada ortaya çıkıyor

    • GPU hızlandırmasının zor olduğu sistemlerde hâlâ "klasik" bilgisayarlı görü yöntemleri vazgeçilmez. Ben kaynakları kısıtlı ortamlarda Simultaneous localization and mapping problemleri çözen bir uygulayıcıyım. Structure from Motion bölümünü kesinlikle okuyacağım

  • "Writing this book" kısmı, sanki LLM kitabın taslağının 2/3’ünü yazmış gibi anlaşılabiliyor. Aslında kastedilenin, LLM yüzünden yazılacak çok şey çıktığı için kitabın büyümesi olduğu anlaşılsın diye daha açık yazılması gerektiği söylenmiş

    • Ben öyle okumadım. Aslında kitabın 1/3’ünden azı ChatGPT çıktıktan sonra yazılmış gibi görünüyor. Daha çok, ML/AI alanındaki önemli olayların grafikte işaretlenmiş olması gibi duruyor
  • Bilgisayarlı görü alanında bir başka iyi kitap olarak aşağıdaki eser önerilmiş

    Computer Vision, Fifth Edition
    E.R. Davies
    Academic Press
    ISBN-13 978-0128092842
    
    • Bir diğer önemli ders kitabı olarak Szeliski’nin "Computer Vision 2nd Ed" (2022) kitabı da öneriliyor https://szeliski.org/Book/. Forsyth & Ponce kitabı da iyi ama biraz eski. 3D ile ilgileniyorsan Hartley & Zisserman’ın Multiple View Geometry kitabı hâlâ klasik kabul ediliyor
  • Bu kitabın ücretsiz yayımlanmış olmasının inanılmaz olduğu söylenerek büyük övgü yapılmış

    • Kesinlikle doğru. Acaba bunu PDF olarak indirmenin bir yolunu bulan oldu mu diye merak ediyorum. Çalışırken kişisel notlar ve referans materyaller bırakabilmenin çok gerekli olduğunu düşünüyorum

    • Makine öğrenmesi, bilgisayarlı görü ve robotik topluluklarında ders kitaplarını ücretsiz olarak çevrimiçi yayımlama kültürü gerçekten etkileyici. Bu alanlardaki en üst düzey kaynaklara bile internetten ücretsiz erişilebiliyor. Başka alanlarda ABD’li profesörler en güncel baskının satın alınmasını isteyip yüksek maliyet çıkarabiliyor; ama burada en iyi materyaller, gelişmekte olan ülkelerdeki insanlar da dahil olmak üzere dünyanın her yerinden herkese açılıyor. Ders materyalleri ve videolar da çoğu zaman birlikte paylaşılıyor

  • Machine vision hakkında iyi kitap önerisi istenmiş. Etkili machine vision’ın, hatta bilgisayarlı görünün özünde kamera, optik ve aydınlatma seçiminin yattığı düşünülüyor. Girdi görüntüsünün kalitesi iyi değilse çıktının da kötü olmasının kaçınılmaz olduğu söyleniyor

    • Bu tür unsurların gerçekten fark yarattığı örnekleri ya da kullanım senaryolarını paylaşabilecek biri var mı diye sorulmuş