- Bilgisayarlı görmenin temellerini, görüntü işleme ve makine öğrenimi perspektifinden ele alan; başlangıç ve orta seviye okurlar için bir kitap
- Temel kavramlara odaklanmak için her bölüm kısa ve net biçimde yapılandırılmıştır
- Derin öğrenme devrimi sonrasında yaşanan değişimleri ve klasik fikirlerin yeniden nasıl şekillendiğini, kitabın yazım deneyimiyle birlikte açıklar
- 15 bölümde görüntü işleme, sinir ağları, üretici modeller, dizi işleme, sahne anlama gibi bilgisayarlı görmenin genelindeki konuları ele alır
- Güncel araştırma eğilimleri ya da belirli uygulamalardan çok, temel teori ve sezgi geliştirmeye odaklanan bir yapıya sahiptir
Önsöz
- Tüm piksellere adanmıştır
Bu kitap hakkında
- Bu kitap, bilgisayarlı görmenin temel konularını görüntü işleme ve makine öğrenimi bakış açısından ele alır
- Okurun sezgisini geliştirmek için çeşitli görselleştirme materyalleri içerir
- Başlıca hedef kitle, bilgisayarlı görmeye yeni başlayan lisans ve yüksek lisans öğrencileri olsa da, deneyimli uygulayıcılar için de yararlıdır
- Başlangıçta kapsamlı bir içerik hedeflenmiş olsa da, bilgisayarlı görme alanının çok geniş olması nedeniyle her bölüm 5 sayfayı geçmeyecek şekilde sınırlandırılarak temel kavramlara odaklanılmıştır
- Kısa bir kitap yazma hedefi olmasına rağmen sonunda hacmin büyüdüğünü dürüstçe paylaşır
Kitabın yazım süreci
- Yazıma başlarken sahip olunan niyet ile gerçek sürecin doğrusal olmayan yapısını verilerle gösterir ve tamamlanmasının 10 yıldan fazla sürdüğünü belirtir
- Yazım sürecinde derin öğrenme devrimi (2012) gerçekleşmiş, geleneksel yöntemlerle modern yaklaşımlar arasında bir bütünleşme süreci yaşanmıştır
- Derin öğrenmenin ilk popülerliği nedeniyle önceki fikirler bir süre geri planda kalsa da, zamanla özsel kavramlar yeniden öne çıkmıştır
- Yazım yolculuğu zorlu olsa da, çeşitli örnekler ve deneyleri bizzat yaparak çok şey öğrendiğini ifade eder
- Bilgisayarlı görme ve yapay zeka alanındaki önemli olayların, kitabın yazım dönemiyle birlikte nasıl değiştiğini görsel olarak gösterir
Kitabın yapısı
- Bilgisayarlı görme alanı son 10 yılda hızlı bir gelişim yaşamış olsa da, bugünkü yaklaşımlar geçmişten tamamen kopukmuş gibi görünse bile tarihsel süreklilik vurgulanır
- Kitap boyunca birleşik temalar ve bakış açıları ile farklı perspektiflerin önemi tekrar tekrar ele alınır
- Kitap 15 bölümden oluşur ve her bölüm bilgisayarlı görmenin tutarlı bir temasına odaklanır
Bölümlerin tanıtımı
- Part I: Bilgisayarlı görme problemlerine yönelik motivasyon, toplumsal bağlam ve matematiksel temellerin tanıtımı
- Part II: Görüntü oluşum süreci
- Part III: Görüntü örnekleri üzerinden makine öğreniminin temel kavramlarının açıklanması
- Part IV: Sinyal ve görüntü işlemeye giriş
- Part V: Yararlı doğrusal filtreler (Gauss çekirdeği, ikili filtre, görüntü türevleri, Laplasyen, zaman filtreleri) ve uygulamaları
- Part VI: Çok ölçekli görüntü gösterimleri
- Part VII: Bilgisayarlı görme için sinir ağları (evrişimli sinir ağları, yinelenen sinir ağları, transformer'lar)
- Part VIII: Görüntülerin istatistiksel modelleri ve grafik modeller
- Part IX: Üretici modeller ve temsili öğrenmeye (vektör gömmeleri vb.) odaklanan modern yaklaşımlar
- Part X: Öğrenme tabanlı görme sistemleri kurarken ortaya çıkan zorluklar
- Part XI: 3D yapı yeniden oluşturma için geometrik araçlar
- Part XII: Dizi işleme ve hareket ölçümü
- Part XIII: Sahne anlama ve nesne tespiti
- Part XIV: Genç araştırmacılar için sunum, makale yazımı ve etkili araştırma zihniyetine dair öneriler
- Part XV: Part I’de sunulan problemlerin, kitapta ele alınan çeşitli yöntemlerle çözülmeye çalışılması
Ele alınmayan içerikler
- Bilgisayarlı görmedeki en güncel eğilimler veya çeşitli pratik uygulama alanları (şekil analizi, nesne takibi, hareket analizi, yüz tanıma vb.) ele alınmaz
- Bu tür ayrıntılı uygulamalar için konferans makaleleri ya da uzmanlaşmış kitaplara başvurmak daha etkilidir
Teşekkür
- Bilgisayarlı görme eğitimi ve araştırmasına katkıda bulunan çeşitli öğretim üyeleri, öğrenciler ve meslektaşlara teşekkür edilir
- Farklı konferanslardaki ders materyalleri, deneyler, bölüm bazlı destek, kapak tasarımı gibi çeşitli katkılar için özel teşekkürler sunulur
- Her yazar, ailesine ve yakın çevresine de sürekli destekleri için teşekkür eder
Atıf bilgisi
- Kitaba atıf yaparken kullanılabilecek BibTeX biçimi sunulur
Eğitmenler için kaynaklar
- Kitabın basılı sürümü MIT Press üzerinden satın alınabilir
- Kitapla bağlantılı ders slaytları çevrimiçi olarak sunulur
Kaynakça
- Bilgisayarlı görme, makine öğrenimi, sinyal işleme, geometri, görme bilimi gibi ilgili alanlarda önemli klasik ve güncel kitapların listesi verilir
1 yorum
Hacker News yorumları
"On Research, Writing and Speaking" adlı kitapta ilginç bir bölüm var. "Bu zor görünüyor." Evet. Artık sadece zeki olmak yetmiyor. Lisansüstü eğitimde çok çalışanlar öne geçiyor diye bir görüş paylaşılmış
Son 2 yıldaki teknolojik değişim nedeniyle, makine öğrenmesi ve özellikle bilgisayarlı görü alanındaki mevcut klasik içeriğin hâlâ geçerli olup olmadığına dair sektörde çalışan birinden yorum istenmiş
Hâlâ son derece geçerli. En yeni yöntemler de temelde aynı yapı taşlarının üzerine kurulu gelişmeler. Hatta temel kavramları ve geleneksel algoritmaları daha fazla okumak daha da faydalı. Hough transform, canny edge, sift, Harris corner gibi klasik teknikleri iyi bilmek, gerçek bir uzman olmanın parçası. Sadece popüler teknoloji anahtar kelimelerini ezberleyip API birleştiren geliştiricilerden ayrışan beceri farkı burada ortaya çıkıyor
GPU hızlandırmasının zor olduğu sistemlerde hâlâ "klasik" bilgisayarlı görü yöntemleri vazgeçilmez. Ben kaynakları kısıtlı ortamlarda Simultaneous localization and mapping problemleri çözen bir uygulayıcıyım. Structure from Motion bölümünü kesinlikle okuyacağım
"Writing this book" kısmı, sanki LLM kitabın taslağının 2/3’ünü yazmış gibi anlaşılabiliyor. Aslında kastedilenin, LLM yüzünden yazılacak çok şey çıktığı için kitabın büyümesi olduğu anlaşılsın diye daha açık yazılması gerektiği söylenmiş
Bilgisayarlı görü alanında bir başka iyi kitap olarak aşağıdaki eser önerilmiş
Bu kitabın ücretsiz yayımlanmış olmasının inanılmaz olduğu söylenerek büyük övgü yapılmış
Kesinlikle doğru. Acaba bunu PDF olarak indirmenin bir yolunu bulan oldu mu diye merak ediyorum. Çalışırken kişisel notlar ve referans materyaller bırakabilmenin çok gerekli olduğunu düşünüyorum
Makine öğrenmesi, bilgisayarlı görü ve robotik topluluklarında ders kitaplarını ücretsiz olarak çevrimiçi yayımlama kültürü gerçekten etkileyici. Bu alanlardaki en üst düzey kaynaklara bile internetten ücretsiz erişilebiliyor. Başka alanlarda ABD’li profesörler en güncel baskının satın alınmasını isteyip yüksek maliyet çıkarabiliyor; ama burada en iyi materyaller, gelişmekte olan ülkelerdeki insanlar da dahil olmak üzere dünyanın her yerinden herkese açılıyor. Ders materyalleri ve videolar da çoğu zaman birlikte paylaşılıyor
Machine vision hakkında iyi kitap önerisi istenmiş. Etkili machine vision’ın, hatta bilgisayarlı görünün özünde kamera, optik ve aydınlatma seçiminin yattığı düşünülüyor. Girdi görüntüsünün kalitesi iyi değilse çıktının da kötü olmasının kaçınılmaz olduğu söyleniyor