2 puan yazan GN⁺ 2024-05-15 | 1 yorum | WhatsApp'ta paylaş

Sir, there's a cat in your mirror dimension

  • Daha önce frekans alanı hakkında konuşmuştum.

    • Gündelik sinyalleri, onları oluşturan dalga biçimlerinin genliklerine dönüştüren bir tekniktir.
    • En yaygın temel, frekansı giderek artan sinüs dalgalarıdır.
    • Bunun dışında pek çok başka dalga biçimi de farklı frekans alanları oluşturabilir.
  • Frekans alanı dönüşümünün iki önemli özelliği vardır:

    • Tersinirlik: Frekans görüntüsünden özgün veri geri yüklenebilir.
    • Girdi-çıktı simetrisi: Aynı matematiksel işlem kullanılarak her iki yönde de dönüşüm yapılabilir.
  • Pratikte bu ayrım önemlidir.

    • Özellikle sıkıştırmada önem taşır.
    • Bir görüntüyü frekans alanına dönüştürüp yüksek frekans bileşenlerinin hassasiyetini azaltırsanız veri miktarı düşer.
    • Ortaya çıkan görüntü yine de görsel olarak aynı görünür.

MS Paint'i son teknoloji bir sıkıştırma aracı olarak kullanmak

  • Frekans alanındaki görüntü, dağılmış bir gürültü gibi görünür.

    • Bunun büyük kısmı görsel olarak önemli değildir.
    • Dönüşüm, işlevsel olarak eşdeğer iki boyut arasında gidip gelen bir kaldıraçtır.
    • Bu ayna boyutunu bir yuva gibi kullanıp bazı verileri oraya taşımanın mümkün olup olmayacağını merak ettim.
  • Bunu test etmek için bir kedi fotoğrafı aldım ve ayrık kosinüs dönüşümü (DCT) ile frekans alanı biçimini hesapladım.

    • Zamandaki kedi, frekanstaki kedi.
  • Önceki örnekteki kadın fotoğrafını kullanıp ayna boyutundaki "kedi gürültüsü" desenini üzerine bindirdim ve opaklığını düşürdüm.

    • Zamandaki kadın ve frekanstaki kedi.
  • Birleştirme işlemi kaçınılmaz olarak kayıplıdır.

    • Teoride birleşik görüntünün DCT'sini alıp frekans alanı gösterimini hesaplarsanız, kadın fotoğrafı düzgün bir gürültüye ayrışmalıdır.
    • Enjekte edilen "kedi gürültüsü" ise tanınabilir bir kedi görüntüsü hâlinde toplanmalıdır.
  • Uygulamada da gerçekten böyle oluyor.

    • Frekanstaki kedi ve zamandaki kadın.
  • Kendiniz görmek isterseniz birleşik görüntüyü indirip MATLAB'da şunları çalıştırabilirsiniz:

    woman = imread("woman-with-cat.png");  
    colormap('gray');  
    imagesc(woman, [0 255]);  
    pause(1);  
    cat = dct2(woman);  
    imagesc(imgaussfilt(cat, 1), [-4 4]);  
    
  • İlginç olan şu ki kedi, ana belgenin yeniden boyutlandırılmasından da sağ çıkıyor.

    • Yukarı ölçekleme görüntüyü döşüyor.
    • Aşağı ölçekleme görüntüyü kırpıyor.
  • Kayıplı sıkıştırmanın kediyi ne kadar bozacağını merak ettim.

    • Beklediğimden daha az etkiledi.
    • JPEG kalite ayarı yüksek olduğunda görüntü oldukça iyi görünüyor.
    • Kalite ayarı düştükçe sağ alt çeyrek ciddi biçimde nicemleniyor.
    • Frekans alanında görülen JPEG sıkıştırma karmaşası.
  • Bu görselleştirme, JPEG algoritmasının ne kadar çok bilgiyi yok ettiğini gösteriyor.

    • Bunun çoğunu fark etmiyoruz.
  • Ses spektrogramlarının gizli mesaj olarak kullanıldığı daha önce birçok örnek vardı.

    • JPEG DCT katsayılarını kullanan metin steganografisi üzerine de tartışmalar mevcut.
    • Buradaki amaç, bu tekniğin özellikle faydalı olduğunu söylemek değil; frekans alanı ile zaman alanının eğlenceli biçimde bağlantılı olduğunu vurgulamak.

GN⁺ görüşü

  1. Frekans alanı dönüşümünü anlamak: Frekans alanı dönüşümü, veri sıkıştırma ve sinyal işlemede önemli bir rol oynar. Bunu anlamak, görüntü ve ses verilerini daha verimli işlemeyi sağlar.
  2. MATLAB kullanımı: MATLAB, veri analizi ve görselleştirme için güçlü bir araçtır. Bu yazı üzerinden MATLAB'ın pratik bir kullanım örneğini görebilirsiniz.
  3. JPEG sıkıştırmasının sınırları: JPEG sıkıştırmasının sınırlarını görsel olarak anlamak mümkündür. Bu, görüntü kalitesini korurken dosya boyutunu küçültmenin yollarını bulmaya yardımcı olur.
  4. Steganografi: Frekans alanını kullanan steganografi, veri güvenliğiyle ilgili ilgi çekici bir konudur. Gizli mesajların nasıl iletilebileceğini gösterir.
  5. Teknolojinin eğlenceli uygulamaları: Bu yazı, teknolojinin eğlenceli ve yaratıcı biçimlerde nasıl uygulanabileceğini gösteriyor. Bu da teknolojiye olan ilgiyi artırıp yeni fikirler doğurabilir.

1 yorum

 
GN⁺ 2024-05-15
Hacker News görüşü

Hacker News yorumlarının derlenmiş özeti

  • Fotoğrafın konusu ve spektral enerji:

    • Çoğu fotoğrafta tanınabilir konu, spektral enerjinin orijine (sol üst) yoğunlaşmasıyla ilişkilidir.
    • Fotoğrafın konusu genellikle çerçevenin merkezinde yer alır; bu da uzamsal ve frekans alanı verileri arasındaki girişimi en aza indirir.
  • Dijital watermarking temelleri:

    • Bu teknik, görüntü veya ses gibi sinyaller için dayanıklı dijital watermarking'in temelini oluşturur.
    • Başlıca uygulama, sinyal yoğun biçimde işlense bile telif haklı materyali tespit etmektir.
  • Fourier dönüşümünün zaman-frekans ikiliği:

    • Fourier dönüşümünün matematiksel ilkesi, dönüşümün yönünden bağımsız olarak aynı şekilde çalışır.
    • Kedinin frekans grafiği kadının uzamsal grafiğine yerleştirilirse, kadının Fourier dönüşümü kediyi ortaya çıkarır.
  • Sürecin doğrulanması talebi:

    • Fotoğraf çekiliyor, kedi frekans alanına dönüştürülüyor ve ardından bu veri kadının görsel görüntüsüne birleştiriliyor.
    • Birleştirilmiş görüntüye yeniden DCT uygulanınca kedi ortaya çıkıyor.
  • Steganografi uygulaması:

    • Yasadışı görüntüleri gizlemek için ilginç bir steganografi uygulaması.
    • Frekans alanına dönüştürülüp başka bir görüntüye birleştirilirse, yalnızca bunu nasıl tersine çevireceğini bilen kişiler görüntüyü görebilir.
  • Aphex Twin'in ses spektrogramı numarası:

    • Aphex Twin'in bir parçanın ses spektrogramında garip bir yüzü görünür hâle getirdiği eğlenceli numaraya benziyor.
  • DCT'de konumun önemi:

    • Kedi sol üste daha fazla yoğunlaşmış olsaydı, bu demo muhtemelen iyi çalışmazdı.
    • DCT'de yüksek frekans bileşenleri fazla olduğundan, kediyi sol üste koymak onun görünmez olmasına yol açabilirdi.
  • Görüntü sıkıştırmasını anlama:

    • Frekans alanının görüntü sıkıştırmada kullanılabildiği fark ediliyor.
    • Çoğu görüntü sıkıştırma algoritmasının, frekans alanının daha sakin kısımlarını kaldırarak çalışıp çalışmadığı merak ediliyor.
  • DCT'nin belirli yöntemi:

    • Görünüşe göre DCT, JPEG'deki 8x8 döşemelerden farklı bir yöntemle uygulanmış.
    • Bu durumda 2D DCT temel fonksiyonları kullanılmamış gibi görünüyor.
  • Müzik ve görüntü kodlama:

    • Aphex Twin ve Venetian Snares'in sese görüntü kodlamasına benzer bir durum.
    • Belirli araçlar kullanılırsa frekansların kedi görüntüsünü oluşturduğu görülebilir.