3 puan yazan GN⁺ 2023-11-21 | 2 yorum | WhatsApp'ta paylaş

Veri görselleştirmede iyi ve kötü örnekler

  • Veri görselleştirme üzerine görüşler içeren bir deneme; iyi görselleştirmelerle kötü görselleştirmelere dair örnekler ve açıklamalar içeriyor.

Ortalamaları ayırmak için çubuk grafik yapmayın

  • Ortalama ayrım grafikleri bilimsel yayınlarda sık görülür; ancak dağılımı ve standart sapması benzer iki grubun gerçekten aynı olup olmadığını göstermek için çubuk grafikler uygun değildir.
  • Çubuk grafik kullanmadan önce bazı noktaların kontrol edilmesi gerektiği vurgulanıyor.

Küçük örneklem büyüklükleri için violin plot yapmayın

  • Küçük örneklemlerde dağılım ve çeyreklikler büyük ölçüde değişebileceği için violin plot anlamlı değildir.
  • Deneyler, örneklem büyüklüğü 50 ve üzerine çıktığında dağılımın istikrar kazandığını gösteriyor.

Tek yönlü verilerde iki yönlü renk ölçeği kullanmayın

  • Tek yönlü verilerde iki yönlü renk ölçeği kullanmak veri görselleştirmede büyük bir hatadır.
  • Renk ölçekleri, anlamlı ve özel değerleri temsil etmelidir.

Çok faktörlü deney sonuçlarını çubuk grafikle göstermeyin

  • Çok faktörlü deney sonuçlarını etkili biçimde aktarmak için, faktör bazında gruplama ve ayrıştırma konusunda dikkatli bir tasarım gerekir.

Satır ve sütunları yeniden sıralamadan heatmap yapmayın

  • Heatmap, satır ve sütun sırası dikkate alınarak etkili biçimde hazırlanmalıdır.
  • Satır ve sütunlar clustering ile yeniden sıralanabilir; ancak tek yöntem bu değildir.

Aykırı değerleri kontrol etmeden heatmap yapmayın

  • Heatmap'te aykırı değerler kontrol edilmezse, bu durum verinin yorumlanmasını ciddi biçimde etkileyebilir.

Her faktör düzeyinde veri aralığını kontrol etmeyi unutmayın

  • Çok faktörlü deneylerde yanıt değişkeninin aralığı, faktör düzeyine göre büyük ölçüde değişebilir.

Farklı düzenleri denemeden ağ grafiği yapmayın

  • Ağ grafiğinin görünümü, etkinliğini belirleyen önemli bir unsurdur.
  • Düzen değişiklikleri, ağ grafiğinin yorumlanmasını kolaylaştırabilir.

Konum temelli görselleştirme ile uzunluk temelli görselleştirmeyi karıştırmayın

  • Konum temelli görselleştirme ile uzunluk temelli görselleştirmeyi karıştırmak yanlış anlamalara yol açabilir.
  • Çubuk grafikte 0 tabanını kullanmamak veri görselleştirmede büyük bir hatadır.

Pasta grafik yapmayın

  • Pasta grafikler, insanların açı ve alan okumakta çok başarılı olmaması nedeniyle eleştirilir.
  • Veriyi uzunlukla ifade etmek istiyorsanız, donut chart'ı açıp yığılmış çubuk grafiğe dönüştürmek daha iyidir.

Eşmerkezli donut chart yapmayın

  • Eşmerkezli donut chart'lar, dış halkadaki yay uzunluğu iç halkaya göre çok daha büyük olduğu için veriyi yanlış temsil edebilir.
  • Basit ve etkili bir alternatif, donut chart'ı açıp yığılmış çubuk grafik oluşturmaktır.

Kırmızı/yeşil ve gökkuşağı renk ölçekleri kullanmayın

  • Kırmızı-yeşil renk körlüğü dikkate alınarak, renk körlüğü dostu ve gri tonlamada da bilgiyi iyi koruyan renk ölçekleri kullanılmalıdır.

Yığılmış çubuk grafiği yeniden sıralamayı unutmayın

  • Çok sayıda örnek ve sınıf olduğunda, yığılmış çubuk grafiğin sırası optimize edilerek daha etkili hale getirilmelidir.

GN⁺ görüşü

Bu yazıdaki en önemli nokta, veri görselleştirme sırasında sık yapılan hatalar ve bunlardan nasıl kaçınılacağı konusunda farkındalığı artırmasıdır. Veri görselleştirme, karmaşık bilgileri anlaşılır şekilde aktarmak için güçlü bir araçtır; ancak yanlış kullanıldığında yanlış anlamalara yol açabilir. Yazı, veriyi doğru ve net biçimde aktarmak isteyen herkes için ilgi çekici ve faydalı bir rehber sunuyor.

2 yorum

 
xguru 2023-11-21

Yazı başlığı oldukça eğlenceli. Orijinal yazıya bakarsanız örnek grafik de birlikte yer alıyor, bu yüzden incelemesi daha kolay.

 
GN⁺ 2023-11-21
Hacker News görüşleri
  • Bazı grafiklerin, veri noktası eksikliğini veya şüpheli dağılımları gizlemek için kasıtlı olarak seçilebileceğini belirten bir görüş.
  • Heatmap’lerde aykırı değerlerin en yüksek seviyeye ayarlanmaması, video oyunu istatistik görselleştirmelerinde yaygın bir sorundur ve gerçek sıcaklık problemlerini teşhis etmede çoğu zaman neredeyse işe yaramaz.
  • Bir grafiğin eksenlerinin 0’dan başlamaması mutlaka yanıltıcı olduğu anlamına gelmez; bu tür iddialar karşısında yaşadığı hayal kırıklığını paylaşan bir görüş.
  • Veri görselleştirmesinde sık görülen hatalara dair iyi bir genel bakış olduğu, iş arkadaşlarıyla paylaşmak istediği yönündeki görüşle birlikte insan algısı üzerine araştırmalara dayanan kaynak önerileri.
  • Veri görselleştirmesi için ek bir başvuru kaynağı olarak Edward Tufte’un 1983’te yayımlanan "The Visual Display of Quantitative Information" kitabının önerilmesi.
  • Veri görselleştirmesindeki birçok dersin yeni olmadığı ve 1939’da yayımlanan Willard C. Brinton’ın "Graphic presentation" eserine bakılmasını öneren bir görüş.
  • Tek yönlü verilerde iki yönlü color scale kullanılmamasını tavsiye eden "Arkadaşlar arkadaşlarının iki yönlü color scale kullanmasına izin vermez" öğüdü.
  • Violin plot’lara yönelik olumsuz bir görüşle birlikte, violin plot’ların var olmaması gerektiğini savunan bir video bağlantısının paylaşılması.
  • İnsanların veriyi nasıl gördüğüne dair araştırmalara dayanan çeşitli fikirleri bir araya getiren "How Humans See Data" başlıklı konuşmanın tanıtılması.
  • Veri türlerini sınıflandırıp her türe en uygun grafik/çizelge stilini nasıl seçeceğini açıklayan bir rehbere değinilmesi ve bu rehberi yer imlerine eklememiş olmaktan duyulan pişmanlığı ifade eden bir görüş.