Anasayfa » Tüm Yazılar » Sahte Korelasyon Nedir?

Sahte Korelasyon Nedir?

malumatfurusorg
merdiven grafik

Korelasyon – Nedensellik Farkı

Değişkenler arasında aynı ya da ters yöne karşılıklı bir ilişkinin bulunması korelasyon (correlation) olarak adlandırılmaktadır. İki değişken arasındaki değişim aynı yönlü ise pozitif korelasyon, aksi durum gözlemlenmesi halinde negatif korelasyon söz konusudur. İki değişken arasında bir ilinti bulunmaması halinde ise sıfır korelasyon gözlemlenir.

Bağımsız değişkenler arasındaki ilişkinin kuvveti ve yönü korelasyon katsayısı ile ölçülebilir. Korelasyon katsayısı -1 ve +1 arasında bir değer alır. Bu katsayının pozitif değer alması aynı yönlü doğrusal ilişkiyi, negatif değer alması ise ters yönlü bir doğrusal ilişkiyi belirtir.

Nedensellik ise -adından da anlaşılacağı üzere- bir değişkenin diğer bir değişkeni etkilemesi anlamına gelmektedir. Bir değişkenin geçmiş değerlerinin diğer değişkenin nedeni olması ile nedensellik oluşur.

Korelasyon, nedensellik anlamına gelmez. İki değişken arasında bir örüntü oluşması birinin sebep diğerinin sonuç olduğuna ve birinin diğerine neden olduğuna emare değildir. Korelasyon, neden-sonuç ilişkisinden ötürü oluşabileceği gibi başka bir faktörün etkisi ile bu ilişki oluşmuş olabilir.

Yaz aylarında denizde boğulan kişi sayısındaki artış ile dondurma tüketimindeki artış arasında bir bağıntı görülebilir. Ancak, bu durum gerçek bir nedensellik bağı içermez. İki bağımsız arasında sahte (saklı) bir ilinti bulunabilir. Dondurma satışları ile denizde boğulan kişi sayısı arasındaki ilişki sahte korelasyon örneği. İki değişkeni etkileyen üçüncü etken “hava sıcaklığı”dır.

Korelasyon, nedensellik anlamına gelmese de sebep-sonuç ilişkisi tespiti adına daha fazla inceleme için bir emaredir.

 

korelasyon nedir

 

Sahte Korelasyon Nedir?

Aralarında nedensel bir ilişki bulunmayan ya da üçüncü bir etkenden etkilenmeleri nedeniyle aralarında yapay bir ilişki gözlemlenen değişkenler söz konusu olduğunda “sahte korelasyon” (“spurious correlation“) gözlemlenir. Bu durum, “yanıltıcı korelasyon” ya da “aldatıcı korelasyon” olarak da tanımlanabilir.

Sahte korelasyon iki değişken hatalı şekilde birbiriyle ilişkilendirilmesiyle oluşur. Bir bağımlı değişken yanlış bir bağımsız değişkenle ilişkilendirildiğinde sahte korelasyon gözlemlenebilir.

Bağımsız iki değişken arasındaki ilişkiyi yansıtan korelasyon katsayısı, sahte korelasyon içeren değişkenlerde yüksek çıkabilir. İki serinin hareketlerindeki ilişki güçlü olsa da, yani korelasyon katsayısı güçlü olsa da bu durum nedensellik bağını işaret etmeyebilir.

Ekşi Sözlük’te aldatıcı korelasyon şu şekilde basitçe açıklanmıştı:

“a ve b arasında bir korelasyon vardır, amma ve lakin bu korelasyon a ve b’nin ilişkili olmasından, aralarında neden-sonuç durumları olmasından değil üçüncü bir faktörden kaynaklanmaktadır. c olarak nitelendirebileceğimiz bu faktör hem a’yla hem b’yle ilişkilidir. normalde ufak olması gereken a ve b arasındaki korelasyon da c ile olan yakın münasebetlerinden ileri gelmektedir.”

Unutulmamalı ki zaman serisi bir veri setidir, her daim bağıntı denklemi oluşturmaz.

 

sahte korelasyon

 

Sahte Korelasyon Örnekleri

Aldatıcı korelasyon hakkında çarpıcı ve yerinde örnekler sunan bir internet sitesinden alıntılar sunalım…

ABD’nin bilim, uzay ve teknoloji harcamaları ile intihar sayıları grafiğe döküldüğünde aralarında bir ilişki olduğu algısı oluşabilir. Ancak bu ilişki de sahte korelasyon örneğidir.

 

savunma harcaması intihar

 

Nicholas Cage’in rol aldığı film sayısı ile havuzda boğulan insan sayısının bağıntılı bir görünüm sergilemesi, iki verinin birbiriyle ilişkiye sahip olduğu anlamına gelmez.

 

nicholas cage boğulma sayısı

 

Ya da Kişi başına düşen mozarella peyniri tüketimi ile inşaat mühendisliği doktorası sayısı…

 

mozarella doktora

 

Ya da (Maine eyaletindeki) kişi başına margarin harcaması ile boşanma oranları ilişkisi…

 

boşanma oranı margarin satışı

 

Ülkelerin dondurma tüketimi ile OECD PISA sınav sonuçları grafiğe döküldüğünde, aralarında bir ilişki bulunduğu görünümü oluşsa da, aslında bu veriler arasında “sahte korelasyon” bulunmaktadır. Daha fazla dondurma tüketiminin daha yüksek PISA skoru sağlaması (ya da tam tersi) beklenemez.

 

dondurma tüketimi pisa sonuçları

 

Öğrencilerin ev ödevlerine harcadıkları ortalama zaman ile başarıları arasında pozitif korelasyon olduğu düşünülür. Ancak, OECD çalışmasına göre ülkeler arasında bu yönde bir korelasyon gözlemlenmemektedir. Japonya’da ödev için harcanan zaman ile başarı artarken, Türkiye’de düşmektedir.

 

OECD'nin ödev yükü - öğrenci başarısı ilişkisine dair grafiği

Sahte korelasyonlar doğru olmayan analizler yapılmasına yol açabilir. Bu nedenle, grafikler/veriler yorumlanırken sahte korelasyonun bulunma olasılığı göz önünde bulundurulmalı (Nedensellik tespiti için istatistikî/ekonometrik yöntemlere başvurulabilir).

Sahte korelasyon örneği içeren bir köşe yazısı ile sonlandıralım.

Hürriyet’teki “Bazı AK Partililer ve yakınları torpille Çin aşısı oluyormuş” başlıklı 12 Aralık 2020 tarihli yazısında Ahmet Hakan, Türk edebiyatı ile Türk futbolu arasında absürt bir bağlantı kurmuştu:

TÜRK EDEBİYATI TÜRK FUTBOLU 
TÜRK futbolu çöküşte falan değil. Resmen ve alenen çökmüş durumda. 
* 
Türk edebiyatı da taciz iddiaları nedeniyle zangır zangır çöküyor. 
* 
Ve hükmümü açıklıyorum: 
* 
Türk edebiyatı ile Türk futbolu arasında başarı grafiği açısından her zaman doğrudan bir bağ olmuştur.

türk edebiyatı türk futbolu

 

Bu yazılara da göz atabilirsiniz

Yazı İçeriğiyle İlgili Yorum Yapmak İsterseniz Buyrunuz