Lompat ke isi

Korelasi: Perbedaan antara revisi

Dari Wikipedia bahasa Indonesia, ensiklopedia bebas
Konten dihapus Konten ditambahkan
Borgxbot (bicara | kontrib)
k Robot: Cosmetic changes
Baris 1: Baris 1:
Dalam [[teori probabilitas]] dan [[statistika]], '''korelasi''', juga disebut '''koefisien korelasi''', adalah nilai yang menunjukkan kekuatan dan arah hubungan linier antara dua [[peubah acak]] (''random variable'').
Dalam [[teori probabilitas]] dan [[statistika]], '''korelasi''', juga disebut '''koefisien korelasi''', adalah nilai yang menunjukkan kekuatan dan arah hubungan linier antara dua [[peubah acak]] (''random variable'').


{| border="1" cellpadding="5" cellspacing="0" align="center"
{| border="1" cellpadding="5" cellspacing="0" align="center"
Baris 6: Baris 6:
| Korelasi tinggi || Tinggi || Rendah || Rendah || Tanpa korelasi || Tak ada korelasi (acak) || Tanpa korelasi || Rendah || Rendah || Tinggi || Korelasi tinggi
| Korelasi tinggi || Tinggi || Rendah || Rendah || Tanpa korelasi || Tak ada korelasi (acak) || Tanpa korelasi || Rendah || Rendah || Tinggi || Korelasi tinggi
|-
|-
| &minus;1 || < &minus;0.9 || > &minus;0.9 || < &minus;0.4 || > &minus;0.4 || 0 || < +0.4 || > +0.4 || < +0.9 || > +0.9 || +1
| −1 || < −0.9 || > −0.9 || < −0.4 || > −0.4 || 0 || < +0.4 || > +0.4 || < +0.9 || > +0.9 || +1
|-
|-
|}
|}
Baris 12: Baris 12:
Salah satu jenis korelasi yang paling populer adalah [[koefisien korelasi momen-produk Pearson]], yang diperoleh dengan membagi [[kovarians]] kedua variabel dengan perkalian [[simpangan baku]]nya. Meski memiliki nama ''Pearson'', metode ini pertama kali diperkenalkan oleh [[Francis Galton]].
Salah satu jenis korelasi yang paling populer adalah [[koefisien korelasi momen-produk Pearson]], yang diperoleh dengan membagi [[kovarians]] kedua variabel dengan perkalian [[simpangan baku]]nya. Meski memiliki nama ''Pearson'', metode ini pertama kali diperkenalkan oleh [[Francis Galton]].


==Koefisien korelasi momen-produk Pearson==
== Koefisien korelasi momen-produk Pearson ==


=== Sifat-sifat matematis ===
=== Sifat-sifat matematis ===
[[Image:Korelasi.png|thumb|350px|Korelasi linier antara 1000 pasang pengamatan. Data digambarkan pada bagian kiri bawah dan koefisien korelasinya ditunjukkan pada bagian kanan atas. Setiap titik pengamatan berkorelasi maksimum dengan dirinya sendiri, sebagaimana ditunjukkan pada diagonal (seluruh korelasi = +1).]]
[[Berkas:Korelasi.png|thumb|350px|Korelasi linier antara 1000 pasang pengamatan. Data digambarkan pada bagian kiri bawah dan koefisien korelasinya ditunjukkan pada bagian kanan atas. Setiap titik pengamatan berkorelasi maksimum dengan dirinya sendiri, sebagaimana ditunjukkan pada diagonal (seluruh korelasi = +1).]]
Korelasi &rho;<sub>''X, Y''</sub> antara dua [[peubah acak]] ''X'' dan ''Y'' dengan nilai yang diharapkan &mu;<sub>''X''</sub> dan &mu;<sub>''Y''</sub> dan [[simpangan baku]] &sigma;<sub>''X''</sub> dan &sigma;<sub>''Y''</sub> didefinisikan sebagai:
Korelasi ρ<sub>''X, Y''</sub> antara dua [[peubah acak]] ''X'' dan ''Y'' dengan nilai yang diharapkan μ<sub>''X''</sub> dan μ<sub>''Y''</sub> dan [[simpangan baku]] σ<sub>''X''</sub> dan σ<sub>''Y''</sub> didefinisikan sebagai:


:<math>
:<math>
\rho_{X,Y}={\mathrm{cov}(X,Y) \over \sigma_X \sigma_Y} ={E((X-\mu_X)(Y-\mu_Y)) \over \sigma_X\sigma_Y}.</math>
\rho_{X,Y}={\mathrm{cov}(X,Y) \over \sigma_X \sigma_Y} ={E((X-\mu_X)(Y-\mu_Y)) \over \sigma_X\sigma_Y}.</math>


Karena &mu;<sub>''X''</sub> = E(''X''),
Karena μ<sub>''X''</sub> = E(''X''),
&sigma;<sub>''X''</sub><sup>2</sup> = E(''X''<sup>2</sup>)&nbsp;&minus;&nbsp;E<sup>2</sup>(''X'') dan
σ<sub>''X''</sub><sup>2</sup> = E(''X''<sup>2</sup>)&nbsp;&nbsp;E<sup>2</sup>(''X'') dan
demikian pula untuk ''Y'', maka dapat pula ditulis
demikian pula untuk ''Y'', maka dapat pula ditulis


Baris 30: Baris 30:
Korelasi dapat dihitung bila simpangan baku finit dan keduanya tidak sama dengan nol. Dalam pembuktian [[ketidaksamaan Cauchy-Schwarz]], koefisien korelasi tak akan melebihi dari 1 dalam [[nilai absolut]]. Korelasi bernilai 1 jika terdapat hubungan linier yang positif, bernilai -1 jika terdapat hubungan linier yang negatif, dan antara -1 dan +1 yang menunjukkan tingkat [[dependensi linier]] antara dua variabel. Semakin dekat dengan -1 atau +1, semakin kuat korelasi antara kedua variabel tersebut.
Korelasi dapat dihitung bila simpangan baku finit dan keduanya tidak sama dengan nol. Dalam pembuktian [[ketidaksamaan Cauchy-Schwarz]], koefisien korelasi tak akan melebihi dari 1 dalam [[nilai absolut]]. Korelasi bernilai 1 jika terdapat hubungan linier yang positif, bernilai -1 jika terdapat hubungan linier yang negatif, dan antara -1 dan +1 yang menunjukkan tingkat [[dependensi linier]] antara dua variabel. Semakin dekat dengan -1 atau +1, semakin kuat korelasi antara kedua variabel tersebut.


Jika variabel-variabel tersebut [[variabel yang saling bebas|saling bebas]], nilai korelasi sama dengan 0. Namun tidak demikian untuk kebalikannya, karena koefisien korelasi hanya mendeteksi ''ketergantungan linier'' antara kedua variabel. Misalnya, peubah acak ''X'' berdistribusi uniform pada interval antara -1 dan +1, dan ''Y'' = ''X''<sup>2</sup>. Dengan demikian nilai ''Y'' ditentukan sepenuhnya oleh ''X'', sehingga ''
Jika variabel-variabel tersebut [[variabel yang saling bebas|saling bebas]], nilai korelasi sama dengan 0. Namun tidak demikian untuk kebalikannya, karena koefisien korelasi hanya mendeteksi ''ketergantungan linier'' antara kedua variabel. Misalnya, peubah acak ''X'' berdistribusi uniform pada interval antara -1 dan +1, dan ''Y'' = ''X''<sup>2</sup>. Dengan demikian nilai ''Y'' ditentukan sepenuhnya oleh ''X'', sehingga ''


==Koefisien korelasi non-parametrik==
== Koefisien korelasi non-parametrik ==
Koefisien korelasi Pearson merupakan [[Statistika parametrik|statistik parametrik]], dan ia kurang begitu menggambarkan korelasi bila asumsi dasar [[Distribusi normal|normalitas]] suatu data dilanggar. Metode korelasi [[Statistika non-parametrik|non-parametrik]] seperti [[Koefisien korelasi rank Spearman|&rho; Spearman]] and [[Tau Kendall|&tau; Kendall]] berguna ketika distribusi tidak normal. Koefisien korelasi non-parametrik masih kurang ''kuat'' bila dibandingkan dengan metode parametrik jika asumsi normalitas data terpenuhi, namun cenderung memberikan hasil distrosi ketika asumsi tersebut tak terpenuhi.
Koefisien korelasi Pearson merupakan [[Statistika parametrik|statistik parametrik]], dan ia kurang begitu menggambarkan korelasi bila asumsi dasar [[Distribusi normal|normalitas]] suatu data dilanggar. Metode korelasi [[Statistika non-parametrik|non-parametrik]] seperti [[Koefisien korelasi rank Spearman|ρ Spearman]] and [[Tau Kendall|τ Kendall]] berguna ketika distribusi tidak normal. Koefisien korelasi non-parametrik masih kurang ''kuat'' bila dibandingkan dengan metode parametrik jika asumsi normalitas data terpenuhi, namun cenderung memberikan hasil distrosi ketika asumsi tersebut tak terpenuhi.


==Metode pengukuran yang lain untuk mengetahui dependensi antara dua peubah acak]]==
== Metode pengukuran yang lain untuk mengetahui dependensi antara dua peubah acak]] ==
Untuk mendapatkan suatu pengukuran mengenai dependensi data (juga nonlinier), dapat digunakan [[rasio korelasi]], yang mampu mendeteksi hampir segala dependensi fungsional
Untuk mendapatkan suatu pengukuran mengenai dependensi data (juga nonlinier), dapat digunakan [[rasio korelasi]], yang mampu mendeteksi hampir segala dependensi fungsional
<!--
<!--
Baris 45: Baris 45:
Banyak orang yang keliru menganggap bahwa informasi yang diberikan dari sebuh koefisien korelasi sudah cukup mendefinisikan struktur ketergantungan (dependensi) antara peubah acak. Namun untuk mengetahui adanya ketergantungan antara peubah acak harus dipertimbangkan pula [[kopula]] antara keduanya. Koefisien korelasi dapat didefinisikan sebagai struktur ketergantungan hanya pada beberapa kasus, misalnya dalam [[fungsi distribusi kumulatif]] pada [[distribusi normal multivariat]].
Banyak orang yang keliru menganggap bahwa informasi yang diberikan dari sebuh koefisien korelasi sudah cukup mendefinisikan struktur ketergantungan (dependensi) antara peubah acak. Namun untuk mengetahui adanya ketergantungan antara peubah acak harus dipertimbangkan pula [[kopula]] antara keduanya. Koefisien korelasi dapat didefinisikan sebagai struktur ketergantungan hanya pada beberapa kasus, misalnya dalam [[fungsi distribusi kumulatif]] pada [[distribusi normal multivariat]].


==Matriks korelasi==
== Matriks korelasi ==


Matriks korelasi ''n'' peubah acak ''X''<sub>1</sub>, ..., ''X''<sub>''n''</sub> adalah ''n''&nbsp; &times; &nbsp;''n'' matrik dimana ''i'',''j'' adalah corr(''X''<sub>''i''</sub>,&nbsp;''X''<sub>''j''</sub>). Jika ukuran korelasi yang digunakan adalah koefisien momen-produk, matriks korelasi akan sama dengan [[matriks kovarians]] peubah acak yang telah distandarkan ''X''<sub>''i''</sub> /SD(''X''<sub>''i''</sub>) untuk ''i'' = 1,&nbsp;...,&nbsp;''n''. Sehingga, matriks korelasi merupakan matriks definit tak-negatif.
Matriks korelasi ''n'' peubah acak ''X''<sub>1</sub>, ..., ''X''<sub>''n''</sub> adalah ''n''&nbsp; × &nbsp;''n'' matrik dimana ''i'',''j'' adalah corr(''X''<sub>''i''</sub>,&nbsp;''X''<sub>''j''</sub>). Jika ukuran korelasi yang digunakan adalah koefisien momen-produk, matriks korelasi akan sama dengan [[matriks kovarians]] peubah acak yang telah distandarkan ''X''<sub>''i''</sub> /SD(''X''<sub>''i''</sub>) untuk ''i'' = 1,&nbsp;...,&nbsp;''n''. Sehingga, matriks korelasi merupakan matriks definit tak-negatif.


Matriks korelasi selalu simetris, yakni korelasi antara <math>X_i</math> dan <math>X_j</math> adalah sama dengan korelasi antara <math>X_j</math> and <math>X_i</math>).
Matriks korelasi selalu simetris, yakni korelasi antara <math>X_i</math> dan <math>X_j</math> adalah sama dengan korelasi antara <math>X_j</math> and <math>X_i</math>).


=="Korelasi tak selalu berarti sebab-akibat"==
== "Korelasi tak selalu berarti sebab-akibat" ==
Diktum konvensi bahwa "korelasi tak selalu berarti sebab-akibat" dibahas dalam artikel [[hubungan artifisial]] (''spurious relationship''). Lihat pula [[korelasi mengarah ke hubungan sebab-akibat (kekeliruan logis)]]. Bagaimanapun, korelasi tak diasumsukan selalu [[akausal]], meski penyebab tersebut bisa pula tidak diketahui.
Diktum konvensi bahwa "korelasi tak selalu berarti sebab-akibat" dibahas dalam artikel [[hubungan artifisial]] (''spurious relationship''). Lihat pula [[korelasi mengarah ke hubungan sebab-akibat (kekeliruan logis)]]. Bagaimanapun, korelasi tak diasumsukan selalu [[akausal]], meski penyebab tersebut bisa pula tidak diketahui.


==Menghitung korelasi secara akurat dengan metode numerik==
== Menghitung korelasi secara akurat dengan metode numerik ==
Berikut adalah algoritma (dalam pseudocode) yang akan mengestimasi korelasi dengan menggunakan metode mumerik
Berikut adalah algoritma (dalam pseudocode) yang akan mengestimasi korelasi dengan menggunakan metode mumerik


Baris 82: Baris 82:
-->
-->


==Pranala luar==
== Pranala luar ==
* [http://www.mega.nu:8080/ampp/rummel/uc.htm Understanding Correlation] - Materi pegantar
* [http://www.mega.nu:8080/ampp/rummel/uc.htm Understanding Correlation] - Materi pegantar
* [http://www.statsoft.com/textbook/stathome.html Statsoft Electronic Textbook]
* [http://www.statsoft.com/textbook/stathome.html Statsoft Electronic Textbook]
Baris 89: Baris 89:
* [http://www.analistat.com Jasa analisis statistik penelitian] - Jasa analisis statistik penelitian
* [http://www.analistat.com Jasa analisis statistik penelitian] - Jasa analisis statistik penelitian


[[Kategori: Statistika]]
[[Kategori:Statistika]]


[[cs:Korelace]]
[[cs:Korelace]]

Revisi per 14 Februari 2008 02.03

Dalam teori probabilitas dan statistika, korelasi, juga disebut koefisien korelasi, adalah nilai yang menunjukkan kekuatan dan arah hubungan linier antara dua peubah acak (random variable).

Koefisien korelasi
Korelasi tinggi Tinggi Rendah Rendah Tanpa korelasi Tak ada korelasi (acak) Tanpa korelasi Rendah Rendah Tinggi Korelasi tinggi
−1 < −0.9 > −0.9 < −0.4 > −0.4 0 < +0.4 > +0.4 < +0.9 > +0.9 +1

Salah satu jenis korelasi yang paling populer adalah koefisien korelasi momen-produk Pearson, yang diperoleh dengan membagi kovarians kedua variabel dengan perkalian simpangan bakunya. Meski memiliki nama Pearson, metode ini pertama kali diperkenalkan oleh Francis Galton.

Koefisien korelasi momen-produk Pearson

Sifat-sifat matematis

Korelasi linier antara 1000 pasang pengamatan. Data digambarkan pada bagian kiri bawah dan koefisien korelasinya ditunjukkan pada bagian kanan atas. Setiap titik pengamatan berkorelasi maksimum dengan dirinya sendiri, sebagaimana ditunjukkan pada diagonal (seluruh korelasi = +1).

Korelasi ρX, Y antara dua peubah acak X dan Y dengan nilai yang diharapkan μX dan μY dan simpangan baku σX dan σY didefinisikan sebagai:

Karena μX = E(X), σX2 = E(X2) − E2(X) dan demikian pula untuk Y, maka dapat pula ditulis


Korelasi dapat dihitung bila simpangan baku finit dan keduanya tidak sama dengan nol. Dalam pembuktian ketidaksamaan Cauchy-Schwarz, koefisien korelasi tak akan melebihi dari 1 dalam nilai absolut. Korelasi bernilai 1 jika terdapat hubungan linier yang positif, bernilai -1 jika terdapat hubungan linier yang negatif, dan antara -1 dan +1 yang menunjukkan tingkat dependensi linier antara dua variabel. Semakin dekat dengan -1 atau +1, semakin kuat korelasi antara kedua variabel tersebut.

Jika variabel-variabel tersebut saling bebas, nilai korelasi sama dengan 0. Namun tidak demikian untuk kebalikannya, karena koefisien korelasi hanya mendeteksi ketergantungan linier antara kedua variabel. Misalnya, peubah acak X berdistribusi uniform pada interval antara -1 dan +1, dan Y = X2. Dengan demikian nilai Y ditentukan sepenuhnya oleh X, sehingga

Koefisien korelasi non-parametrik

Koefisien korelasi Pearson merupakan statistik parametrik, dan ia kurang begitu menggambarkan korelasi bila asumsi dasar normalitas suatu data dilanggar. Metode korelasi non-parametrik seperti ρ Spearman and τ Kendall berguna ketika distribusi tidak normal. Koefisien korelasi non-parametrik masih kurang kuat bila dibandingkan dengan metode parametrik jika asumsi normalitas data terpenuhi, namun cenderung memberikan hasil distrosi ketika asumsi tersebut tak terpenuhi.

Metode pengukuran yang lain untuk mengetahui dependensi antara dua peubah acak]]

Untuk mendapatkan suatu pengukuran mengenai dependensi data (juga nonlinier), dapat digunakan rasio korelasi, yang mampu mendeteksi hampir segala dependensi fungsional

Kopula dan korelasi

Banyak orang yang keliru menganggap bahwa informasi yang diberikan dari sebuh koefisien korelasi sudah cukup mendefinisikan struktur ketergantungan (dependensi) antara peubah acak. Namun untuk mengetahui adanya ketergantungan antara peubah acak harus dipertimbangkan pula kopula antara keduanya. Koefisien korelasi dapat didefinisikan sebagai struktur ketergantungan hanya pada beberapa kasus, misalnya dalam fungsi distribusi kumulatif pada distribusi normal multivariat.

Matriks korelasi

Matriks korelasi n peubah acak X1, ..., Xn adalah n  ×  n matrik dimana i,j adalah corr(XiXj). Jika ukuran korelasi yang digunakan adalah koefisien momen-produk, matriks korelasi akan sama dengan matriks kovarians peubah acak yang telah distandarkan Xi /SD(Xi) untuk i = 1, ..., n. Sehingga, matriks korelasi merupakan matriks definit tak-negatif.

Matriks korelasi selalu simetris, yakni korelasi antara dan adalah sama dengan korelasi antara and ).

"Korelasi tak selalu berarti sebab-akibat"

Diktum konvensi bahwa "korelasi tak selalu berarti sebab-akibat" dibahas dalam artikel hubungan artifisial (spurious relationship). Lihat pula korelasi mengarah ke hubungan sebab-akibat (kekeliruan logis). Bagaimanapun, korelasi tak diasumsukan selalu akausal, meski penyebab tersebut bisa pula tidak diketahui.

Menghitung korelasi secara akurat dengan metode numerik

Berikut adalah algoritma (dalam pseudocode) yang akan mengestimasi korelasi dengan menggunakan metode mumerik

sum_sq_x = 0
sum_sq_y = 0
sum_coproduct = 0
mean_x = x[1]
mean_y = y[1]
last_x = x[1]
last_y = y[1]
for i in 2 to N:
    sweep = (i - 1.0) / i
    delta_x = x[i] - mean_x
    delta_y = y[i] - mean_y
    sum_sq_x += delta_x * delta_x * sweep
    sum_sq_y += delta_y * delta_y * sweep
    sum_coproduct += delta_x * delta_y * sweep
    mean_x += delta_x / i
    mean_y += delta_y / i 
pop_sd_x = sqrt( sum_sq_x / N )
pop_sd_y = sqrt( sum_sq_y / N )
cov_x_y = sum_coproduct / N
correlation = cov_x_y / (pop_sd_x * pop_sd_y)


Pranala luar