Senin, 02 Januari 2023

Korelasi Pearson

Apa itu Korelasi Pearson?

Korelasi Pearson bivariat menghasilkan koefisien korelasi sampel, r , yang mengukur kekuatan dan arah hubungan linier antara pasangan variabel kontinu. Dengan ekstensi, Korelasi Pearson mengevaluasi apakah ada bukti statistik untuk hubungan linier antara pasangan variabel yang sama dalam populasi, diwakili oleh koefisien korelasi populasi, ρ ("rho"). Korelasi Pearson adalah ukuran parametrik.

Ukuran ini juga dikenal sebagai:

  • korelasi Pearson
  • Korelasi momen-produk Pearson (PPMC)

Penggunaan Umum Korelasi Pearson

Korelasi Pearson bivariat umumnya digunakan untuk mengukur hal-hal berikut:

  • Korelasi antar pasangan variabel
  • Korelasi di dalam dan di antara kumpulan variabel

Korelasi Pearson bivariat menunjukkan hal berikut:

  • Apakah ada hubungan linier yang signifikan secara statistik antara dua variabel kontinu
  • Mencari tahu kekuatan hubungan linier (yaitu, seberapa dekat hubungan tersebut menjadi garis lurus sempurna)
  • Mencari tahu arah hubungan linear (naik atau turun)

Catatan: Korelasi Pearson bivariat tidak dapat mengatasi hubungan non-linear atau hubungan antar variabel kategori. Jika Anda ingin memahami hubungan yang melibatkan variabel kategori dan/atau hubungan non-linear, Anda perlu memilih ukuran asosiasi yang lain.

Catatan: Korelasi Pearson bivariat hanya mengungkap hubungan antar variabel kontinu. Korelasi Pearson bivariat tidak memberikan kesimpulan apa pun tentang sebab-akibat, tidak peduli seberapa besar koefisien korelasinya.

Syarat Data untuk Korelasi Pearson

Untuk menggunakan korelasi Pearson, data Anda harus memenuhi persyaratan berikut:

  1. Dua atau lebih variabel kontinu (yaitu interval atau tingkat rasio).
  2. Kasus harus memiliki nilai yang tidak hilang pada kedua variabel.
  3. Hubungan linier antar variabel.
  4. Kasus independen (yaitu, independensi pengamatan)
    • Tidak ada hubungan antara nilai variabel antar kasus. Ini berarti bahwa:
      • nilai untuk semua variabel di seluruh kasus tidak berhubungan.
      • untuk kasus apa pun, nilai variabel apa pun tidak dapat memengaruhi nilai variabel apa pun untuk kasus lain tidak ada kasus yang dapat memengaruhi kasus lain pada variabel apa pun
      • Koefisien korelasi Pearson biviariat dan uji signifikansi yang sesuai tidak kuat ketika independensi dilanggar.
  5. Normalitas bivariat
    • Setiap pasangan variabel bivariat berdistribusi normal
    • Setiap pasangan variabel secara bivariat terdistribusi secara normal di semua tingkat variabel lainnya
    • Asumsi ini memastikan bahwa variabel terkait secara linear; pelanggaran asumsi ini dapat menunjukkan bahwa hubungan non-linear antara variabel ada. Linearitas dapat dinilai secara visual menggunakan sebar data.
  6. Sampel acak data dari populasi.
  7. Tidak ada outlier

Hipotesis Korelasi Pearson

Hipotesis nol ( 0 ) dan hipotesis alternatif ( ​​1 ) dari uji signifikansi untuk korelasi dapat dinyatakan dengan cara berikut, tergantung pada apakah uji satu sisi atau dua sisi diminta:

Uji signifikansi dua sisi:

0 : ρ  = 0 ("koefisien korelasi populasi adalah 0; tidak ada asosiasi")
1 : ρ ≠ 0 ("koefisien korelasi populasi bukan 0; korelasi bukan nol dapat terjadi")

Uji signifikansi satu sisi:

0 : ρ  = 0 ("koefisien korelasi populasi adalah 0; tidak ada hubungan")
1 : ρ   > 0 ("koefisien korelasi populasi lebih besar dari 0; korelasi positif dapat terjadi")
     ATAU
1 : ρ   < 0 ("koefisien korelasi populasi kurang dari 0; korelasi negatif bisa ada")

di mana ρ adalah koefisien korelasi populasi.