Inspirasi

Analisis regresi berganda: Definisi, rumus, dan kegunaan

Dalam statistik, regresi linier adalah cara untuk menguji hubungan antara dua variabel. Jika pekerjaan Anda melibatkan penggunaan statistik dalam operasi sehari-hari, belajar tentang regresi linier kemungkinan akan berdampak positif pada hasil profesional Anda. Mengetahui apa itu regresi linier dan untuk apa menggunakannya dapat menjadi langkah karir yang baik, tetapi itu membutuhkan penelitian dan latihan. Pada artikel ini, kita membahas apa itu regresi linier, aplikasi utamanya, persamaan regresi linier, outlier dalam regresi linier dan memberikan contoh regresi linier.

Apa itu regresi linier?

Regresi linier adalah metode untuk menemukan hubungan linier antar variabel. Ini biasanya digunakan ketika mencoba menentukan nilai variabel berdasarkan nilai variabel lain. Variabel yang diketahui disebut variabel bebas atau penjelas, sedangkan variabel yang ingin diprediksi disebut variabel terikat atau respon.

Ada dua jenis utama regresi linier:

  • Regresi linier sederhana: menggunakan satu variabel independen untuk mencoba memprediksi hasil dari variabel dependen
  • Regresi linier berganda: menggunakan dua atau lebih variabel independen untuk mencoba memprediksi hasil dari variabel dependen

Saat melakukan regresi linier sederhana, Anda membuat asumsi tertentu tentang data yang tersedia. Mereka:

  • Homogenitas varians: ukuran kesalahan yang diprediksi tidak berbeda secara signifikan di semua nilai variabel independen
  • Independensi pengamatan: semua pengamatan dalam kumpulan data dikumpulkan melalui metode pengambilan sampel yang valid secara statistik, tanpa hubungan tersembunyi di antara keduanya
  • Normalitas: ada distribusi data yang normal
  • Hubungan linier antar variabel: regresi linier mengasumsikan ada hubungan linier antara variabel bebas dan variabel terikat, artinya garis yang melalui titik-titik data adalah lurus

Aplikasi untuk regresi linier

Regresi linier digunakan di berbagai bidang dan memiliki banyak kegunaan praktis. Ini terutama digunakan dalam dua cara:

  • Jika tujuan penggunaannya adalah memprediksi evolusi variabel atau mengurangi margin kesalahan, biasanya digunakan untuk membandingkan model prediktif dengan kumpulan data yang diamati yang berisi nilai respons dan variabel penjelas. Jika, setelah membuat model, nilai variabel penjelas tambahan ditentukan tanpa nilai respons yang sesuai, model prediktif biasanya digunakan untuk membuat prediksi.
  • Jika tujuan penggunaan regresi linier adalah untuk menunjukkan variasi dalam variabel respons yang mungkin disebabkan oleh variasi dalam variabel penjelas, maka dapat dianalisis untuk menentukan kekuatan hubungan antara variabel penjelas dan variabel respons. Ini sering digunakan sedemikian rupa untuk menentukan apakah beberapa variabel penjelas dan respons tidak memiliki hubungan linier satu sama lain.

Bidang yang paling banyak menggunakan regresi linier adalah:

  • Statistik: berasal dari statistik dan digunakan dalam pemodelan statistik untuk menunjukkan hubungan antara variabel dependen dan independen dari berbagai kumpulan data
  • Pembelajaran mesin: bidang yang relatif baru ini juga menggunakan regresi linier, terutama untuk pemodelan prediktif, dengan tujuan akhir membatasi margin kesalahan model sebanyak mungkin
  • Keuangan: profesional keuangan menganalisis hubungan linier antara harga komoditas dan harga saham dalam bisnis yang menangani komoditas masing-masing
  • Penjualan: profesional penjualan menganalisis hubungan antara variabel yang berbeda dalam upaya untuk memprediksi penjualan di masa depan

Persamaan regresi linier

Persamaan untuk regresi linier sederhana adalah:

Y = a + bX + u

Persamaan untuk regresi linier berganda adalah:

Y = a + b1 x 1 + b2 x 2 + b3 x 3 + … + b + u

Di mana:

Y = variabel dependen (atau respons)

X = variabel independen (atau penjelas)

b = kemiringan (atau kecuraman garis grafik)

a = mencegat (atau di mana garis memotong sumbu)

u = residual regresi (atau jarak vertikal antara titik data dan garis regresi)

Apa teknik regresi kuadrat terkecil?

Teknik regresi kuadrat terkecil adalah jenis analisis regresi yang bertujuan untuk menentukan garis yang paling cocok untuk suatu kumpulan data, yang mengacu pada garis yang melewati sebaran titik-titik data yang paling baik menunjukkan hubungan antara titik-titik tersebut. Ini biasanya digunakan dalam analisis regresi linier untuk menentukan persamaan geometrik untuk masing-masing garis. Analisis regresi sederhana menghasilkan garis lurus, sedangkan regresi dengan banyak variabel dapat menghasilkan garis lengkung.

Pencilan dalam regresi linier

Pencilan statistik adalah titik data yang berbeda secara signifikan dari pengamatan lainnya. Mereka mungkin disebabkan oleh variabilitas abnormal dalam kumpulan data, tetapi juga dapat menunjukkan bahwa kesalahan terjadi di suatu tempat dalam perhitungan. Mereka dapat secara signifikan mempengaruhi hasil, jadi menentukan asal mereka dengan benar sangat penting untuk akurasi regresi.

Dua cara utama untuk mendeteksi outlier ketika mengembangkan model regresi linier adalah:

  • Jarak Mahalanobis: Ini terdiri dari pengukuran jarak antara titik yang dipilih (P) dan distribusi (D). Hal ini bertujuan untuk mengukur jarak antara P dan mean D, dihitung dalam jumlah standar deviasi.
  • Leverage: Sering digunakan dalam analisis regresi, leverage adalah cara untuk mengukur jarak antara nilai variabel independen suatu observasi dan observasi lainnya.

Contoh regresi linier

Perhatikan contoh regresi linier sederhana ini:

Anda dapat menggunakan regresi linier untuk menentukan hubungan antara usia mobil tertentu dan proyeksi harga jualnya. Sebagai aturan umum, harga mobil secara bertahap menurun seiring bertambahnya usia, yang berarti ada hubungan negatif antara harga mobil (Y) dan usianya (X). Dengan menganalisis hubungan antara usia mobil dan harganya di tahun-tahun sebelumnya, kita dapat membuat model dan memprediksi bagaimana harga akan berubah di tahun-tahun mendatang.

Related Articles

Back to top button