Apa itu P value?
Ketika Anda menguji suatu hipotesis, Anda dapat menggunakan p value untuk menentukan signifikansi statistik dari pengujian Anda. Jika itu secara statistik signifikan, itu berarti hasil pengujian Anda lebih mungkin valid dan bukan sekadar kebetulan. Asumsi bahwa tidak ada hubungan yang cukup besar antara dua variabel disebut sebagai “hipotesis nol.” Jadi, jika Anda dapat membuktikan bahwa hipotesis nol kemungkinan besar salah, maka Anda memiliki bukti bahwa hipotesis Anda kemungkinan besar benar. Untuk menentukan apakah ada bukti yang kuat untuk menolak hipotesis nol, Anda perlu memilih tingkat signifikansi yang sudah ditetapkan (biasanya: 0,10, 0,05, atau 0,01). Jika p value dari pengujian statistik Anda berada di bawah tingkat signifikansi yang dipilih, maka Anda memiliki bukti yang cukup untuk menolak hipotesis nol.
Contoh
Mari kita anggap Anda ingin mencari rata-rata usia dari sekelompok 1.000 siswa. Hipotesis Anda mungkin adalah bahwa rata-rata usia siswa adalah 19 tahun. Jadi, hipotesis nol Anda adalah bahwa rata-rata usia siswa bukan 19 tahun.
Setelah mengambil sampel dari 100 siswa, Anda menemukan bahwa rata-rata usia dari kelompok yang diambil sampel adalah 18 tahun. Kemudian, Anda memilih tingkat signifikansi sebesar 0,05 dan menghitung p value untuk membantu menguji validitas hipotesis nol Anda (bahwa usia rata-rata populasi bukan 19 tahun).
- P value < 0,05: Bukti statistik yang cukup untuk menolak hipotesis nol.
- P value ≥ 0,05: Bukti statistik yang tidak cukup dan tidak dapat menolak hipotesis nol.
P value tidak menentukan apakah hipotesis nol itu benar atau salah. Sebaliknya, p value mengindikasikan probabilitas munculnya hasil yang diamati. Pada tingkat signifikansi 0,05, Anda memiliki probabilitas 95% untuk mengamati hasil ini lagi, yang mendukung teori bahwa usia rata-rata siswa sebenarnya bukan 19 tahun.
Apa itu p value?
P value adalah p valuerobabilitas yang digunakan untuk menguji secara statistik kemungkinan suatu peristiwa (misalnya, harga rata-rata yang pelanggan saya bersedia bayar untuk sepatu adalah $20). Salah satu cara untuk melakukan pengujian hipotesis adalah dengan “bermain setan”: membuat proposisi yang berlawanan (misalnya, harga rata-rata yang pelanggan saya bersedia bayar untuk sepatu bukan $20) dan memeriksa apakah Anda dapat menolak ide tersebut.
Hipotesis nol adalah keyakinan bahwa tidak ada hubungan yang signifikan antara dua variabel. Sementara itu, hipotesis alternatif adalah kebalikannya: ada hubungan yang signifikan antara dua variabel.
Ketika Anda siap mengumpulkan bukti untuk menolak hipotesis nol, maka Anda memiliki kasus yang lebih kuat bahwa suatu peristiwa, biasanya diungkapkan dalam hipotesis alternatif, lebih mungkin terjadi. Semua ini didukung dengan data statistik.
Menghitung P value
Anda dapat menghitung p value menggunakan tabel statistik atau perangkat lunak. Langkah kritis adalah memilih tingkat kepercayaan yang diinginkan. Para peneliti biasanya menggunakan tingkat kepercayaan 90%, 95%, atau 99% dan mengacu pada tingkat kepercayaan ini sebagai 0,10, 0,05, dan 0,01, masing-masing. Semakin tinggi tingkat kepercayaan, semakin kuat pengujian statistiknya. Misalnya, tingkat kepercayaan 0,01 dianggap lebih signifikan daripada tingkat kepercayaan 0,05.
Ketika menggunakan tabel statistik untuk menghitung p value, Anda akan mendapatkan p valuerobabilitas perkiraan (misalnya, p value antara 0,05 dan 0,01). Beberapa tabel statistik memberikan rincian p value lebih lengkap daripada yang lain.
Misalnya, satu tabel mungkin berhenti pada tingkat kepercayaan 99%, sementara yang lain melanjutkan ke tingkat kepercayaan 99,99%. Jika Anda memerlukan p value yang tepat, Anda dapat menggunakan perangkat lunak, seperti add-in Analisis ToolPak Excel, untuk menghitung p value yang sangat akurat.
Menginterpretasikan P value
Setelah Anda menghitung p value Anda, Anda mengujinya terhadap tingkat kepercayaan yang ditargetkan:
- P value < tingkat kepercayaan: Menolak hipotesis nol karena bukti statistik yang cukup.
- P value ≥ tingkat kepercayaan: Tidak dapat menolak hipotesis nol karena bukti statistik yang tidak cukup.
Apa yang dikatakan P value tentang data statistik?
P value memberi tahu Anda seberapa mungkin hipotesis nol (keyakinan bahwa tidak ada hubungan signifikan antara dua variabel) benar.
Jika p value berada di bawah tingkat kepercayaan yang dipilih, maka Anda dapat menolak hipotesis nol. Misalkan Anda memilih tingkat kepercayaan konvensional 0,05 dan Anda menemukan p value sebesar 0,03 dengan kumpulan data Anda.
Dalam contoh ini, p value sebesar 0,03 mengindikasikan bahwa ada probabilitas sebesar 3% bahwa hasil kumpulan data Anda disebabkan oleh kebetulan. P value memungkinkan Anda menolak hipotesis nol.
Sementara itu, p value di atas tingkat kepercayaan memberi tahu Anda bahwa ada probabilitas lebih tinggi bahwa hasil yang diamati dalam kumpulan data Anda disebabkan oleh kebetulan. Dengan memilih tingkat kepercayaan Anda, Anda menetapkan benchmark untuk membuat keputusan objektif. Pada tingkat kepercayaan 0,05, semua p value yang lebih besar dari 0,05 dianggap terlalu acak.
Misalnya, p value sebesar 0,07 mengindikasikan bahwa ada probabilitas sebesar 7% bahwa hasil yang diamati adalah kebetulan, dan Anda tidak dapat menolak hipotesis nol dalam hal ini.
Bagaimana P value dihitung?
P value dapat dihitung menggunakan rumus, tabel statistik, atau perangkat lunak (seperti Microsoft Excel).
Pertama, mari atur skenario berikut: Jimmy ingin mencari tahu apakah orang di kotanya dapat mengenali “saus Caesar terkenal dunianya” dari yang generik yang dijual oleh toko kelontong lokalnya.
Dia memilih 50 individu dari kotanya untuk uji sampel. Setiap subjek mencicipi saus dari lima wadah. Hanya satu wadah yang berisi saus Caesar Jimmy, dan urutannya diacak.
- Hipotesis nol Jimmy adalah bahwa konsumen tidak akan dapat mengenali “saus Caesar terkenal dunianya.”
- Hipotesis alternatif adalah bahwa konsumen dapat mengenali saus khususnya.
- Jimmy mengharapkan 10 orang (satu dari lima) mungkin memilih sausnya secara kebetulan karena itu salah satu dari lima pilihan yang disediakan.
- Ketika Jimmy menjalankan uji sampel dengan 50 subjek, 18 di antaranya mengenali “saus Caesar terkenal dunianya.”
- Variabilitas dari eksperimen (sering disebut sebagai “derajat kebebasan eksperimen”) diperoleh dengan mengurangkan satu dari jumlah variabel. Karena kita hanya memiliki dua variabel (sau Jimmy dan saus generik), maka derajat kebebasan eksperimen ini adalah satu.
- Jimmy memilih tingkat kepercayaan sebesar 0,05.
Sekarang mari lihat dua cara berbeda untuk menghitung p value Jimmy:
Contoh perhitungan p value menggunakan rumus dan tabel statistik
Skenario yang berbeda memerlukan pendekatan yang berbeda (misalnya, uji t, uji z, uji chi-square) untuk menghitung p value. Jika Anda mencoba menentukan apakah sampel mewakili populasi, Anda akan menggunakan pendekatan perhitungan p value yang berbeda daripada jika Anda mencoba menentukan apakah dua sampel dapat dibandingkan.
Untuk menemukan p value dari contoh Jimmy, Anda dapat menggunakan rumus chi-square — ukuran perbedaan antara nilai yang diamati dan nilai yang diharapkan dalam sebuah eksperimen. Rumus “chi square” (𝛘2) adalah:
(18-10)^2 / 10 = 64 / 10 = 6,4
Setelah Anda memiliki nilai chi-square Anda, Anda akan menggunakan tabel statistik untuk memperkirakan p value.
Inilah cara membaca tabelnya: Kolom pertama (df) menunjukkan derajat kebebasan Anda, dan Anda bergerak ke bawah baris sampai Anda mendekati nilai chi-square Anda. Dalam contoh ini, derajat kebebasan adalah satu; baris pertama menunjukkan bahwa 6,4 berada di antara 0,975 dan 0,99.
P value eksperimen berada antara 0,025 (1 – 0,975) dan 0,01 (1 – 0,99). Hasil ini berada di bawah tingkat kepercayaan 0,05, sehingga Jimmy memiliki bukti yang cukup untuk menolak hipotesis nol.
Kemampuan penduduk kota untuk mengenali “saus Caesar terkenal dunianya” dari yang generik yang dijual oleh toko kelontong lokalnya bukanlah karena kebetulan.
Contoh perhitungan p value menggunakan Microsoft Excel
Salah satu batasan menggunakan tabel statistik untuk menghitung p value adalah Anda akan mendapatkan p valueerkiraan. Dengan kemajuan komputasi, Anda sekarang dapat menemukan p value yang tepat. Salah satu cara untuk menghitung p value yang lebih akurat adalah dengan Excel.
Dengan menggunakan skenario kami, Anda dapat menggunakan fungsi CHISQ.DIST untuk menemukan p value sebesar 0,01142 (1 – 0,98858).
P value ini masih di bawah tingkat kepercayaan, jadi ini juga mendukung Jimmy menolak hipotesis nol.
Apa yang dimaksud dengan P value yang signifikan?
Ketika menguji statistik hipotesis, p value yang signifikan dianggap sebagai p value yang lebih kecil dari tingkat kepercayaan yang dipilih. Tingkat kepercayaan yang umum digunakan adalah 0,1, 0,05, dan 0,01, yang menguji hipotesis pada tingkat kepercayaan 90%, 95%, atau 99%, masing-masing.
Jika Anda memilih tingkat kepercayaan sebesar 0,01, maka p value yang signifikan akan lebih kecil dari 0,01.
P value yang signifikan menjadi dasar untuk membuat keputusan objektif tentang suatu hipotesis. P value yang dihasilkan dari studi dibandingkan dengan tingkat kepercayaan untuk memutuskan apakah menolak atau tidak hipotesis nol.
- P value < tingkat kepercayaan: P value yang rendah signifikan, dan Anda dapat menolak hipotesis nol.
- P value ≥ tingkat kepercayaan: P value tidak signifikan secara statistik, dan Anda tidak dapat menolak hipotesis nol.
Apa itu kesalahan Tipe I dan Tipe II?
Ketika menguji apakah akan menolak atau tidak suatu hipotesis, Anda memiliki kemungkinan membuat keputusan yang salah. Tabel di bawah merangkum dua jenis kesalahan yang mungkin terjadi dalam pengujian hipotesis: Kesalahan Tipe I dan Kesalahan Tipe II.
Kesalahan Tipe I terjadi ketika Anda salah menolak hipotesis nol. Biasanya disebut “alfa,” probabilitas membuat Kesalahan Tipe I ditentukan oleh tingkat signifikansi.
Misalnya, jika Anda memilih tingkat signifikansi sebesar 0,05, maka Anda memiliki 5% kemungkinan menolak hipotesis nol yang sebenarnya benar atau 5% kemungkinan membuat Kesalahan Tipe I.
Kesalahan Tipe II terjadi ketika Anda tidak menolak hipotesis nol yang salah. Probabilitas membuat Kesalahan Tipe II disebut “beta.” Dengan menggunakan beta, Anda dapat mendefinisikan “kekuatan uji” — probabilitas Anda menolak hipotesis nol yang salah.
Meskipun kekuatan uji yang kuat diinginkan, Anda memiliki biaya peluang: Dengan mengurangi kemungkinan membuat Kesalahan Tipe II, Anda meningkatkan kemungkinan membuat Kesalahan Tipe I.
Apa masalah yang terkait dengan penggunaan P value?
Salah satu masalah utama dalam menggunakan p value adalah melibatkan pemilihan ambang batas yang mungkin sewenang-wenang. Meskipun 0,05 sering digunakan untuk menguji signifikansi statistik, itu bukanlah ukuran yang cocok untuk semua penelitian.
P value adalah statistik uji yang berguna untuk mengevaluasi suatu hipotesis, tetapi tidak dapat menjadi dasar tunggal untuk seluruh penelitian. Demi mencapai tingkat signifikansi, beberapa ahli statistik mungkin beralih ke “p-hacking” dan menggunakan metode statistik yang meragukan sampai sesuatu yang “signifikan” muncul.
Selain itu, American Statistical Association (ASA) mencatat bahwa p value memberikan data tentang penjelasan hipotesis tertentu tetapi tidak memberikan penjelasan hipotesis itu sendiri.
Korelasi belum tentu berarti kausalitas, yang dapat menyebabkan penafsiran yang salah tentang p value. ASA menyarankan untuk melengkapinya dengan pengujian hipotesis yang sesuai dan tidak membiarkan p value menjadi segalanya dalam penelitian.
Masalah lain dalam analisis p value adalah probabilitas membuat penolakan yang salah terhadap hipotesis nol (Kesalahan Tipe I) atau gagal menolak hipotesis nol yang salah (Kesalahan Tipe II).