Apa itu resampling?
Saat mengumpulkan sampel di seluruh kelompok besar orang, objek, atau data, ada beberapa cara untuk memverifikasi akurasi. Salah satu metode yang umum digunakan adalah resampling, di mana Anda mengambil sampel dan observasi tambahan untuk mengidentifikasi bias atau masalah apa pun. Mempelajari konsep ini dapat membantu Anda memutuskan apakah melakukan teknik pengambilan sampel ulang yang umum mungkin tepat untuk pengujian Anda. Dalam artikel ini, kami membahas apa itu resampling dan membagikan detail penting tentangnya, seperti perbedaannya dengan sampling dan apa perbedaan tekniknya.
Apa itu pengambilan sampel ulang?
Resampling adalah serangkaian teknik yang digunakan dalam statistik untuk mengumpulkan lebih banyak informasi tentang sampel. Ini dapat mencakup pengambilan kembali sampel atau memperkirakan keakuratannya. Dengan teknik tambahan ini, pengambilan sampel ulang sering kali meningkatkan akurasi keseluruhan dan memperkirakan ketidakpastian apa pun dalam suatu populasi.
Pengambilan sampel vs pengambilan sampel ulang
Sampling adalah proses memilih kelompok tertentu dalam suatu populasi untuk mengumpulkan data. Resampling sering melibatkan melakukan metode pengujian serupa dengan ukuran sampel dalam kelompok itu. Ini dapat berarti menguji sampel yang sama, atau memilih kembali sampel yang dapat memberikan lebih banyak informasi tentang suatu populasi. Ada beberapa perbedaan antara sampling dan resampling, antara lain:
Metode
Resampling menggunakan metode seperti teknik bootstrap dan tes permutasi. Dengan pengambilan sampel, ada empat metode utama:
- Pengambilan sampel acak sederhana: Pengambilan sampel acak sederhana adalah ketika setiap orang atau bagian data dalam suatu populasi atau kelompok memiliki kesempatan yang sama untuk dipilih. Anda mungkin menghasilkan angka acak atau memiliki proses pemilihan acak lainnya.
- Pengambilan sampel sistematis: Pengambilan sampel sistematis seringkali masih acak, tetapi orang mungkin menerima angka atau nilai di awal. Orang yang mengadakan eksperimen kemudian dapat memilih interval untuk membagi kelompok, seperti setiap orang ketiga.
- Pengambilan sampel bertingkat: Pengambilan sampel bertingkat adalah ketika Anda membagi populasi utama menjadi beberapa subkelompok berdasarkan kualitas tertentu. Ini bisa berarti mengumpulkan sampel dari kelompok usia, budaya, atau demografi lain yang berbeda.
- Pengambilan sampel cluster: Pengambilan sampel cluster mirip dengan pengambilan sampel bertingkat, karena Anda dapat membagi populasi menjadi subkelompok yang terpisah. Daripada kelompok terkoordinasi dengan kualitas yang sama, Anda memilih kelompok ini secara acak, sering menyebabkan perbedaan hasil.
Sasaran
Tujuan utama pengambilan sampel adalah untuk mengumpulkan informasi tentang sekelompok orang atau data yang lebih besar tanpa menanyakan setiap orang. Resampling mengambil ini lebih jauh, karena berharap untuk mengidentifikasi setiap penyimpangan besar dari asumsi. Misalnya, Anda dapat mengambil sampel 30 orang dari 100 orang untuk mempelajari preferensi sarapan mereka. Dalam pengambilan sampel, Anda dapat mempelajari persentase mana yang lebih menyukai telur, yogurt, atau oatmeal. Dengan pengambilan sampel ulang, Anda dapat mengambil bagian dari kelompok yang sama atau yang lain dari 100 untuk mengetahui apakah persentase yang ditentukan dari pengambilan sampel akurat.
Asumsi
Pengambilan sampel bergantung pada asumsi untuk memahami kualitas apa yang mungkin dimiliki kelompok yang lebih besar. Dalam resampling, ada asumsi yang terbatas. Seringkali ada persyaratan ukuran yang lebih sedikit dan metode yang berbeda untuk menguji sampel. Ini membantu Anda fokus pada data di beberapa upaya pengambilan sampel ulang untuk memverifikasi akurasi dan meminimalkan bias.
Alasan
Orang mengambil sampel populasi dan subjek uji, karena ini bisa menjadi alternatif yang lebih murah daripada mengamati kelompok penuh. Demikian pula, mungkin lebih mudah untuk mengumpulkan data dari sampel daripada mencoba mengamati seluruh kelompok dalam jangka waktu tertentu. Alasan pengambilan sampel ulang adalah untuk memverifikasi atau memperkuat data yang dikumpulkan saat pengambilan sampel. Meskipun pengambilan sampel ulang dapat memakan biaya lebih banyak, karena Anda mungkin melakukan beberapa pengamatan baru, ini dapat membantu Anda memberikan hasil yang lebih akurat.
Kesalahan
Pengambilan sampel memiliki beberapa kesalahan umum yang mungkin Anda lihat:
- Bias sampel: Bias sampel terjadi ketika ada masalah saat memilih pengamatan. Misalnya, seseorang mungkin hanya memilih orang yang mereka kenal atau dengan karakteristik tertentu untuk menjawab pertanyaan.
- Kesalahan pengambilan sampel: Kesalahan pengambilan sampel adalah ketika sampel yang dipilih untuk mewakili keseluruhan tidak akurat. Ini berarti parameter populasi penuh berbeda dari sampel yang diamati.
Karena pengambilan sampel ulang membantu mengidentifikasi kesalahan atau penyimpangan dalam sampel, tidak ada kesalahan umum. Ini masih bisa terjadi jika perhitungan, seperti rata-rata di seluruh hasil pengambilan sampel ulang, memiliki kesalahan.
Jenis pengambilan sampel ulang
Ada beberapa jenis pengambilan sampel ulang:
Bootstrap
Teknik bootstrap adalah ketika Anda mereplikasi pengamatan yang Anda buat dengan sampling berulang. Misalnya, jika Anda memilih 10 orang dari 100 orang untuk mengamati hipotesis, Anda dapat melakukannya beberapa kali, setiap kali memilih 10 orang baru. Ini membantu mengurangi kesalahan statistik, karena Anda kemudian dapat mengumpulkan pengukuran seperti mean atau median antara sampel ini untuk mendapatkan hasil yang lebih akurat. Sering disebut metode plug-in, ini umum di bidang-bidang seperti fisika dan algoritme genetika.
Berlipat
Jackknifing adalah teknik resampling yang membantu orang mengidentifikasi varians atau bias dalam sampel. Anda menggunakan ini untuk menghapus satu pengamatan dari grup untuk membuat subsampel. Dalam sampel, Anda dapat menghapus satu pengamatan setiap kali dan mengumpulkan hasilnya untuk memahami jika ada bias. Misalnya, jika Anda memiliki 10 pengamatan bernomor satu sampai 10, Anda dapat menghapus satu dan melihat hasilnya. Kemudian Anda dapat menghapus dua dan melanjutkan hingga 10 untuk melihat apakah ada outlier dalam pengambilan sampel.
Validasi silang
Ahli statistik sering menggunakan validasi silang untuk model statistik prediktif. Dengan teknik ini, Anda dapat menyimpan beberapa bagian data dalam suatu pengambilan sampel sebagai kumpulan validasi. Observasi lainnya yang masih dalam kelompok adalah training set. Menguji set pelatihan memungkinkan orang untuk memprediksi set validasi. Setiap kali Anda melakukan validasi silang, Anda dapat mengumpulkan rata-rata akurasi untuk prediksi guna mempelajari akurasi setiap model prediktif.
Tes permutasi
Tes permutasi adalah ketika Anda melakukan tes yang tepat beberapa kali dengan hipotesis nol. Ini membantu Anda secara otomatis membuat pengambilan sampel dalam suatu populasi dan melakukan pengamatan yang sama. Metode pengujian ini dapat menetapkan pertukaran pengamatan yang berbeda atau seberapa mungkin untuk bertukar label dalam satu set.