Pilihan Uji Normalitas Berdasarkan Software-Jumlah Sampel
Pilihan Uji Normalitas Univariate
Jenis Uji Normalitas
Uji normalitas univariate banyak sekali macamnya, baik berdasarkan grafik atau angka. Berdasarkan grafik antara lain: Normal PP Plot, Normal QQ Plot, Normal Detrend QQ Plot, Histogram, Boxplot dan Stem-leaf. Sedangkan berdasarkan angka antara lain: Jarque Bera, Skewness Kurtosis, Shapiro Wilk, Shapiro Francia, Ryan Joiner, Lilliefors, Cramer Von Mises, Anderson Darling, Kolmogorov Smirnov dan banyak lainnya. Karena banyak pilihan uji normalitas itulah, dalam kesempatan ini kita akan membahas tentang pilihan uji normalitas yang tepat.
Begitu banyaknya uji yang tersedia, kadang kita kesulitan untuk memilih uji normalitas apa yang tepat dalam penelitian atau kasus statistik yang kita alami. Tentunya tidak ada salahnya jika kita mencoba untuk mempelajari uji apa yang kiranya paling tepat atau paling valid.
Uji Coba Normalitas
Berikut akan kita bahas, uji coba atau studi kasus berbagai uji normalitas dalam berbagai kasus. Dalam bahasan ini kita menggunakan hasil uji coba yang dilakukan oleh Nornadiah Mohd Razali dan Yap Bee Wah dalam Journal berjudul “Power Comparisons of Shapiro-wilk, Klomogorov Smirnov, Lilliefors And Anderson Darling-Tests. Faculty of Computer and Mathematical Science, University Teknologi MARA, 40450 Shah Alam, Selangor, Malaysia.”
Grafik Uji Normalitas pada Platykurtic Distributions
Grafik di atas menunjukkan simulasi hasil 4 macam uji normalitas (SW: Shapiro Wilk, KS: Kolmogorov Smirnov, LF: Lilliefors, AD: Anderson Darling) dengan Alfa 5% pada Distribusi Tidak Normal Simetris dengan nilai Kurtosis kurang dari 3 atau yang disebut dengan distribusi Platykurtic.
Probabilitas Shapiro Wilk
Shapiro Wilk beda dari pada yang lain hingga jumlah sampel 30 dan tetap stabil hingga 50 sampel, namun mendadak probabilitasnya meningkat tajam setelah 50 sampel sampai 200 sampel kemudian cenderung stagnan pada probabilitas 1 mulai sampel 300 sampai 2000. Anderson Darling sedikit menyerupai Shapiro Wilk, meningkat tajam setelah 50 sampel dan stagnan pada probabilitas 1 sejak sampel 400.
Probabilitas Lilliefors
Lilliefors Meningkat tajam mulai sampel 50 kemudian meningkat lebih tajam lagi pada sampel 100 dan probabilitasnya mendekati 1 setelah sampel 200 kemudian stagnan pada probabilitas 1 sejak sampel 1000. Sedangkan kolmogorov smirnov mulai menunjukkan peningkatan sejak sampel 100 dan meningkat lebih tajam sejak sampel 500 kemudian mencapai probabilitas 1 sejak sampel 2000.
Grafik Uji Normalitas pada Leptokurtic Distributions
Grafik di atas menunjukkan Shapiro Wilk, Anderson Darling dan Lilliefors secara berurutan probabilitasnya meningkat tajam sejak sampel 50. Pada sampel 200 mendekati probabilitas 1 dan mencapai probabilitas 1 pada sampel 300 kemudian stagnan sampai sampel 2000. Sedangkan kolmogorov smirnov meningkat tajam sejak sampel 100 dan selanjutnya mencapai probabilitas 1 sejak sampel 1000 dan terus stagnan sampai sampel 2000.
Berdasarkan hasil uji coba pada kedua distribusi simetris tidak normal di atas, uji shapiro wilk menunjukkan performa paling bagus pada sampel kecil di bawah 50 diikuti anderson darling dan lilliefors. Sedangkan kolmogorov smirnov berada diurutan berikutnya namun dapat bertahan kemampuannya sampai sampai sampel 1000.
Grafik Uji Normalitas pada Distribusi Asimetris Gamma (4,5).
Grafik di atas menunjukkan bahwa pada distribusi asimetris gamma (4,5) dengan skewness 1 dan kurtosis 4,5, shapiro wilk kemudian diikuti anderson darling dan lilliefors meningkat tajam sejak sampel 10 kemudian mencapai probabilitas 1 pada sampel 200. Khusus lilliefors masih dapat bertahan hingga sampel 300, namun pada sampel 200 sudah mendekati probabilitas 1. Sedangkan kolmogorov smirnov meningkat secara tajam sejak sampel 100 dan mencapai probabilitas 1 pada sampel 1000.
Grafik Uji Normalitas pada Distribusi Asimetris Gamma (1,5).
Grafik di atas menunjukkan bahwa pada distribusi asimetris gamma (1,5) dengan skewness 2 dan kurtosis 9, shapiro wilk kemudian diikuti anderson darling meningkat tajam sejak sampel 10 kemudian mencapai probabilitas 1 pada sampel 50. Khusus lilliefors masih dapat bertahan hingga sampel 100. Sedangkan kolmogorov smirnov meningkat secara tajam sejak sampel 50 dan mencapai probabilitas 1 pada sampel 100.
Kesimpulan Uji Normalitas Pada Distribusi Asimetris
Dari kedua distribusi asimetris di atas, menunjukkan bahwa sebaiknya shapiro wilk dan anderson darling digunakan pada sampel 50 atau kurang. Sedangkan Uji lilliefors dan kolmogorov smirnov sebaiknya digunakan pada sampel kurang dari 100.
Berdasarkan kedua tabel di atas, peringkat pertama kekuatan uji normalitas ditempati oleh uji shapiro wilk kemudian secara berurutan diikuti anderson darling, lilliefors dan kolmogorov smirnov.
Probabilitas Uji Normalitas Berdasarkan Software
Selanjutnya kita bahas lebih jauh tentang uji normalitas di atas serta beberapa uji lainnya. Kita akan menggunakan hasil uji coba yang dilakukan oleh “Park, Hun Myoung. 2008. Univariate Analysis and Normality Test Using SAS, Stata, and SPSS. Working Paper. The University Information Technology Services (UITS) Center for Statistical and Mathematical Computing, Indiana University.”
Sumber Data Uji Coba Pilihan Uji Normalitas
Data yang digunakan didapatkan secara acak dari distribusi standard normal dengan sebuah seed dari 1.234.567 dalam aplikasi SAS dengan setiap peningkatan jumlah sampel, nilai mean, median skewness dan kurtosis mendekati 0 dan standard deviasi tetap bernilai 1.
Semua tabel di atas menunjukkan bahwa semua uji normalitas (jarque bera, skewness kurtosis, shapiro wilk, shapiro francia, lilliefors, cramer von mises dan anderson darling) tidak ada yang menolak H0 dari normalitas dalam berapapun jumlah sampel. Namun uji shapiro wilk sudah tidak reliabel pada jumlah sampel 2000 dan uji shapiro francia sudah tidak reliabel pada jumlah sampel mencapai 5000. Sedangkan Jarque Bera dan Skewness Kurtosis terus menunjukkan performa yang konsisten pada berbagai jumlah sampel.
Catatan: Kolmogorov smirnov di dalam tabel adalah uji Lilliefors yang merupakan koreksi dari uji kolmogorov smirnov.
Spesikasi Uji Normalitas Berdasarkan Jumlah Sampel
Berikut beberapa aplikasi statistik yang mendukung uji normalitas:
Di atas adalah tabel pilihan uji normalitas berdasarkan kemampuan atau validitas software statistik terhadap jumlah sampel yang digunakan. Tabel di atas menunjukkan bahwa Jarque Bera dan Skewness Kurtosis menggunakan distribusi chi-square pada degree of freedom 2. Jarque Bera dapat kita hitung secara manual sedangkan skewness kurtosis dengan aplikasi STATA. Skewness kurtosis valid pada jumlah sampel lebih atau sama dengan 9. Uji shapiro wilk valid pada jumlah sampel 7 sd 2000 dan dapat kita gunakan pada aplikasi SAS, STATA dan SPSS. Mirip dengan shapiro wilk, uji ryan joiner dapat kita gunakan pada aplikasi minitab.
Sedangkan shapiro francia yang merupakan koreksi dari shapiro wilk, valid pada sampel 5 sd 5000 sampel dan dapat digunakan pada aplikasi STATA. Uji lilliefors, cramer von mises, anderson darling dan kolmogorov smirnov menggunakan Empirical Distribution Function (EDF). Lilliefors terdapat pada aplikasi SAS, SPSS dan minitab. Cramer Von Mises pada aplikasi SAS. Anderson darling pada aplikasi SAS dan minitab. Sedangkan kolmogorov smirnov terdapat pada aplikasi SPSS.
Catatan: Fungsi kolmogorov pada STATA tidak digunakan untuk uji normalitas.
Spesifikasi Uji Normalitas Berdasarkan Jumlah Sampel Oleh Para Pakar
Berdasar berbagai pandangan para pakar statistik beserta berbagai uji coba, berikut penulis sampaikan uji normalitas yang sebaiknya digunakan pada berbagai jumlah sampel.
Keterangan:
v : Valid digunakan
v(T) : Pilihan yang baik digunakan
v(T)* : Pilihan yang terbaik.
Prioritas Pilihan Uji Normalitas Berdasarkan Berbagai Jumlah Sampel
Untuk sampel 3 sd 4, jarque bera yang harus digunakan. Sampel 5 sd 6 seharusnya menggunakan shapiro francia. Pada sampel 7 sd 50 sebaiknya menggunakan shapiro wilk atau shapiro francia. Untuk sampel 51 sd 200 sebaiknya menggunakan uji lilliefors. Sedangkan untuk sampel yang lebih besar dari 200 sebaiknya menggunakan uji skewness kurtosis atau jarque bera karena kedua uji tersebut terus konsisten performanya pada berapapun jumlah sampel. Uji shapiro wilk dan ryan joiner hanya valid sampai 2000 sampel, sedangkan uji shapiro francia valid hingga 5000 sampel.
Prioritas Pilihan Uji Normalitas Berdasarkan Ketersediaan Software
Apabila anda hanya memiliki aplikasi SPSS, sebaiknya menggunakan uji shapiro wilk pada sampel 7 sd 50, menggunakan uji lilliefors pada sampel 51 sd 200 dan menggunakan uji kolmogorov smirnov jika sampel lebih dari 200.
Apabila anda hanya memiliki aplikasi SAS, untuk sampel kecil 7 sd 50 anda bisa menggunakan uji shapiro wilk dan anderson darling. pada sampel 51 sd 200 sebaiknya menggunakan lilliefors. Untuk sampel lebih dari 200 anda bisa menggunakan cramer von mises.
Apabila hanya memiliki aplikasi STATA, untuk sampel 5 sd 50 anda bisa menggunakan shapiro francia, bila sampel 7 sd 50 anda bisa memilih shapiro wilk atau shapiro francia. Sedangkan untuk sampel lebih dari 50 anda gunakan uji skewness kurtosis.
Apabila hanya memiliki aplikasi minitab, anda bisa menggunakan uji ryan joiner dan anderson darling pada sampel 7 sd 50. Untuk sampel yang lebih besar anda gunakan uji lilliefors.
Demikian penjelasan kami perihal pilihan uji normalitas univariate. Semoga artikel yang membahas tentang Pilihan Uji Normalitas berdasarkan berbagai pertimbangan ini akan bermanfaat untuk para peneliti atau mahasiswa.
By Anwar Hidayat
Belum ada Komentar untuk "Pilihan Uji Normalitas Berdasarkan Software-Jumlah Sampel"
Posting Komentar