Statistika adalah ilmu pengumpulan, pengaturan, penyajian, analisis, dan penafsiran untuk membantu pengambilan keputusan secara lebih efektif.
Statistika dibagi 2 jenis :
- Statistika Deskriptif adalah prosedur yang digunakan untuk mengatur dan meringkas data.
- Statistika Inferensi adalah pengambilan sampel dari populasi dan pembuatan estimasi tentang populasi berdasarkan hasil-hasil dari sampel tersebut.
Ada 2 jenis variabel :
- Variabel Kualitatif sifatnya Non-Numerik.
- Variabel Kuantitatif sifatnya Numerik.
Ada 4 tingkat pengukuran :
- Nominal. Data disusun kedalam sejumlah kategori tanpa urutan tertentu.
- Ordinal. Suatu klasifikasi berkedudukan lebih tinggi dibandingkan klasifikasi lainnya.
- Interval.Memiliki karakteristik bahwa jarak antar nilai bersifat konstan.
- Rasio. Memiliki karakteristik pengukuran interval ditambah adanya sebuah titik 0 dan rasio antara 2 nilai memiliki makna.
Statistika Deskriptif adalah prosedur yang digunakan untuk mengatur dan meringkas data.
Tabel Frekuensi mengelompokan data kualitatif menjadi kelas-kelas yang tidak terikat satu sama lain dan memperlihatkan hasil pengamatan tiap-tiap kelas.
Tabel Frekuensi relatif menunjukkan persentase dari jumlah frekuensi tiap kelas.
Diagram Batang adalah grafik yang merepresentasikan tabel frekuensi.
Diagram Pie memperlihatkan proporsi setiap kelas yang berbeda yang merepresentasikan jumlah total frekuensi.
Distribusi Frekuensi adalah pengelompokan data menjadi kelas-kelas yang tidak terikat satu sama lain dan memperlihatkan jumlah hasil pengamatan tiap kelas.
A. Langkah membuat distribusi frekuensi :
- Menentukan jumlah kelas
- Menentukan interval kelas
- Menentukan batas kelas masing-masing
- Menggolongkan data ke dalam kelas-kelas
- Menghitung jumlah data dalam tiap kelas
B. Frekuensi kelas adalah jumlah hasil pengamatan dalam tiap kelas
C. Intreval Kelas adalah selisih antara batas dua kelas yang berurutan
D. Titik tengah kelas adalah pertengahan batas dua kelas yang berurutan
Distribusi frekuensi relatif menunjukkan persentase hasil pengamatan tiap kelas.
Metode atau Cara untuk menggambarkan Distribusi Frekuensi :
- Histogram. Menggambarkan jumlah frekuensi dalam tiap kelas dama bentuk persegi panjang.
- Poligon frekuensi terdiri atas garis-garis yang menghubungkan titik-titik perpotongan antara titik tengah kelas dan frekuensi kelas
- Distribusi frekuensi kumulatif menunjukkan jumlah atau persentase hasil pengamatan di bawah nilai yang ditentukan.
Ukuran Pemusatan Data adalah Nilai yang digunakan untuk menjelaskan pusat dari sekelompok data. Berikut ini beberapa ukuran pemusatan data :
A. Rata-rata
Rata-rata merupakan ukuran yang paling banyak digunakan secara luas.
Rata-rata merupakan ukuran yang paling banyak digunakan secara luas.
1. Rata-rata hitung diperoleh dengan menambahkan semua nilai pengamatan dan membaginya dengan jumlah pengamatan.
Rumus rata-rata populasi : 
Rumus rata-rata sampel : 
2. Rata-rata pembobotan diperoleh dengan cara mengalikan setiap pengamatan dengan bobot yang bersesuian.
Rumusnya : 
3. Rata-rata Geometris adalah akar pangkat n dari hasil kali pengamatan sebanyak n.
Rumusnya : ![\bar{X} = \sqrt[n]{X_1.X_2.X_3...X_n} \bar{X} = \sqrt[n]{X_1.X_2.X_3...X_n}](https://lh3.googleusercontent.com/blogger_img_proxy/AEn0k_sMfIFaF2sPsKFCfFs4dteVKtYgYpXTlnvLkk0bB0p1jVvIMOIbfF2V37qvqWT9CnNIgtM3FQQ8IPNPMG_W2q1Qka9KkxK-Mq_G_ilYeg5-6PcZk5F7iBG1Y9FGXRf7_dvYhW3RF6G1LiyNYHkM4J3etXLsch_KiaZDXyMvqMNoAYXXf1Lm-MlrPImn7XVeaZ-PvEXsV1JjgpM=s0-d)
B. MedianMedian adalah Nilai Tengah dari sekelompok data yang terurut.
Untuk menentukan median, urutkan data pengamatan dari yang terkecil hingga yang terbesar dan temukan nilai tengahnya.
C. ModusModus adalah nilai yang sering muncul dalam sekelompok data.
Ukuran Penyebaran Data adalah ukuran yang digunakan untuk menyatakan sebaran atau variasi dari suatu kelompok data. Berikut ini beberapa ukuran yang biasa digunakan :
A. Range/ Jangkauan
Range/Jangkauan adalah perbedaan antara nilai terbesar dan nilai terkecil pada sekelompok data.
Sifat – sifat :
- Hanya dua nilai yang digunakan
- Dipengaruhi oleh Nilai yang ekstrem
- Mudah dihitung dan dan dipahami
B. Deviasi Absolut Rata-rata
Deviasi Absolut Rata-rata adalah jumlah nilai absolut setiap deviasi dari rata-rata dibagi banyaknya pengamatan.
Sifat – sifat :
- Tidak terlalu dipengaruhi oleh nilai besar atau kecil
- Seluruh pengamatan digunakan dalam perhitungan
- Nilai absolut agak sulit digunakan
C. Variansi
Variansi adalah rata-rata deviasi kuadrat dari rata-rata hitung.
Rumus Variansi Populasi :
Rumus Variansi Sampel :
Sifat – sifat :
- Seluruh pengamatan digunakan dalam perhitungan
- Tidak terlalu dipengaruhi oleh pengamatan yang ekstrem
- Unitnya agak sulit digunakan, biasanya adalah unit kuadrat awal
D. Standar Deviasi
Standar Deviasi adalah akar kuadrat dari Variansi.
Rumus Standar Deviasi Populasi :
Rumus Standar Deviasi Sampel :
Sifat -sifat :
- Mempunyai satuan yang sama dengan data aslinya
- Merupakan akar kuadrat dari jarak kuadrat rata-rata terhadap nilai rata-rata
- Nilainya pasti positif
- Merupakan ukuran penyebaran data yang paling sering dilaporkan
Peluang adalah suatu nilai antara 0 sampai 1 yang menunjukkan kemungkinan suatu peristiwa akan terjadi.
- Sebuah Eksperimen adalah pengamatan atas beberapa kegiatan atau suatu pengukuran.
- Sebuah hasil adalah keluaran tertentu dari sebuah eksperimen.
- Suatu kejadian adalah kumpulan satu hasil atau lebih dari sebuah eksperimen.
Beberapa kejadian dikatakan saling bebas jika kemunculan suatu kejadian tidak memengaruhi kemunculan kejadian yang lainnya.
Aturan penjumlahan mengacu pada gabungan dari beberapa kejadian.
1. Aturan penjumlahan khusus digunakan ketika kejadian-kejadiannya tidak terikat satu sama lain.
2. Aturan penjumlahan umum digunakan ketika kejadian-kejadiannya terikat satu sama lain.
3. Aturan komplemen digunakan untuk menentukan peluang suatu kejadian yang muncul dengan mengurangi peluang ketidakmunculan kejadian tersebut dari nilai 1.
Aturan perkalian mengacu pada hasil kali dari beberapa kejadian.
1. Aturan perkalian khusus mengacu pada kejadian-kejadian yang saling bebas.
2. Aturan perkalian umum mengacu pada kejadian-kejadian yang tidak saling bebas.
- Peluang bersyarat adalah peluang munculnya suatu kejadian, jika diketahui suatu kejadian lain telah terjadi.
Teorema Bayes
Metode untuk menghitung peluang dengan syarat ada informasi tambahan yang diperoleh. Untuk dua kejadian tidak terikat satu sama lain dan membentuk kumpulan kejadian lengkap.
Aturan untuk menghitung jumlah hasil dari suatu eksperimen
1. Aturan perkalian menyatakan bahwa jika terdapat m cara suatu kejadian dapat terjadi dan n cara suatu kejadian lain dapat terjadi maka terdapat mn cara untuk dua kejadian tersebut.
2. Permutasi adalah susunan objek-objek yang dipilih dari sekelompok objek tertentu yang urutannya penting.
3. Kombinasi adalah susunan objek-objek yang dipilih dari sekelompok objek tertentu yang urutannya tidak penting.
Distribusi peluang adalah sebuah daftar dari semua hasil yang mungkin muncul dari sebuah percobaan dan peluang yang berhubungan dengan setiap hasil.
Distribusi peluang dibagi 2 :
1. Distribusi Peluang Diskrit hanya dapat bernilai tertentu. Ciri-ciri utamannya adalah :
- Jumlah total peluangnya sama dengan 1
- Peluang dari suatu hasil adalah antara 0 sampai 1
- Hasilnya tidak terikat satu sama lain
2. Distribusi Peluang Kontinu dapat bernilai tak hingga dalam suatu jangkauan yang spesifik.
Nilai rata-rata dan variansi dari sebuah distribusi peluang dapat dihitung sebagai berikut :
Rumus Menghitung Rata-rata :
Rumus Menghitung Variansi :
Berikut ini beberapa Distribusi Peluang Diskrit :
1. Distribus Binomial
- Setiap hasil diklasifikasikan ke dalam satu dari dua kategori yang tidak terikat satu sama lain.
- Distribusi ini dihasilkan dari perhitungan jumlah sukses dari sejumlah percobaan.
- Peluang sebuah sukses tetap sama dari satu percobaan ke percobaan lain.
- Setiap percobaannya saling bebas.
- Peluang Binomial dengan p = Peluang suskes dihitung dengan rumus sbb:
- Nilai Rata-rata nya :
- Nilai Variansinya :
2. Distribusi Hipergeometris
- Distribusi ini hanya memiliki dua hasil yang mungkin muncul.
- Peluang sebuah sukses tidak sama untuk setiap percobaan
- Distribusi ini dihasilkan dari perhitungan jumlah sukses dari sejumlah percobaan
- Distribusi ini digunakan ketika pengambilan sampel dilakukan tanpa pengembalian.
- Sebuah Peluang Hipergeometris dihitung dengan menggunakan rumus sbb :
3. Distribusi Poisson
- Distribusi ini menjelaskan jumlah kejadian dari suatu peristiwa selama interval tertentu
- Peluang sebuah sukses terjadi secara proporsional dengan panjang intervalnya
- Interval-interval yang tidak saling tumpang tindih bersifat saling bebas
- Distribusi Poisson dihitung dengan rumus sbb :
Distribusi Peluang Kontinu yang paling sering digunakan adalah Distribusi Normal. Distribusi Normal ditentukan oleh dua parameter yaitu rata-rata dan simpangan baku dengan rumus sbb :
Distribusi Normal memiliki ciri-ciri sebagai berikut :
- Berbentuk lonceng dan memiliki satu puncak pada bagian tengah distribusi
- Distribusinya simetris
- Asimtotik artinya kurvanya mendekati tetapi tidak pernah menyentuh sumbu-X
Distribusi Normal Baku adalah bentuk khusus dari Distribusi Normal dengan ciri-ciri :
- Memiliki Nilai Rata-rata = 0 dan Simpangan Baku = 1
- Semua Distribusi Normal dapat diubah menjadi Distribusi Norma Baku dengan menggunakan rumus berikut :
Pendekatan Distribusi Normal bisa digunakan untuk menghitung peluang Distribusi Binomial dengan syarat :
- Jumlah pengamatan relatif besar
- Memenuhi syarat binomial
- Rumus Nilai Normal untuk pendekatan Binomial :
- Faktor koreksi diperlukan dari Distribusi Binomial yang Diskrit menjadi Distribusi Normal yang Kontinu dengan menambah atau mengurangi 0.5 terhadap nilai X.
Metode Sampling
A. Ada beberapa alasan untuk melakukan sampling dari sebuah populasi
- Hasil dari sampel cukup untuk menaksir nilai dari parameter populasi dengan demikian dapat menghemat waktu dan uang
- Memakan waktu lama untuk menghubungi semua anggota populasi
- Tidak memungkinkan untuk memeriksa atau menemukan seluruh anggota populasi
- Biaya penelitian untuk semua data populasi dapat menjadi hambatan
B. Dalam sebuah sampel yang tidak bias, seluruh anggota populasi mempunyai kesempatan untuk terpilih menjadi sampel. Ada beberapa pilihan metode sampling :
- Sampel acak sederhana, dimana semua anggota populasi mempunyai kesempatan yang sama untuk terpilih menjadi sampel
- Sampel sistematis, dimana sebuah titik awal dipilih secara acak dan selanjutnya setiap item ke-k dipilih untuk menjadi sampel
- Sampel bertingkat, dimana populasi dibagi ke dalam beberapa kelompok yang disebut strata dan kemudian sebuah sampel acak dipilih dari setiap strata
- Sampling kluster, dimana populasi dibagi ke dalam beberapa unit primer, kemudian sampel diambil dari unit primer tersebut
C. Kesalahan sampling adalah selisih antara suatu parameter populasi dengan suatu statistik sampel.
D. Distribusi sampling dari rata-rata sampel adalah distribusi probabilitas seluruh rata-rata sampel dengan ukuran yang sama.
- Untuk sampel dengan ukuran yang telah ditentukan, rata-rata seluruh rata-rata sampel yang mungkin dari sebuah populasi sama dengan rata-rata populasi
- Tidak terdapat banyak variasi dalam distribusi dari rata-rata sampel dibandingkan dengan distribusi populasi
- Kesalahan standar dari pengukuran rata-rata bervariasi dalam distribusi sampling dari rata-rata sampel. Rumus untuk mencari kesalahan standar adalah :
- Jika populasi mengikuti distribusi normal maka distribusi sampling dari rata-rata sampel juga akan mengikuti distribusi normal untuk setiap ukuran sampel. Untuk menentukan probabilitas dari rata-rata sampel yang surut dalam setiap bagian tertentu, gunakan rumus sbb :
Regresi merupakan suatu alat ukur yang juga dapat digunakan untuk mengukur ada atau tidaknya korelasi antarvariabel. Jika kita memiliki dua buah variabel atau lebih maka sudah selayaknya apabila kita ingin mempelajari bagaimana variabel-variabel itu berhubungan atau dapat diramalkan.
Analisis regresi mempelajari hubungan yang diperoleh dinyatakan dalam persamaan matematika yang menyatakan hubungan fungsional antara variabel-variabel. Hubungan fungsional antara satu variabel prediktor dengan satu variabel kriterium disebut analisis regresi sederhana (tunggal), sedangkan hubungan fungsional yang lebih dari satu variabel disebut analisis regresi ganda.
Analisis regresi lebih akurat dalam melakukan analisis korelasi, karena pada analisis itu kesulitan dalam menunjukkan slop (tingkat perubahan suatu variabel terhadap variabel lainnya dapat ditentukan). Dengan demikian maka melalui analisis regresi, peramalan nilai variabel terikat pada nilai variabel bebas lebih akurat pula.
Persamaan Regresi Linier dari Y terhadap X
Persamaan regresi linier dari Y terhadap X dirumuskan sebagai berikut:
Y = a + b X
Keterangan:
Y = variabel terikat
X = variabel bebas
a = intersep
b = koefisien regresi/slop
Analisis regresi mempelajari hubungan yang diperoleh dinyatakan dalam persamaan matematika yang menyatakan hubungan fungsional antara variabel-variabel. Hubungan fungsional antara satu variabel prediktor dengan satu variabel kriterium disebut analisis regresi sederhana (tunggal), sedangkan hubungan fungsional yang lebih dari satu variabel disebut analisis regresi ganda.
Analisis regresi lebih akurat dalam melakukan analisis korelasi, karena pada analisis itu kesulitan dalam menunjukkan slop (tingkat perubahan suatu variabel terhadap variabel lainnya dapat ditentukan). Dengan demikian maka melalui analisis regresi, peramalan nilai variabel terikat pada nilai variabel bebas lebih akurat pula.
Persamaan Regresi Linier dari Y terhadap X
Persamaan regresi linier dari Y terhadap X dirumuskan sebagai berikut:
Y = a + b X
Keterangan:
Y = variabel terikat
X = variabel bebas
a = intersep
b = koefisien regresi/slop
Korelasi linier antara 1000 pasang pengamatan. Data digambarkan pada bagian kiri bawah dan koefisien korelasinya ditunjukkan pada bagian kanan atas. Setiap titik pengamatan berkorelasi maksimum dengan dirinya sendiri, sebagaimana ditunjukkan pada diagonal (seluruh korelasi = +1).
Korelasi ρX, Y antara dua peubah acak X dan Y dengan nilai yang diharapkan μX dan μY dansimpangan baku σX dan σY didefinisikan sebagai:
Karena μX = E(X), σX2 = E(X2) − E2(X) dan demikian pula untuk Y, maka dapat pula ditulis
Korelasi dapat dihitung bila simpangan baku finit dan keduanya tidak sama dengan nol. Dalam pembuktian ketidaksamaan Cauchy-Schwarz, koefisien korelasi tak akan melebihi dari 1 dalamnilai absolut. Korelasi bernilai 1 jika terdapat hubungan linier yang positif, bernilai -1 jika terdapat hubungan linier yang negatif, dan antara -1 dan +1 yang menunjukkan tingkat dependensi linierantara dua variabel. Semakin dekat dengan -1 atau +1, semakin kuat korelasi antara kedua variabel tersebut.
Jika variabel-variabel tersebut saling bebas, nilai korelasi sama dengan 0. Namun tidak demikian untuk kebalikannya, karena koefisien korelasi hanya mendeteksi ketergantungan linier antara kedua variabel. Misalnya, peubah acak X berdistribusi uniform pada interval antara -1 dan +1, danY = X2. Dengan demikian nilai Y ditentukan sepenuhnya oleh X.
Jika variabel-variabel tersebut saling bebas, nilai korelasi sama dengan 0. Namun tidak demikian untuk kebalikannya, karena koefisien korelasi hanya mendeteksi ketergantungan linier antara kedua variabel. Misalnya, peubah acak X berdistribusi uniform pada interval antara -1 dan +1, danY = X2. Dengan demikian nilai Y ditentukan sepenuhnya oleh X.
Koefisien korelasi non-parametrik
Koefisien korelasi Pearson merupakan statistik parametrik, dan ia kurang begitu menggambarkan korelasi bila asumsi dasar normalitas suatu data dilanggar. Metode korelasi non-parametrik sepertiρ Spearman and τ Kendall berguna ketika distribusi tidak normal. Koefisien korelasi non-parametrik masih kurang kuat bila dibandingkan dengan metode parametrik jika asumsi normalitas data terpenuhi, namun cenderung memberikan hasil distrosi ketika asumsi tersebut tak terpenuhi.
KOEFISIEN PENENTU (KP) atau KOEFISIEN DETERMINASI (R2)
Jika Koefisiensi Korelasi dikuadratkan akan menjadi koefisiensi penentu (KP) atau Koefisiensi Determinasi, yang artinya penyebab perubahan pada variable Y yang dating dari variable X, sebesar kuadrat Koefisien Korelasinya.
Koefisien Penentu ini menjelaskan besarnya pengaruh nilai suatu variable (variable X) terhadap naik / turunnya (variasi) nilai variable lainnya (variable Y).
Koefisiensi Penentu dirumuskan :
[ (n) (∑XY) – (∑X) (∑Y) ]2
KP = ______________________________________________
[ n (∑X2) – (∑X)2 ] [ n (∑Y2) – (∑Y)2 ]
