Rabu, 19 September 2012

Simpangan baku


Simpangan baku


Dalam statistika dan probabilitas, simpangan baku atau deviasi standar adalah ukuran sebaran statistik yang paling lazim. Singkatnya, ia mengukur bagaimana nilai-nilai data tersebar. Bisa juga didefinisikan sebagai, rata-rata jarak penyimpangan titik-titik data diukur dari nilai rata-rata data tersebut.Simpangan baku didefinisikan sebagai akar kuadrat varians. Simpangan baku merupakan bilangan tak-negatif, dan memiliki satuan yang sama dengan data. Misalnya jika suatu data diukur dalam satuan meter, maka simpangan baku juga diukur dalam meter pula.Istilah simpangan baku pertama kali diperkenakan oleh Karl Pearson pada tahun 1894, dalam bukunya On the dissection of asymmetrical frequency curves.Dalam Statistik, wilayah data yang berada di antara +/- 1 simpangan baku akan berkisar 68.2%, wilayah data yang berada di antara +/- 2 simpangan baku akan berkisar 95.4%, dan wilayah data yang berada di antara +/- 3 simpangan baku akan berkisar 99.7%,

RUMUS SIMPANGAN BAKU


Simpangan Baku Populasi


Simpangan baku untuk populasi disimbolkan dengan Ïƒ (sigma) dan didefinisikan dengan rumus:
\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2},

Simpangan Baku SampelSimpangan baku untuk sampel disimbolkan dengan s dan didefinisikan dengan rumus:s = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \overline{x})^2},
dimana \scriptstyle\{x_1,\,x_2,\,\ldots,\,x_N\} adalah nilai data dari sampel dan \scriptstyle\overline{x} adalah rata-rata dari sampel.

Varians (Ragam)


Varians

Dalam teori probabilitas dan statistikavarians (dari bahasa Inggris: variance) atau ragam suatu perubah acak (atau distribusi probabilitas) adalah ukuran bagi persebaran (dispersi) data. Yang diukur adalah seberapa jauh data tersebar di sekitar rerata). Varians merupakan salah satu parameter bagi distribusi normal. Akar dari varians dikenal sebagai simpangan baku (standard deviation). Istilahvarians pertama kali diperkenalkan oleh Fisher dalam makalahnya pada tahun 1918 yang berjudul The Correlation Between Relatives on the Supposition of Mendelian Inheritance ("Korelasi di Antara Kerabat dalam Kerangka Pewarisan Mendel"). 

Rata-rata dari jumlah nilai simpangan dikenal dengan ragam(varians). Setelah nilai ragam diperoleh, selanjutnya nilai ragam tersebut diakarkan untuk mendapatkan kembali satuan asal dari variabel tersebut (bukan kg2/petak2, tapi kg/petak :-) ) . Cara pengukuran keragaman seperti ini dikenal dengan Standar deviasi.
Secara matematis, standar deviasi dapat dihitung dengan menggunakan formula:
\sigma =\sqrt{\dfrac{\Sigma {\left(x_i-\mu \right)}^2}{N}}\ atau\ \sqrt{\dfrac{\Sigma x^2_i-\dfrac{{\left(\Sigma x_i\right)}^2}{N}}{N}}\
Standar deviasi populasi disimbolkan dengan ? (baca ‘sigma’) dan standar deviasi sampel disimbolkan dengans. Standar deviasi sampel yang baik seharusnya merupakan ukuran yang tidak bias terhadap standar deviasi populasinya, karena kita menggunakan ukuran standar deviasi sampel untuk memperkirakan nilai standar deviasi populasi. Untuk itu, nilai n pada formula di atas diganti dengan n – 1 sehingga formula untuk standar deviasi sampel adalah sebagai berikut:
s=\sqrt{\dfrac{\Sigma {\left(x_i-\overline{x}\right)}^2}{n-1}}\ {\rm atau}\ \sqrt{\dfrac{\Sigma x^2_i-\dfrac{{\left(\Sigma x_i\right)}^2}{n}}{n-1}}\
Mengapa harus diganti dengan n-1?! Pembuktiannya diluar bahasan blog ini. :-)
Data pada tabel distribusi frekuensi:
Data Tunggal:
s=\sqrt{\dfrac{\sum^k_{i=1}{{f_i\left(x_i-\overline{x}\right)}^2}}{n-1}}\ {\rm atau}\ s=\sqrt{\dfrac{\Sigma {f_ix}^2_i-\dfrac{{\left(\Sigma f_ix_i\right)}^2}{n}}{n-1}}\
\ {\rm atau}\ s=\sqrt{\dfrac{n\Sigma {f_ix}^2_i-{\left(\Sigma f_ix_i\right)}^2}{n(n-1)}}
Data kelompok (sudah digrupkan berdasarkan selang tertentu):
Sama seperti pada perhitungan simpangan rata-rata. Standar deviasi dan ragam yang dihitung dari distribusi frekuensi data yang sudah dikelompokkan menggunakan nilai data perkiraan, bukan data aslinya. Data pewakil tersebut disimbolkan dengan m. Untuk membuat perhitungan dari data yang sudah dikelompokkan kita harus menganggap, bahwa semua nilai dalam sebuah kelas, sama dengan nilai pewakilnya (tanda kelasnya, mi). Selanjutnya, nilai perkiraan standar deviasi dapat dihitung dengan menggunakan rumus:
s=\sqrt{\dfrac{\sum^k_{i=1}{{f_i\left(m_i-\overline{x}\right)}^2}}{n-1}}\ {\rm atau}\ s=\sqrt{\dfrac{\Sigma {f_im}^2_i-\dfrac{{\left(\Sigma f_im_i\right)}^2}{n}}{n-1}}\
\ {\rm atau}\ s=\sqrt{\dfrac{n\Sigma {f_im}^2_i-{\left(\Sigma f_im_i\right)}^2}{n(n-1)}}
Nilai kuadrat dari standar deviasi dikenal dengan ragam (variance). Pada teknik analisis varian\Sigma x^2-\dfrac{{\left(\Sigma x\right)}^2}{n}dikenal dengan Jumlah Kuadrat (Sum of Square), dan ragam (varian) dikenal dengan istilah Kuadrat Tengah/Rata-rata Jumlah Kuadrat (Mean Square).
Standar deviasi merupakan ukuran penyebaran yang paling banyak digunakan. Semua gugus data dipertimbangkan sehingga lebih stabil dibandingkan dengan ukuran lainnya. Namun, apabila dalam gugus data tersebut terdapat nilai ekstrem, standar deviasi menjadi tidak sensitif lagi, sama halnya seperti mean.
Standar Deviasi memiliki beberapa karakteristik khusus lainnya. SD tidak berubah apabila setiap unsur pada gugus datanya di tambahkan atau dikurangkan dengan nilai konstan tertentu. SD berubah apabila setiap unsur pada gugus datanya dikali/dibagi dengan nilai konstan tertentu. Bila dikalikan dengan nilai konstan, standar deviasi yang dihasilkan akan setara dengan hasilkali dari nilai standar deviasi aktual dengan konstan.
Contoh 6
Apabila data nilai Quiz pada contoh 2 diambil dari sampel, tentukan nilai ragam dan standar deviasinya.
Jawab:
Untuk mencari nilai standar deviasi sampel, kita bisa menggunakan salah satu formula berikut:
s=\sqrt{\dfrac{\Sigma {\left(x_i-\overline{x}\right)}^2}{n-1}}\ {\rm atau}\ \sqrt{\dfrac{\Sigma x^2_i-\dfrac{{\left(\Sigma x_i\right)}^2}{n}}{n-1}}\
Formula pertama adalah formula secara definitif. Formula yang direkomendasikan untuk perhitungan secara manual adalah formula yang ke-2. Cara perhitungan dengan formula yang ke-2 bisa di lihat pada contoh 7 dan 8. Pada contoh ini, sebagai latihan, kita gunakan formula yang pertama. Untuk perhitungan dengan formula pertama, kita memerlukan nilai rata-ratanya, sehingga terlebih dahulu kita harus menghitung nilai rata-ratanya.
Quiz I: rata-rata =18.27
Quiz 2: rata-rata = 10.82
NoQuiz 1(xi)(x_i-\overline{x}){\left(x_i-\overline{x}\right)}^2Quiz 2(xi)(x_i-\overline{x}){\left(x_i-\overline{x}\right)}^2
11-17.27298.352-8.8277.76
2201.732.983-7.8261.12
3201.732.984-6.8246.49
4201.732.985-5.8233.85
5201.732.986-4.8223.21
6201.732.98143.1810.12
7201.732.98154.1817.49
8201.732.98165.1826.85
9201.732.98176.1838.21
10201.732.98187.1851.58
11201.732.98198.1866.94
Jumlah328.1818453.6364
Quiz 1:
s=\sqrt{\dfrac{\Sigma {\left(x_i-\overline{x}\right)}^2}{n-1}}\ \ s=\sqrt{\dfrac{328.18}{11-1}}=5.73\
ragam=s^2={5.73}^2=32.82\
Quiz 2:
s=\sqrt{\dfrac{453.64}{11-1}}=6.74\ \
ragam=s^2={6.74}^2=45.36
Kesimpulan:
Berdasarkan nilai ragam dan standar deviasi, Quiz ke-2 lebih bervariasi dibandingkan dengan Quiz ke-1. (kesimpulannya berbeda dengan kesimpulan berdasarkan range)
Contoh 7
Hitung nilai standar deviasi dan ragam dari tabel frekuensi data tunggal berikut:
Noxifi
1705
2696
3453
4801
5561
Jumlah32016
Jawab:
Untuk kemudahan dalam perhitungan secara manual, kita gunakan formula standar deviasi berikut:
s=\sqrt{\dfrac{n\Sigma {f_ix}^2_i-{\left(\Sigma f_ix_i\right)}^2}{n(n-1)}}\ {\rm atau}\ s=\sqrt{\dfrac{\Sigma {f_ix}^2_i-\dfrac{{\left(\Sigma f_ix_i\right)}^2}{n}}{n-1}}
Selanjutnya kita buat tabel seperti pada tabel berikut:
Noxififi.xifi.xi2
170535024500
269641428566
34531356075
4801806400
5561563136
Jumlah32016103568677
Dari tabel tersebut didapat:
n = 16
mean = 1035/12 = 64.69
Standar deviasi:
s=\sqrt{\dfrac{{\rm 68677}-\dfrac{{\left({\rm 1035}\right)}^2}{16}}{16-1}}=10.72\
{\rm atau}\ s=\sqrt{\dfrac{16(68677)-{\left({\rm 1035}\right)}^2}{16(16-1)}}=10.72
{\rm Ragam}\ s^2={\left(10.72\right)}^2=115.03
Contoh 8
Hitung nilai standar deviasi dan ragam dari tabel frekuensi yang sudah dikelompokkan:
Tabel berikut ini adalah nilai ujian statistik 80 mahasiswa yang sudah disusun dalam tabel frekuensi. Berbeda dengan contoh di atas, pada contoh ini, tabel distribusi frekuensi dibuat dari data yang sudah dikelompokkan berdasarkan selang/kelas tertentu (banyak kelas = 7 dan panjang kelas = 10).
Kelas ke-Nilai Ujianfi
131 – 402
241 – 503
351 – 605
461 – 7013
571 – 8024
681 – 9021
791 – 10012
Jumlah80
Jawab:
Untuk kemudahan dalam perhitungan secara manual, kita gunakan formula standar deviasi berikut:
s=\sqrt{\dfrac{\Sigma {f_im}^2_i-\dfrac{{\left(\Sigma f_im_i\right)}^2}{n}}{n-1}}\ {\rm atau}\ \ s=\sqrt{\dfrac{n\Sigma {f_im}^2_i-{\left(\Sigma f_im_i\right)}^2}{n(n-1)}}
Selanjutnya kita buat daftar tabel berikut, tentukan nilai tengah kelas/pewakilnya (mi) dan lengkapi kolom berikutnya.
Kelas ke-Nilai Ujianfimifi.mifi.mi2
131 – 40235.571.02520.5
241 – 50345.5136.56210.8
351 – 60555.5277.515401.3
461 – 701365.5851.555773.3
571 – 802475.51812.0136806.0
681 – 902185.51795.5153515.3
791 – 1001295.51146.0109443.0
Jumlah80458.56090.0479670.0
Dari tabel tersebut didapat:
n = 80
mean = 6090/80 = 76.13
Standar deviasi dan ragam:
s=\sqrt{\dfrac{\Sigma {f_im}^2_i-\dfrac{{\left(\Sigma f_im_i\right)}^2}{n}}{n-1}}=\sqrt{\dfrac{{\rm 479670}-\dfrac{{\left({\rm 6090}\right)}^2}{80}}{80-1}}=77.92
{\rm atau}\ s=\sqrt{\dfrac{n\Sigma {f_im}^2_i-{\left(\Sigma f_im_i\right)}^2}{n(n-1)}}=\sqrt{\dfrac{80(479670)-{\left({\rm 6090}\right)}^2}{80(80-1)}}=77.92
{\rm Ragam}\ s^2={\left(77.92\right)}^2=6070.81
Contoh Tambahan:
Dengan cara yang sama seperti di atas, nilai standar deviasi untuk ketiga varietas:
Varietas I = 1.87
Varietas II = 9.49
Varietas III = 2.35

Simpangan Rata-rata (Mean Deviation)

Simpangan Rata-rata (Mean Deviation)

Simpangan rata-rata merupakan penyimpangan nilai-nilai individu dari nilai rata-ratanya. Rata-rata bisa berupa mean atau median. Untuk data mentah simpangan rata-rata dari median cukup kecil sehingga simpangan ini dianggap paling sesuai untuk data mentah. Namun pada umumnya, simpangan rata-rata yang dihitung dari mean yang sering digunakan untuk nilai simpangan rata-rata. Simpangan rata-rata dihitung dengan formula berikut:
Simpangan\ rata-rata=\dfrac{\Sigma (x_i-\overline{x})}{n}
Formula tersebut tentu memenuhi dua kriteria sebelumnya, dihitung dari semua data dan menunjukkan dispersi rata-rata dari mean, tetapi tidak memenuhi kriteria ketiga. Bagaimanapun dispersi dari data, semua perhitungan dengan rumus ini akan selalu menghasilkan nilai nol. Hal ini karena pembilang dari rumus di atas \Sigma (x_i-x)menunjukkan bahwa hasil penjumlahannya akan selalu sama dengan nol.
Terdapat dua cara untuk mengantisipasi masalah ini, keduanya akan menghilangkan tanda-tanda negatif dari perhitungan.
Cara pertama adalah dengan menggunakan formula berikut:
Sampel:
Simpangan\ rata-rata=\dfrac{\Sigma |x_i-\overline{x}|}{n}
Populasi:
Simpangan\ rata-rata=\dfrac{\Sigma |x_i-\mu |}{N}
Untuk data yang sudah disusun dalam bentuk tabel frekuensi:
Data Tunggal (tidak di grupkan berdasarkan selang kelas):
Simpangan\ rata-rata=\dfrac{\sum^{{\rm k}}_{{\rm i=1}}{f_i|x_i-\overline{x}|}}{\Sigma f_i}=\dfrac{\sum^{{\rm k}}_{{\rm i=1}}{f_i|x_i-\overline{x}|}}{n}
Data kelompok (sudah digrupkan berdasarkan selang tertentu):
Simpangan rata-rata yang dihitung dari distribusi frekuensi data yang dikelompokkan menggunakan nilai data perkiraan, bukan data aslinya. Data pewakil tersebut disimbolkan dengan m. Untuk membuat perhitungan dari data yang sudah dikelompokkan kita harus menganggap, bahwa semua nilai dalam sebuah kelas, sama dengan nilai pewakilnya (tanda kelasnya, mi). Selanjutnya, nilai perkiraan simpangan rata-rata dapat dihitung dengan menggunakan rumus:
Simpangan\ rata-rata\approx \dfrac{\sum^{{\rm k}}_{{\rm i=1}}{f_i|m_i-\overline{x}|}}{\Sigma f_i}=\dfrac{\sum^{{\rm k}}_{{\rm i=1}}{f_i|m_i-\overline{x}|}}{n}
Pada formula di atas, pembilangnya akan selalu bernilai positif, karena yang diambil adalah nilai mutlaknya, perhatikan tanda modulus || yang berarti baik hasilnya negatif ataupun positif akan selalu diperlakukan sebagai data positif.
Cara kedua adalah dengan menggunakan jumlah kuadrat dari semua nilai simpangan datanya. Cara ini dikenal dengan istilah Ragam (varians) dan standar deviasi.
Contoh 5
Tentukan nilai simpangan rata-rata pada Contoh 2.
Jawab:
Quiz I: rata-rata =18.27
Quiz 2: rata-rata = 10.82
NoQuiz 1(xi)x_i-\overline{x}\left|x_i-\overline{x}\right|
Quiz 2
(xi)
x_i-\overline{x}\left|x_i-\overline{x}\right|
11-17.2717.27
2-8.828.82
2201.731.73
3-7.827.82
3201.731.73
4-6.826.82
4201.731.73
5-5.825.82
5201.731.73
6-4.824.82
6201.731.73
143.183.18
7201.731.73
154.184.18
8201.731.73
165.185.18
9201.731.73
176.186.18
10201.731.73
187.187.18
11201.731.73
198.188.18


Jumlah34.55

Jumlah68.18
Quiz 1:
Simpangan\ rata-rata=\dfrac{\Sigma |x_i-\overline{x}|}{n}=\dfrac{34.55}{11}=3.141
Quiz 2:
Simpangan\ rata-rata=\dfrac{\Sigma |x_i-\overline{x}|}{n}=\dfrac{68.18}{11}=6.198
Kesimpulan:
Berdasarkan simpangan rata-rata, Quiz ke-2 lebih bervariasi dibandingkan dengan Quiz ke-1. (kesimpulannya berbeda dengan kesimpulan berdasarkan range)
Catatan:
Untuk menentukan simpangan rata-rata dari tabel frekuensi, caranya mirip dengan contoh 7 dan 8.
Contoh Tambahan:
Dengan cara yang sama seperti di atas, nilai simpangan rata-rata untuk ketiga varietas:
Varietas I = 1.2
Varietas II = 7.2
Varietas III = 2

Postingan Lebih Baru Postingan Lama Beranda