Pemusatan Data dan Sebaran Data
Pemusatan Data
Ukuran pemusatan data adalahnilai tunggal yang mewakili pusat distribusi kumpulan data, membantu arah data yang besar. Tiga ukuran utama yang digunakan adalah Mean (rata-rata), Median (nilai tengah), dan Modus (nilai paling sering muncul). Alat ini penting untuk menafsirkan data, membandingkan kumpulan data, dan memahami karakteristik utama populasi. [ 1 , 2 , 3 ] Berikut adalah detail mengenai ukuran pemusatan data:
1. Rata-rata (Rata-rata)
- Pengertian: Jumlah total nilai data dibagi dengan banyaknya data.
- Rumus: \(\bar{x} = \frac{\sum x}{n}\)
- Kelebihan: Menggunakan semua nilai dalam data dan mudah dihitung.
- Kekurangan: Sangat sensitif terhadap outlier (nilai ekstrem). [ 1 , 2 ]
2. Median (Nilai Tengah)
- Pengertian: Nilai tengah dari data yang telah diurutkan dari terkecil hingga terbesar.
- Kelebihan: Tidak terpengaruh oleh outlier atau data ekstrem, cocok untuk data yang condong ( skewed ).
- Kekurangan: Tidak menggunakan informasi dari seluruh data. [ 1 , 2 ]
3. Modus (Nilai yang Sering Muncul)
- Pengertian: Nilai yang memiliki frekuensi tertinggi dalam kumpulan data.
- Kelebihan: Sangat berguna untuk kategori data (kualitatif).
- Kekurangan: Bisa tidak ada modus atau memiliki lebih dari satu modus (tidak unik). [ 1 , 2 ]
4. Ukuran Lainnya (Data Berkelompok)
- Selain mean, median, dan modus, terdapat kuartil, desil, dan persentil yang digunakan untuk membagi data menjadi bagian-bagian yang lebih detail. [ 1 , 2 ]
Contoh Kasus:
Jika ada data nilai ujian: 70, 80, 80, 90, 100.
- Rata-rata: \((70+80+80+90+100) \div 5 = 84\)
- Median: 80 (nilai di tengah)
- Modus: 80 (paling sering muncul) [ 1 , 2 , 3 ]
Memilih antara mean, median, atau modus bergantung pada distribusi data dan tujuan analisis. [ 1 ]
Data Sebaran
Ukuran sebaran data (dispersi) adalahukuran yang menunjukkan seberapa jauh nilai-nilai data menyimpang dari nilai pusatnya (rata-rata/mean). Ukuran ini digunakan sebagai pelengkap ukuran pemusatan data (mean, median, modus) agar gambaran sekumpulan data menjadi lebih jelas dan tepat. [ 1 ]
Tujuan dan Manfaat Sebaran Data
- Data distribusi Menilai.
- Mengidentifikasi outlier atau pencilan.
- Membandingkan distribusi dari beberapa kelompok data. [ 1 ]
Jenis-Jenis Ukuran Sebaran Data
- Jangkauan (Range) :Selisih antara nilai tertinggi dan terendah dalam kumpulan data.
- Varians (Ragam) :Rata-rata dari selisih data dengan nilai pusatnya.
- Simpangan Baku (Standard Deviation) :Akar kuadrat dari varians, yang menunjukkan seberapa jauh data disebarkan dari rata-rata.
- Deviasi Rata-rata (Mean Deviation) :Rata-rata hitung dari nilai deviasi mutlak antara nilai data observasi dengan rata-rata hitungnya.
- Kuartil/Interkuartil :Mengukur penyebaran data di bagian tengah, seperti jangkauan antarkuartil.[1,2,3,4,5]
Pentingnya Sebaran Data Menggunakan ukuran pusat saja tidak cukup dan dapat memutar. Ukuran sebaran membantu peneliti atau analis dalam mengambil keputusan yang lebih akurat, seperti yang dibahas pada materi statistika deskriptif di Ugm.ac.id . Analisis ini juga dapat dilakukan pada data tunggal maupun data berkelompok (kelompok bergolong).
Sering kali Statistika dianggap sebagai bahasa khusus untuk berkomunikasi terkait dengan data. Agar menjadi bahasa yang komunikatif, ia harus memberikan masukan data mentah yang valid, reliabel, dan representatif.
Sejak jaman dahulu Statistika sudah banyak digunakan dalam kehidupan sehari-hari dan dalam berbagai bidang, meskipun hanya sebatas penyajian data secara sederhana. Seiring perkembangan jaman, manusia dituntut untuk dapat menggunakan statistika dalam pengambilan keputusan.
Dua ukuran statistika yaitu, ukuran pemusatan data dan ukuran keragaman data, menjadi dasar penting dalam pengambilan keputusan tersebut. Ukuran pemusatan data merupakan suatu ukuran yang menunjukkan dimana data sedang dimuat. Sedangkan ukuran variasi data merupakan suatu ukuran untuk melihat bagaimana sebaran datanya.
Ukuran pemusatan data
Ukuran pemusatan data sering disebut juga ukuran pusat data atau tendensi sentral . Ukuran ini berupa satu nilai yang menggambarkan dimana data sedang memuat atau pusat data.
Beberapa ukuran yang dapat digunakan untuk menunjukkan pusat data diantaranya rata-rata, median, modus, trirata, dan rata-rata tengah.
Rata-rata ( berarti )
Misalkan
observasi dilambangkan dengan
, maka rata-rata dari
observasi tersebut dapat dihitung dengan

Median
Median merupakan nilai tengah data setelah data diurutkan.
Misalkan
observasi dilambangkan dengan
, maka median data bisa dihitung dengan
, untuk
genap.
, untuk
ganjil.
Modus
Modus adalah nilai yang menunjukkan observasi pada satu set data yang paling sering muncul.
Trirata dan Rata-rata tengah

Rata-rata tengah merupakan rata-rata observasi yang berada di antara Q 1 dan Q 3 tetapi tidak termasuk Q 1 dan Q 3 itu sendiri.
Ukuran Keragaman Data
Ukuran keragaman data sering disebut juga ukuran sebaran data atau dispersion . Ukuran ini berupa satu nilai yang menggambarkan sebaran dari data. Beberapa ukuran yang dapat digunakan untuk menunjukkan sebaran data diantaranya jangkauan ( range ), variansi, deviasi standar.
.- Variansi data dapat dihitung dengan
. - Deviasi standar dihitung dengan
.
Ukuran penyebaran adalah ukuran yang menyatakan seberapa jauh penyimpangan nilai-nilai data dari nilai-nilai pusatnya atau ukuran yang menyatakan seberapa banyak nilai-nilai data yang berbeda dengan nilai-nilai pusatnya. Dalam usaha membandingkan beberapa rangkaian data, penggunaan ukuran pusat data saja tidak akan memberikan hasil yang baik, bahkan dapat memberikan hasil yang menyesatkan (Kustituanto & Badrudin, 1994:94). Ukuran penyebaran pada dasarnya adalah pelengkap dari ukuran nilai pusat dalam menggambarkan sekumpulan data. Jadi, dengan adanya ukuran penyebaran maka penggambaran sekumpulan data akan menjadi lebih jelas dan tepat. Ukuran penyebaran membantu mengetahui sejauh mana suatu nilai menyebar dari nilai tengahnya, semakin kecil semakin besar.
1. Jangkauan / Range
Jangkauan atau range, adalah beda antara angka data terbesar dan angka data terkecil (Kustituanto & Badrudin, 1994:95). Cara mencari jangkauan dibedakan antara data tunggal dan data berkelompok.
a. Jangkauan data tunggal
Bila ada sekumpulan data tunggal X 1 , X2 . . ., Xn, maka jangkauannya adalah:
Jangkauan = ππ − πΏπ
Contoh:
b. Jangkauan data berkelompok
Jangkauan pada data berkelompok adalah selisih antara batas atas dari kelas tertinggi dengan batas bawah dari kelas terendah
Contoh:
2. Deviasi Rata-Rata
Deviasi rata-rata adalah rata-rata hitung dari nilai mutlak deviasi antara nilai data pengamatan dengan rata-rata hitungnya. Deviasi rata-rata melibatkan data observasi dalam penghitungannya (Kustituanto & Badrudin, 1994:96). Dalam mencari deviasi rata-rata dapat dibedakan antara data tunggal dan data berkelompok.
a. Deviasi rata-rata data tunggal
Untuk data tunggal, deviasi rata-ratanya (MD) dapat dihitung dengan menggunakan rumus:
ππ· = 1/π ∑|π − π̅| = (∑|π − π̅|) / n
Contoh:
ππ· = 1/π ∑|π − π̅| = (∑|π − π̅|) / n
MD = 34 / 8 = 4,25
b. Deviasi rata-rata data berkelompok
Untuk data berkelompok (distribusi frekuensi), deviasi rata-ratanya dapat dihitung dengan rumus:ππ· = 1/π ∑π |π − π̅| = (∑ π |π − π̅|) / n
Contoh:
π̅ = (∑ ππ₯π ) / n = 9813.5 / 20 = 490,7
ππ· = 1/π ∑π |π − π̅| = (∑ π |π − π̅|) / n
= 2188,3 / 20 = 109,415
3. Varians
Varians adalah Rata-rata hitung dari deviasi kuadrat setiap data terhadap rata-rata hitungnya. Varians adalah alat ukur variabilitas serangkaian data yang dihitung dengan mencari rata-rata selisih/beda kuadrat antara data observasi dengan pusat datanya (Kustituanto & Badrudin, 1994:104). Varians untuk data populasi disimbolkan π2 (thou kuadrat) dan untuk data sampel disimbolkan dengan π 2 (s kuadrat).
a. Varians data tunggal
Rumus untuk varians data tunggal adalah:
1) Untuk populasi (n>30)
π2 = (∑(π − π)2) / π
π 2 = (∑(π − π̅ )2) / (π − 1)
Contoh:
π̅ = 26,4 / 8 = 3,32
π 2 = (∑(π − π̅)2) / (π − 1)
= 355,76 / 7
= 50,82
b. Varians data berkelompok
Selanjutnya untuk menghitung varians data berkelompok baik populasi maupun sampel dirumuskan sebagai berikut:
1) Untuk populasi (n>30)
π2 = (∑ π. (π − π)2) / π
π 2 = (∑ π. (π − π̅)2) / (π − 1)
Contoh:
Tentukan varians dari distribusi frekuensi berikut:
Tabel 4.4 Pengukuran Diameter Pipa
4. Standar Deviasi
Ukuran variabilitas yang sering digunakan adalah simpangan baku atau standar deviasi (Kustituanto & Badrudin, 1994:110).
Standar Deviasi adalah akar dari varians. Untuk menentukan nilai standar deviasi, caranya:
π = √π£ππππππ
a. Simpangan baku data tunggal
Untuk data tunggal, baik populasi maupun sampel dapat dirumuskan sebagai berikut:
1) Untuk populasi (n>30)
π = √ (∑(π − π)2 / π)
π = √ {∑(π − π̅)2 / (π − 1)}
Contoh:
b. Simpangan baku data berkelompok
Untuk data berkelompok dapat dirumuskan seperti berikut:
1) Untuk populasi (n > 30)
π = √ (∑ π(π − π)2 / π)
2) Untuk sampel (n ≤ 30)
π = √ {∑ π(π − π)2 / (π − 1)}
Contoh:
5. Ukuran Penyebaran Relatif
a. Koefisien Jangkauan
Rumus untuk menentukan koefisien range adalah:
KR = [(La – Lb)/(La+Lb)] x 100%
Contoh:
Koefisien Range Harga Saham = [(878-160) / (878+160)] x 100% = 69,17%.
Jadi jarak nilai terendah dan tertinggi harga saham adalah 69,17%.
b. Koefisien Deviasi Rata-rata
Rumus untuk menentukan koefisien diviasi rata-rata adalah:
Contoh:
Pertumbuhan ekonomi negara maju = (0,56/2,6) x 100% = 19,23% Jadi penyebaran pertumbuhan ekonomi dari nilai tengahnya sebesar 19,23%, bandingkan dengan Indonesia yang sebesar 130,30%.
c. Koefisien Standar Deviasi
Rumus untuk menentukan standar deviasi adalah:
Contoh:
Pertumbuhan ekonomi negara maju = (0,55/2,5) x 100% = 22%. Jadi koefisien standar deviasi pertumbuhan ekonomi negara maju sebesar 22%, bandingkan dengan Indonesia yang sebesar 42%.
6. Teorema Chebyshev
Bila suatu sebaran data hasil pengukuran maupun pengamatan memiliki nilai simpangan baku kecil maka dapat diduga bahwa sebagian besar data berada di sekitar nilai tengahnya dan jika nilai simpangan bakunya besar maka pengamatan menyebar dan tidak berkumpul di sekitar nilai tengahnya. Ahli matematika berkebangsaan Rusia, P.L Chebyshev (1821-1894) menemukan bahwa proporsi pengukuran yang jatuh antara dua nilai yang setangkup terhadap nilai tengahnya memiliki hubungan dengan simpangan bakunya. Teorema Chebyshev memberikan suatu dugaan terhadap proporsi data yang terletak dalam k simpangan baku dari nilai tengah data, untuk suatu bilangan k tertentu.
Keuntungan dari teorema ini adalah penerapannya yang bersifat umum yaitu berlaku untuk sembarang sebaran data, sedangkan kelemahannya adalah teorema ini memberikan nilai yang hanya merupakan batas bawahnya saja (Wirawan, 2016:155).
Sekurang-kurangnya {1 - (1/k2)} bagian data terletak dalam k simpangan baku dari nilai tengahnya.
Misalkan k = 2, maka sekurang-kurangnya 3/4 data terletak dalam batas-batas 2 simpangan baku dari nilai tengahnya dengan selang π ± 2π, apabila sampel maka 3/4 bagian terletak dalam selang π₯̅± 2π .
Teorema Chebyshev berlaku untuk semua bentuk distribusi frekuensi, namun apabila kurva berbentuk kurva normal, yaitu kurva yang berbentuk simetris, dengan distribusi frekuensi berbentuk lonceng diperkirakan:
a) 68% data berada pada kisaran rata-rata hitung ditambahkan satu kali standar deviasi (π̅ ± 1π )
b) 95% data berada pada kisaran rata-rata hitung ditambahkan dua kali standar deviasi (π̅ ± 2π )
c) Semua data atau 99,7% akan berada pada kisaran rata-rata hitung + tiga kali standar deviasi (π̅ ± 3π )
Gambar 1. Diagram Poligon Hukum Empirik
Kaidah tersebut berlaku untuk sampel juga. Bila diberlakukan terhadap sampel, maka rata-rata dan simpangan bakunya menyesuaikan dengan rata-rata sampel (π₯̅) dan simpangan baku sampel (s) (Wirawan, 2016:157).
Contoh soal:
Iklan produk merek A pada stasiun televisi rata-rata penyiaranya adalah 40 detik dengan simpangan baku 5 detik. Menggunakan teorema Chebyshev, tentukanlah proporsiikan yang berlangsung dari 30 sampai 50 detik.
Penyelesaian:
Diketahui: π₯̅= 40, π = 5 , Interval 30 sampai 50 detik, berarti nilai bawah dari π₯̅± ππ adalah 30 dan nilai atasnya adalah 50. Ambil nilai bawahnya dan dapat dihitung sebagai berikut:
π₯̅− ππ = 30
40 − π5 = 30
−5π = −30
π = 2 , sehingga {1 − (1/π2)} = 3/4
Jadi, sekurang-kurangnya 3/4 bagian atau 75% dari total iklan tersebut berlangsung dari 30 sampai 50 detik.
7. Ukuran Penyebaran Lainnya
a) Jangkauan Antar Kuartil
Ukuran ini dihitung dengan cara menentukan beda antara kuartil ketiga dan kuartil pertama (Kustituanto & Badrudin, 1994:96). Rumus dari jangkauan antar kuartil adalah:
Contoh soal:
b) Deviasi Kuartil (Simpangan Kuartil)
Deviasi kuartil atau simpangan kuartil dapat disebut juga jangkauan semi interkuartil. Deviasi kuartil mengukur variabilitas data dengan menentukan rata-rata hitung inter kuartilnya (Kustituanto & Badrudin, 1994:97) Rumus dari deviasi kuartil :
Contoh soal:
8. Ukuran Kecondongan
Ukuran kecondongan atau Skewness merupakan tingkat ketidaksimetrisan atau kejauhan simetri dari sebuah distribusi. Sebuah distribusi yang tidak simetris akan memiliki rata-rata, median, dan modus yang tidak sama besarnya (Mean ≠ Median ≠ Modus), sehingga distribusi akan terkonsentrasi pada salah satu sisi dan kurvanya akan condong.
Gambar 2. Bentuk Kecondongan Kurva
Menentukan kecondongan menggunakan rumus yaitu:
ππ = {(π−ππ) / π}
atau ππ = {3(π−ππ) / π}
Keterangan:
Sk = Nilai kecondongan
π = Rata-rata
Mo = Modus
Md = Median
π = Simpangan baku
Nilai Sk akan berkisar dari -3 sampai +3, apabila nilai Sk negatif menunjukkan kurva condong ke kanan (condong negatif), apabila Sk positif menunjukkan kurva condong ke kiri (condong positif). Nilai yang mendekati nol maka distribusi frekuensi tersebut semakin simetris, bila koefisien kecondongan positif, ekor kanan distribusi frekuensinya lebih panjang dari ekor kirinya, bila koefisien kecondongan negative, ekor kiri distribusi frekuensinya lebih panjang dari ekor kanannya (Wirawan, 2016:168).
Contoh Soal:
9. Ukuran Keruncingan
Keruncingan atau kurtosis adalah tingkat kepuncakan dari sebuah distribusi yang biasanya diambil secara relative terhadap suatu distribusi normal.
Ukuran keruncingan (kurtosis) sekumpulan data atu suatu distribusi adalah suatu ukuran yang dapat digunakan untuk menentukan runcing tidaknya kurva suatu distribusi.
Gambar 3. Grafik Keruncingan Kurva
Rumus untuk mencari koefisien keruncingan adalah:
πΌ4 = {1/π ∑(π₯−π)4} / π4
Keterangan:
πΌ4 = Koefisien keruncingan
π₯ = Data ke x
π = Rata-rata
n = Banyak data
π4 = Hasil pangkat 4 dari simpangan baku.
Jenis-jenis keruncingan kurva ada tiga, yaitu:
a) Leptokurtis = Sangat runcing (πΌ4 > 3)
b) Mesokurtis = Keruncingan sedang (πΌ4 = 3)
c) Platikurtis = Kurva datar (πΌ4 < 3)
Contoh soal:
10. Penggunaan pada Microsoft Excel
Penggunaan aplikasi dalam pengolahan data menjadi hal yang penting saat ingin mengolah data yang tergolong banyak. Microsoft Excel menjadi salah satu aplikasi yang dapat mempermudah perhitungan atau pengolahan data. Langkah-langkah penggunaan Microsoft Excel dalam mencari ukuran penyebaran data adalah:
a) Masukkan data yang ingin dicari ukuran penyebarannya ke Ms excel. Misalkan data terletak pada kolom A dengan baris 2 hingga 11.
b) Ketikkan =stdev.p(a2:a11) untuk mencari standar deviasi data populasi dan =stdev.s(a2:a11) untuk mencari standar deviasi data sampel dimana hasilnya akan muncul di sel tersebut.
Gambar 4. Contoh Penggunaan pada Microsoft Excel
Gambar diatas mencari standar deviasi pada data populasi sehingga digunakan rumus =stdev.p(b2:b9) dan seterusnya. Untuk mencari nilai dengan bentuk persen bisa menambahkan =stdev.o(b2:b9)*100, sehingga merujuk gambar diatas, didapatkan nilai standar deviasi kolom B adalah 49,2% dan seterusnya.
Contoh soal:
DAFTAR PUSTAKA
1. Kustituanto, B., & Badrudin, R. (1994). Statistika 1 (Deskriptif). Penerbit Gunadarma.
2. Wirawan, N. (2016). Cara Mudah Memahami STATISTIKA EKONOMI dan BISNIS (STATISTIKA DESKRIPTIF). Keraras Emas.
Comments
Post a Comment