Pemusatan Data dan Sebaran Data

Pemusatan Data dan Sebaran Data

Pemusatan Data

Ukuran pemusatan data adalahnilai tunggal yang mewakili pusat distribusi kumpulan data, membantu arah data yang besar. Tiga ukuran utama yang digunakan adalah Mean (rata-rata), Median (nilai tengah), dan Modus (nilai paling sering muncul). Alat ini penting untuk menafsirkan data, membandingkan kumpulan data, dan memahami karakteristik utama populasi. [ 1 , 2 , 3 ]

Berikut adalah detail mengenai ukuran pemusatan data:

1. Rata-rata (Rata-rata)

Pengertian: Jumlah total nilai data dibagi dengan banyaknya data.
Rumus: $\bar{x} = \frac{\sum x}{n}$
Kelebihan: Menggunakan semua nilai dalam data dan mudah dihitung.
Kekurangan: Sangat sensitif terhadap outlier (nilai ekstrem). [ 1 , 2 ]

2. Median (Nilai Tengah)

Pengertian: Nilai tengah dari data yang telah diurutkan dari terkecil hingga terbesar.
Kelebihan: Tidak terpengaruh oleh outlier atau data ekstrem, cocok untuk data yang condong ( skewed ).
Kekurangan: Tidak menggunakan informasi dari seluruh data. [ 1 , 2 ]

3. Modus (Nilai yang Sering Muncul)

Pengertian: Nilai yang memiliki frekuensi tertinggi dalam kumpulan data.
Kelebihan: Sangat berguna untuk kategori data (kualitatif).
Kekurangan: Bisa tidak ada modus atau memiliki lebih dari satu modus (tidak unik). [ 1 , 2 ]

4. Ukuran Lainnya (Data Berkelompok)

Selain mean, median, dan modus, terdapat kuartil, desil, dan persentil yang digunakan untuk membagi data menjadi bagian-bagian yang lebih detail. [ 1 , 2 ]

Contoh Kasus:
Jika ada data nilai ujian: 70, 80, 80, 90, 100.

Rata-rata: $(70+80+80+90+100) \div 5 = 84$
Median: 80 (nilai di tengah)
Modus: 80 (paling sering muncul) [ 1 , 2 , 3 ]

Memilih antara mean, median, atau modus bergantung pada distribusi data dan tujuan analisis. [ 1 ]

Data Sebaran

Ukuran sebaran data (dispersi) adalahukuran yang menunjukkan seberapa jauh nilai-nilai data menyimpang dari nilai pusatnya (rata-rata/mean). Ukuran ini digunakan sebagai pelengkap ukuran pemusatan data (mean, median, modus) agar gambaran sekumpulan data menjadi lebih jelas dan tepat. [ 1 ]

Tujuan dan Manfaat Sebaran Data

Data distribusi Menilai.
Mengidentifikasi outlier atau pencilan.
Membandingkan distribusi dari beberapa kelompok data. [ 1 ]

Jenis-Jenis Ukuran Sebaran Data

Jangkauan (Range) :Selisih antara nilai tertinggi dan terendah dalam kumpulan data.
Varians (Ragam) :Rata-rata dari selisih data dengan nilai pusatnya.
Simpangan Baku (Standard Deviation) :Akar kuadrat dari varians, yang menunjukkan seberapa jauh data disebarkan dari rata-rata.
Deviasi Rata-rata (Mean Deviation) :Rata-rata hitung dari nilai deviasi mutlak antara nilai data observasi dengan rata-rata hitungnya.
Kuartil/Interkuartil :Mengukur penyebaran data di bagian tengah, seperti jangkauan antarkuartil.[1,2,3,4,5]

Pentingnya Sebaran Data
Menggunakan ukuran pusat saja tidak cukup dan dapat memutar. Ukuran sebaran membantu peneliti atau analis dalam mengambil keputusan yang lebih akurat, seperti yang dibahas pada materi statistika deskriptif di Ugm.ac.id . Analisis ini juga dapat dilakukan pada data tunggal maupun data berkelompok (kelompok bergolong).

Sering kali Statistika dianggap sebagai bahasa khusus untuk berkomunikasi terkait dengan data. Agar menjadi bahasa yang komunikatif, ia harus memberikan masukan data mentah yang valid, reliabel, dan representatif.
Sejak jaman dahulu Statistika sudah banyak digunakan dalam kehidupan sehari-hari dan dalam berbagai bidang, meskipun hanya sebatas penyajian data secara sederhana. Seiring perkembangan jaman, manusia dituntut untuk dapat menggunakan statistika dalam pengambilan keputusan.

Dua ukuran statistika yaitu, ukuran pemusatan data dan ukuran keragaman data, menjadi dasar penting dalam pengambilan keputusan tersebut. Ukuran pemusatan data merupakan suatu ukuran yang menunjukkan dimana data sedang dimuat. Sedangkan ukuran variasi data merupakan suatu ukuran untuk melihat bagaimana sebaran datanya.

Ukuran pemusatan data

Ukuran pemusatan data sering disebut juga ukuran pusat data atau tendensi sentral . Ukuran ini berupa satu nilai yang menggambarkan dimana data sedang memuat atau pusat data.
Beberapa ukuran yang dapat digunakan untuk menunjukkan pusat data diantaranya rata-rata, median, modus, trirata, dan rata-rata tengah.

Rata-rata ( berarti )

Misalkan $n$ observasi dilambangkan dengan $x_{1},x_{2},x_{3},...,x_{n}$ , maka rata-rata dari $n$ observasi tersebut dapat dihitung dengan
$\bar{x}=\frac{\sum_{i=1}^{n}x_{i}}{n}$

Median

Median merupakan nilai tengah data setelah data diurutkan.
Misalkan $n$ observasi dilambangkan dengan $x_{1},x_{2},x_{3},...,x_{n}$ , maka median data bisa dihitung dengan

$median=\frac{x_{\left ( \frac{n}{2} \right )}+x_{\left ( \frac{n}{2} \right )+1}}{2}$ , untuk $n$ genap.
$median=x_{\frac{n+1}{2}}$ , untuk $n$ ganjil.

Modus

Modus adalah nilai yang menunjukkan observasi pada satu set data yang paling sering muncul.

Trirata dan Rata-rata tengah

$Trirata=\frac{kuartil_{1}+2 kuartil_{2}+kuartil_{3}}{4}$
Rata-rata tengah merupakan rata-rata observasi yang berada di antara Q 1 dan Q 3 tetapi tidak termasuk Q 1 dan Q 3 itu sendiri.

Ukuran Keragaman Data

Ukuran keragaman data sering disebut juga ukuran sebaran data atau dispersion . Ukuran ini berupa satu nilai yang menggambarkan sebaran dari data. Beberapa ukuran yang dapat digunakan untuk menunjukkan sebaran data diantaranya jangkauan ( range ), variansi, deviasi standar.

- $jangkauan=data\: terbesar-data\: terkecil$ .
- Variansi data dapat dihitung dengan
  $S^{2}=\frac{\sum_{i=1}^{n}\left ( x_{i}-\bar{x} \right )^{2}}{n-1}$ .
- Deviasi standar dihitung dengan $S=\sqrt{S^{2}}$ .

Ukuran penyebaran adalah ukuran yang menyatakan seberapa jauh penyimpangan nilai-nilai data dari nilai-nilai pusatnya atau ukuran yang menyatakan seberapa banyak nilai-nilai data yang berbeda dengan nilai-nilai pusatnya. Dalam usaha membandingkan beberapa rangkaian data, penggunaan ukuran pusat data saja tidak akan memberikan hasil yang baik, bahkan dapat memberikan hasil yang menyesatkan (Kustituanto & Badrudin, 1994:94). Ukuran penyebaran pada dasarnya adalah pelengkap dari ukuran nilai pusat dalam menggambarkan sekumpulan data. Jadi, dengan adanya ukuran penyebaran maka penggambaran sekumpulan data akan menjadi lebih jelas dan tepat. Ukuran penyebaran membantu mengetahui sejauh mana suatu nilai menyebar dari nilai tengahnya, semakin kecil semakin besar.

1. Jangkauan / Range

Jangkauan atau range, adalah beda antara angka data terbesar dan angka data terkecil (Kustituanto & Badrudin, 1994:95). Cara mencari jangkauan dibedakan antara data tunggal dan data berkelompok.

a. Jangkauan data tunggal

Bila ada sekumpulan data tunggal X 1 , X2 . . ., Xn, maka jangkauannya adalah:

Jangkauan = 𝑋𝑛 − 𝑿𝟏

Contoh:

b. Jangkauan data berkelompok

Jangkauan pada data berkelompok adalah selisih antara batas atas dari kelas tertinggi dengan batas bawah dari kelas terendah

Contoh:

2. Deviasi Rata-Rata

Deviasi rata-rata adalah rata-rata hitung dari nilai mutlak deviasi antara nilai data pengamatan dengan rata-rata hitungnya. Deviasi rata-rata melibatkan data observasi dalam penghitungannya (Kustituanto & Badrudin, 1994:96). Dalam mencari deviasi rata-rata dapat dibedakan antara data tunggal dan data berkelompok.

a. Deviasi rata-rata data tunggal

Untuk data tunggal, deviasi rata-ratanya (MD) dapat dihitung dengan menggunakan rumus:

𝑀𝐷 = 1/𝑛 ∑|𝑋 − 𝑋̅| = (∑|𝑋 − 𝑋̅|) / n

Contoh:

𝑀𝐷 = 1/𝑛 ∑|𝑋 − 𝑋̅| = (∑|𝑋 − 𝑋̅|) / n

MD = 34 / 8 = 4,25

b. Deviasi rata-rata data berkelompok

Untuk data berkelompok (distribusi frekuensi), deviasi rata-ratanya dapat dihitung dengan rumus:

𝑀𝐷 = 1/𝑛 ∑𝑓 |𝑋 − 𝑋̅| = (∑ 𝑓 |𝑋 − 𝑋̅|) / n

Contoh:

𝑋̅ = (∑ 𝑓𝑥𝑖 ) / n = 9813.5 / 20 = 490,7

𝑀𝐷 = 1/𝑛 ∑𝑓 |𝑋 − 𝑋̅| = (∑ 𝑓 |𝑋 − 𝑋̅|) / n

= 2188,3 / 20 = 109,415

3. Varians

Varians adalah Rata-rata hitung dari deviasi kuadrat setiap data terhadap rata-rata hitungnya. Varians adalah alat ukur variabilitas serangkaian data yang dihitung dengan mencari rata-rata selisih/beda kuadrat antara data observasi dengan pusat datanya (Kustituanto & Badrudin, 1994:104). Varians untuk data populasi disimbolkan 𝜎2 (thou kuadrat) dan untuk data sampel disimbolkan dengan 𝑠2 (s kuadrat).

a. Varians data tunggal

Rumus untuk varians data tunggal adalah:

1) Untuk populasi (n>30)

𝜎2 = (∑(𝑋 − 𝜇)2) / 𝑛

2) Untuk sampel (n ≤ 30)

𝑠2 = (∑(𝑋 − 𝑋̅ )2) / (𝑛 − 1)

Contoh:

𝑋̅ = 26,4 / 8 = 3,32

𝑠2 = (∑(𝑋 − 𝑋̅)2) / (𝑛 − 1)

= 355,76 / 7

= 50,82

b. Varians data berkelompok

Selanjutnya untuk menghitung varians data berkelompok baik populasi maupun sampel dirumuskan sebagai berikut:

1) Untuk populasi (n>30)

𝜎2 = (∑ 𝑓. (𝑋 − 𝜇)2) / 𝑛

2) Untuk sampel (n ≤ 30)

𝑠2 = (∑ 𝑓. (𝑋 − 𝑋̅)2) / (𝑛 − 1)

Contoh:

Tentukan varians dari distribusi frekuensi berikut:

Tabel 4.4 Pengukuran Diameter Pipa

4. Standar Deviasi

Ukuran variabilitas yang sering digunakan adalah simpangan baku atau standar deviasi (Kustituanto & Badrudin, 1994:110).

Standar Deviasi adalah akar dari varians. Untuk menentukan nilai standar deviasi, caranya:

𝜎 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑠

a. Simpangan baku data tunggal

Untuk data tunggal, baik populasi maupun sampel dapat dirumuskan sebagai berikut:

1) Untuk populasi (n>30)

𝜎 = √ (∑(𝑋 − 𝜇)2 / 𝑛)

2) Untuk sampel (n ≤ 30)

𝑠 = √ {∑(𝑋 − 𝑋̅)2 / (𝑛 − 1)}

Contoh:

b. Simpangan baku data berkelompok

Untuk data berkelompok dapat dirumuskan seperti berikut:

1) Untuk populasi (n > 30)

𝜎 = √ (∑ 𝑓(𝑋 − 𝜇)2 / 𝑛)

2) Untuk sampel (n ≤ 30)

𝑠 = √ {∑ 𝑓(𝑋 − 𝜇)2 / (𝑛 − 1)}

Contoh:

5. Ukuran Penyebaran Relatif

a. Koefisien Jangkauan

Rumus untuk menentukan koefisien range adalah:

KR = [(La – Lb)/(La+Lb)] x 100%

Contoh:

Koefisien Range Harga Saham = [(878-160) / (878+160)] x 100% = 69,17%.

Jadi jarak nilai terendah dan tertinggi harga saham adalah 69,17%.

b. Koefisien Deviasi Rata-rata

Rumus untuk menentukan koefisien diviasi rata-rata adalah:

KMD = (MD / X) x 100%

Contoh:

Pertumbuhan ekonomi negara maju = (0,56/2,6) x 100% = 19,23% Jadi penyebaran pertumbuhan ekonomi dari nilai tengahnya sebesar 19,23%, bandingkan dengan Indonesia yang sebesar 130,30%.

c. Koefisien Standar Deviasi

Rumus untuk menentukan standar deviasi adalah:

KSD = (S / X) x 100%

Contoh:

Pertumbuhan ekonomi negara maju = (0,55/2,5) x 100% = 22%. Jadi koefisien standar deviasi pertumbuhan ekonomi negara maju sebesar 22%, bandingkan dengan Indonesia yang sebesar 42%.

6. Teorema Chebyshev

Bila suatu sebaran data hasil pengukuran maupun pengamatan memiliki nilai simpangan baku kecil maka dapat diduga bahwa sebagian besar data berada di sekitar nilai tengahnya dan jika nilai simpangan bakunya besar maka pengamatan menyebar dan tidak berkumpul di sekitar nilai tengahnya. Ahli matematika berkebangsaan Rusia, P.L Chebyshev (1821-1894) menemukan bahwa proporsi pengukuran yang jatuh antara dua nilai yang setangkup terhadap nilai tengahnya memiliki hubungan dengan simpangan bakunya. Teorema Chebyshev memberikan suatu dugaan terhadap proporsi data yang terletak dalam k simpangan baku dari nilai tengah data, untuk suatu bilangan k tertentu.

Keuntungan dari teorema ini adalah penerapannya yang bersifat umum yaitu berlaku untuk sembarang sebaran data, sedangkan kelemahannya adalah teorema ini memberikan nilai yang hanya merupakan batas bawahnya saja (Wirawan, 2016:155).

Sekurang-kurangnya {1 - (1/k2)} bagian data terletak dalam k simpangan baku dari nilai tengahnya.

Misalkan k = 2, maka sekurang-kurangnya 3/4 data terletak dalam batas-batas 2 simpangan baku dari nilai tengahnya dengan selang 𝜇 ± 2𝜎, apabila sampel maka 3/4 bagian terletak dalam selang 𝑥̅± 2𝑠.

Teorema Chebyshev berlaku untuk semua bentuk distribusi frekuensi, namun apabila kurva berbentuk kurva normal, yaitu kurva yang berbentuk simetris, dengan distribusi frekuensi berbentuk lonceng diperkirakan:

a) 68% data berada pada kisaran rata-rata hitung ditambahkan satu kali standar deviasi (𝑋̅ ± 1𝑠)

b) 95% data berada pada kisaran rata-rata hitung ditambahkan dua kali standar deviasi (𝑋̅ ± 2𝑠)

c) Semua data atau 99,7% akan berada pada kisaran rata-rata hitung + tiga kali standar deviasi (𝑋̅ ± 3𝑠)

Gambar 1. Diagram Poligon Hukum Empirik

Kaidah tersebut berlaku untuk sampel juga. Bila diberlakukan terhadap sampel, maka rata-rata dan simpangan bakunya menyesuaikan dengan rata-rata sampel (𝑥̅) dan simpangan baku sampel (s) (Wirawan, 2016:157).

Contoh soal:

Iklan produk merek A pada stasiun televisi rata-rata penyiaranya adalah 40 detik dengan simpangan baku 5 detik. Menggunakan teorema Chebyshev, tentukanlah proporsiikan yang berlangsung dari 30 sampai 50 detik.

Penyelesaian:

Diketahui: 𝑥̅= 40, 𝑠 = 5 , Interval 30 sampai 50 detik, berarti nilai bawah dari 𝑥̅± 𝑘𝑠 adalah 30 dan nilai atasnya adalah 50. Ambil nilai bawahnya dan dapat dihitung sebagai berikut:

𝑥̅− 𝑘𝑠 = 30

40 − 𝑘5 = 30

−5𝑘 = −30

𝑘 = 2 , sehingga {1 − (1/𝑘2)} = 3/4

Jadi, sekurang-kurangnya 3/4 bagian atau 75% dari total iklan tersebut berlangsung dari 30 sampai 50 detik.

7. Ukuran Penyebaran Lainnya

a) Jangkauan Antar Kuartil

Ukuran ini dihitung dengan cara menentukan beda antara kuartil ketiga dan kuartil pertama (Kustituanto & Badrudin, 1994:96). Rumus dari jangkauan antar kuartil adalah:

𝑄3 − 𝑄1

Contoh soal:

b) Deviasi Kuartil (Simpangan Kuartil)

Deviasi kuartil atau simpangan kuartil dapat disebut juga jangkauan semi interkuartil. Deviasi kuartil mengukur variabilitas data dengan menentukan rata-rata hitung inter kuartilnya (Kustituanto & Badrudin, 1994:97) Rumus dari deviasi kuartil :

(𝑄3 − 𝑄1) / 2

Contoh soal:

8. Ukuran Kecondongan

Ukuran kecondongan atau Skewness merupakan tingkat ketidaksimetrisan atau kejauhan simetri dari sebuah distribusi. Sebuah distribusi yang tidak simetris akan memiliki rata-rata, median, dan modus yang tidak sama besarnya (Mean ≠ Median ≠ Modus), sehingga distribusi akan terkonsentrasi pada salah satu sisi dan kurvanya akan condong.

Gambar 2. Bentuk Kecondongan Kurva

Menentukan kecondongan menggunakan rumus yaitu:

𝑆𝑘 = {(𝜇−𝑀𝑜) / 𝜎}

atau 𝑆𝑘 = {3(𝜇−𝑀𝑑) / 𝜎}

Keterangan:

Sk = Nilai kecondongan

𝜇 = Rata-rata

Mo = Modus

Md = Median

𝜎 = Simpangan baku

Nilai Sk akan berkisar dari -3 sampai +3, apabila nilai Sk negatif menunjukkan kurva condong ke kanan (condong negatif), apabila Sk positif menunjukkan kurva condong ke kiri (condong positif). Nilai yang mendekati nol maka distribusi frekuensi tersebut semakin simetris, bila koefisien kecondongan positif, ekor kanan distribusi frekuensinya lebih panjang dari ekor kirinya, bila koefisien kecondongan negative, ekor kiri distribusi frekuensinya lebih panjang dari ekor kanannya (Wirawan, 2016:168).

Contoh Soal:

9. Ukuran Keruncingan

Keruncingan atau kurtosis adalah tingkat kepuncakan dari sebuah distribusi yang biasanya diambil secara relative terhadap suatu distribusi normal.

Ukuran keruncingan (kurtosis) sekumpulan data atu suatu distribusi adalah suatu ukuran yang dapat digunakan untuk menentukan runcing tidaknya kurva suatu distribusi.

Gambar 3. Grafik Keruncingan Kurva

Rumus untuk mencari koefisien keruncingan adalah:

𝛼4 = {1/𝑛 ∑(𝑥−𝜇)4} / 𝜎4

Keterangan:

𝛼4 = Koefisien keruncingan

𝑥 = Data ke x

𝜇 = Rata-rata

n = Banyak data

𝜎4 = Hasil pangkat 4 dari simpangan baku.

Jenis-jenis keruncingan kurva ada tiga, yaitu:

a) Leptokurtis = Sangat runcing (𝛼4 > 3)

b) Mesokurtis = Keruncingan sedang (𝛼4 = 3)

c) Platikurtis = Kurva datar (𝛼4 < 3)

Contoh soal:

10. Penggunaan pada Microsoft Excel

Penggunaan aplikasi dalam pengolahan data menjadi hal yang penting saat ingin mengolah data yang tergolong banyak. Microsoft Excel menjadi salah satu aplikasi yang dapat mempermudah perhitungan atau pengolahan data. Langkah-langkah penggunaan Microsoft Excel dalam mencari ukuran penyebaran data adalah:

a) Masukkan data yang ingin dicari ukuran penyebarannya ke Ms excel. Misalkan data terletak pada kolom A dengan baris 2 hingga 11.

b) Ketikkan =stdev.p(a2:a11) untuk mencari standar deviasi data populasi dan =stdev.s(a2:a11) untuk mencari standar deviasi data sampel dimana hasilnya akan muncul di sel tersebut.

Gambar 4. Contoh Penggunaan pada Microsoft Excel

Gambar diatas mencari standar deviasi pada data populasi sehingga digunakan rumus =stdev.p(b2:b9) dan seterusnya. Untuk mencari nilai dengan bentuk persen bisa menambahkan =stdev.o(b2:b9)*100, sehingga merujuk gambar diatas, didapatkan nilai standar deviasi kolom B adalah 49,2% dan seterusnya.

Contoh soal:

DAFTAR PUSTAKA

1. Kustituanto, B., & Badrudin, R. (1994). Statistika 1 (Deskriptif). Penerbit Gunadarma.

2. Wirawan, N. (2016). Cara Mudah Memahami STATISTIKA EKONOMI dan BISNIS (STATISTIKA DESKRIPTIF). Keraras Emas.

Search This Blog

Transformasi Digital

Pemusatan Data dan Sebaran Data

Comments

Post a Comment

Popular posts from this blog

IT Dev

cara menginstal dan menggunakan npm dotenv