Kamis, 14 Maret 2019

Ukuran Dispersi Data


Pertemuan Keenam Statistika (UKURAN DISPERSI DATA)
Setelah mempelajari pokok bahasan ini, pembaca diharapkan mampu:

Mendefinisikan dan menjelaskan pengertian dispersi data.
Mendefinisikan dan menjelaskan jenis-jenis ukuran dispersi.
Menghitung dan menggunakan rumus-rumus ukuran dispersi.
Mendefinisikan dan menjelaskan koefisien variasi data.
Mendefinisikan dan menjelaskan keruncingan dan kemiringan kurva.
Mendefiniskan dan menjelaskan jenis-jenis keruncingan (kurtosis) dan kemencengan (skewness) kurva.

Oleh: Rachmat Ferdianto

Pengertian Dispersi



            Dalam kehidupan sehari-hari kita sering mendengar orang menyebutkan data statistik. Rata-rata upah karyawan perusahaan Rp.2.000.0000 per bulan, rata-rata jumlah mahasiswa baru Raharja 1000 mahasiswa per tahun ajaran baru. Setiap kali kita mendengar rata-rata, maka secara otomatis kita membayangkan sekelompok nilai di sekitar rata-rata tersebut. Ada yang sama dengan rata-rata, ada yang lebih kecil, dan ada yang lebih besar dari rata-rata tersebut. Dengan kata lain, ada variasi atau dispersi dari nilai-nilai tersebut, baik terhadap nilai lainnya maupun terhadap rata-ratanya.          Ukuran dispersi atau ukuran variasi atau ukuran penyimpangan adalah ukuran yang menyatakan seberapa jauh penyimpangan nilai-nilai data dari nilai-nilai pusatnya atau ukuran yang menyatakan seberapa banyak nilai-nilai data yang berbeda dengan nilai-nilai pusatnya.

            Ukuran variabilitas adalah sebuah ukuran derajat penyebaran nilai-nilai variabel dari suatu ukuran pemusatan data dalam sebuah distribusi. Dua kelompok distribusi data dapat memiliki nilai ukuran pemusatan yang sama, akan tetapi derajat penyebarannya bisa jadi sangat berbeda. Misalnya kita memiliki data yang berasal dari dua kelompok individu yang berbeda. Data kelompok individu A : 24, 24, 25, 25, 25, 26, 26, diperoleh mean sebesar 25. Dan data dari kelompok individu B : 16, 19, 22, 25, 28, 30, 35, diperoleh mean sebesar 25.

            Nilai tendensi sentral dalam dua distribusi A dan B tersebut di atas adalah sama yaitu keduanya memiliki harga rata-rata = 25. Namun demikian apabila dilihat dari keragaman dan penyebaran nilai dari kedua distribussi tersebut tampak sangat berbeda. Dimana penyebaran nilai-nilai dalam distribusi A terlihat lebih homogen dibanding distribusi B. Sebaliknya penyebaran nilai dalam distribusi B lebih beragam atau heterogen dibanding penyebaran nilai dalam distribusi A. Hal ini diperlukan suatu indeks yang tidak saja dapat memberikan gambaran ringkas mengenai suatu distribusi (melalui suatu ukuran pemusatan data atau ukuran tendensi sentral), melainkan juga diperlukan suatu ukuran yang dapat memberikan gambaran berdasarkan keragaman nilai-nilai dalam suatu distribusi.

Ukuran dispersi pada dasarnya adalah pelengkap dari ukuran nilai pusat dalam menggambarkan sekumpulan data. Jadi, dengan adanya ukuran dispersi maka penggambaran sekumpulan data akan menjadi lebih jelas dan tepat. Ada beberapa macam ukuran variasi atau dispersi, misalnya nilai jarak (range), rata-rata simpangan (mean deviation), simpangan baku (standard deviation), koefisien variasi (coefficient of variation), ukuran kemencengan kurva (skewness), dan ukuran keruncingan kurva (kurtosis). Di antara ukuran variasi atau disperse data tersebut simpangan baku yang sering dipergunakan, khususnya untuk keperluan analisis data.

JENIS-JENIS UKURAN DISPERSI

Jangkauan (Range, R)

Jangkauan atau ukuran jarak adalah selisih nilai terbesar data dengan nilai terkecil data. Dengan kata lain range atau disebut juga rentangan atau jarak pengukuran dapat didefinisikan sebagai jarak antara nilai tertinggi dengan nilai terendah. Besar kecilnya range dapat digunakan sebagai petunjuk untuk mengetahui taraf keragaman dan variabilitas suatu distribusi. Semakin tinggi range berarti distribusinya semakin beragam, bervariasi atau heterogen. Sebaliknya semakin kecil harga range maka distribusinya semakin tidak bervariasi, tidak beragam, sejenis atau homogen.

Walaupun prosedur yang dilalui sangat sederhana, namun penggunaan range sebagai ukuran variabilitas harus dilakukan dengan hati-hati. Karena range sangat bergantung pada data yang ekstrim (yaitu data yang kemunculan dan ketidak munculannya sangat berpengaruh pada tinggi rendahnya nilai range). Oleh karena hanya didasarkan pada dua nilai yang tertinggi dan terendah inilah, maka range merupakan indeks variabilitas yang tidak dapat diandalkan, tidak stabil atau tidak mantap (reliable) sebagai pendekatan metodologi ilmiah. Cara mencari jangkauan dibedakan antara data tunggal dan data berkelompok.



Jangkauan data tunggal

Bila ada sekumpulan data tunggal X1, X2, …, Xn maka jangkauannya adalah

Jangkauan

Contoh :

Tentukan jangkauan data: 1, 4, 7, 8, 9, 11 !

Jawab:

X6 = 11 dan X1 = 1

Jangkauan =



Jangkauan data berkelompok

Untuk data berkelompok, jangkauan dapat ditentukan dengan dua cara, yaitu menggunakan titik atau nilai tengah dan menggunakan tepi kelas. Jangkauan adalah selisih titik tengah kelas tertinggi dengan titik tengah kelas terendah. Jangkauan adalah selisih tepi atas kelas tertinggi dengan tepi bawah kelas terendah.

Contoh :Tentukan jangkauan dari distribusi frekuensi berikut!

Tabel 4.1. Hasil Pengukuran Tinggi Badan 50 Mahasiswa STMIK Raharja

Tinggi Badan (cm)

Frekuensi

140 – 144

145 – 149

150 – 154

155 – 159

160 – 164

165 – 169

170 – 174

2

4

10

14

12

5

3

Jumlah

50

Jawab:

Dari Tabel 4.1. terlihat bahwa:

Titik tengah kelas terendah     = 142

Titik tengah kelas tertinggi                  = 172

Tepi bawah kelas terendah     = 139,5

Tepi atas kelas tertinggi                      =  174,5

Jangkauan                            =  172 – 142       = 30
Jangkauan                            =  174,5 – 139,5 = 35
Jangkauan  Semi Interkuartil

Jangkauan antarkuartil adalah selisih antara nilai kuartil atas  dan kuartil bawah  Dirumuskan:

Jangkauan semi interkuartil atau simpangan kuartil (deviasi kuartil) dari suatu himpunan data, disimbolkan dengan Q didefinisikan sebagai setengah dari selisih kuartil  dengan kuartil bawah . Dirumuskan:

Di mana Q1 dan Q2 adalah kuartil pertama dan kuartil ketiga dari kelompok data. Jangkauan interkuartil kadang-kadang digunakan juga meskipun jaangkauan semi interkuartil lebih umum dan sering digunakan sebagai ukuran untuk disperse data. Rumus-rumus di atas berlaku baik untuk data tunggal dan data yang telah dikelompokan dalam distribusi frekuensi. Perhatikan contoh berikut:

Tentukan jangkauan antarkuartil dan jangkauan semi interkuartil dari data berikut!
2, 4, 6, 8, 10, 12, 14

Jawab:

 dan

Tentukan jangkauan antarkuartil dan jangkauan semi interkuartil berikut!
Tabel 4.2. Nilai Statistik 80 Mahasiswa STMIK Raharja Semester II.

Nilai

Frekuensi

30 – 39

40 – 49

50 – 59

60 – 69

70 – 79

80 – 89

90 – 99

2

3

5

14

24

20

12

Jumlah

80

Jawab:

Jangkauan antarkuartil (JK) dapat digunakan untuk menemukan adanya data pencilan, yaitu data yang dianggap salah catat atau salah ukur atau berasal dari kasus yang menyimpang, karena itu perlu diteliti ulang. Data pencilan adalah data yang kurang dari pagar dalam atau lebih dari pagar luar.

Keterangan:

 Satu langkah            pagar dalam                        pagar luar

Contoh : Selidiki apakah terdapat data pencilan dari data di bawah ini!

              15, 33, 42, 50, 51, 51, 53, 55, 62, 64, 65, 68, 79, 85, 97

Jawab:  dan

Pada data di atas terdapat nilai 15 dan 97 yang berarti kurang dari pagar dalam (23) atau lebih dari pagar luar (95). Dengan demikian, nilai 15 dan 97 termasuk data pencilan, karena itu perlu diteliti ulang. Adanya nilai 15 dan 97 mungkin disebabkan salah dalam mencatat, salah dalam mengukur, atau data dari kasus yang menyimpang.

Deviasi Rata-Rata (Simpangan Rata-Rata)

Deviasi rata-rata atau deviasi mean disingkat MD (mean deviation) dari himpunan data didefinisikan sebagai nilai rata-rata hitung dari harga mutlak simpangan-simpangannya. Dengan kata lain, untuk melakukan penghitungan MD digunakan harga yang mutlak saja, yaitu dengan hanya menggunakan nilai-nilai yang bertanda positif saja sedangkan nilai-nilai yang memiliki tanda negatif tidak diperhitungkan atau diabaikan. Cara mencari deviasi rata-rata, dibedakan antara data tunggal dan data berkelompok.

Deviasi rata-rata data tunggal

Untuk data tunggal, deviasi rata-ratanya dapat dihitung dengan menggunakan rumus:

Contoh : Tentukan deviasi rata-rata dari 2, 3, 6, 8, 11!

Jawab:

Rata-rata hitung



Deviasi rata-rata untuk data berkelompok

Untuk data berkelompok (distribusi frekuensi), deviasi rata-ratanya dapat dihitung dengan rumus:

Contoh:

Tentukan deviasi rata-rata dari distribusi frekuensi pada Tabel 4.1.!

Jawab:

Dari Tabel 4.1. didapat  Dengan nilai itu, dapat dibuat tabel deviasinya.

Tinggi Badan (cm)

140 – 144

145 – 149

150 – 154

155 – 159

160 – 164

165 – 169

170 – 174

142

147

152

157

162

167

172

2

4

10

14

12

5

3

15,7

10,7

5,7

0,7

4,3

9,3

14,3

31,4

42,8

57

9,8

51,6

46,5

42,9

Jumlah



50



282

            Oleh karena MD ini mengabaikan tanda-tanda plus minus maka tidaak dapat diteruskan kepada perhitungan-perhitungan matematik lebih lanjut, terutama pada rumus-rumus yang mencantumkan tanda plus minus itu. Untuk mengatasi kelemahan ini, digunakan cara perhitungan ukuran variabilitas yang lain, yaitu yang dikenal dengan simpangan baku atau standar deviasi atau deviasi standar. Namun sebelum masuk ke pembahasan standar deviasi akan diuraikan terlebih dahulu tentang varians.

Variansi (Variance)

            Seperti pada perhitungan simpangan rata-rata, variasi juga menggunakan selisih atau simpangan antara semua nilai data dengan rata-rata hitung. Bedanya pada rumus simpangan rata-rata yang digunakan adalah nilai mutlak dari selisih nilai, sedangkan pada variansi yang digunakan adalah kuadrat selisih nilai. Walaupun nilai mutlak dan kuadrat sama-sama bertujuan untuk membuat nilai negatif menjadi positif, tetapi maknanya sangat berbeda dan mempunyai pengaruh yang berbeda terhadap ukuran dispersi data. Varians adalah nilai tengah kuadrat simpangan dari nilai tengah atau simpangan rata-rata kuadrat. Untuk sampel, variansnya (varians sampel) disimbolkan dengan  Untuk populasi, variansnya (varians populasi) disimbolkan dengan  (baca: sigma).

Varians data tunggal

Untuk seperangkat data X1, X2, X3,…, Xn (data tunggal), variansnya dapat ditentukan dengan dua metode, yaitu metode biasa dan metode angka kasar.

Metode biasa

Untuk sampel besar
Untuk sampel kecil
Metode angka kasar

Untuk sampel besar
Untuk sampel kecil
Contoh: Tentukan varians dari data 2, 3, 6, 8, 11!

Jawab:         maka diperoleh

2

3

6

8

11

-4

-3

0

2

5

16

9

0

4

25

4

9

36

64

121

30

54

234

Varians data berkelompok

Untuk data berkelompok (data yang telah dikelompokan dalam distribusi frekuensi), variansnya dapat ditemukan dengan menggunakan tiga metode, yaitu metode biasa, metode angka kasar, dan metode coding.

Metode biasa

Untuk sampel besar
Untuk sampel kecil
Metode angka kasar

Untuk sampel besar
Untuk sampel kecil
Metode coding

Untuk sampel besar
Untuk sampel kecil
Keterangan:

 panjang interval kelas

 rata-rata hitung sementara.

Contoh : Tentukan varians dari distribusi frekuensi berikut!

Tabel 4.3. Hasil Pengukuran Diameter Pipa

Diameter

Frekuensi

65 – 67

68 – 70

71 – 73

74 – 76

77 – 79

80 – 82

2

5

13

14

4

2

Jumlah

40

Jawab:

Dengan menggunakan metode biasa:

Diameter

65 – 67

68 – 70

71 – 73

74 – 76

77 – 79

80 – 82

66

69

72

75

78

81

2

5

13

14

4

2

-7,425

-4,425

-1,425

1,575

4,575

7,575

55,131

19,581

2,031

2,481

20,931

57,381

110,262

97,905

26,403

34,734

83,724

114,762

Jumlah



40





467,790

Dengan metode angka kasar:

Diameter

65 – 67

68 – 70

71 – 73

74 – 76

77 – 79

80 – 82

66

69

72

75

78

81

2

5

13

14

4

2

4.356

4.761

5.184

5.625

6.084

6.561

132

345

936

1.050

312

162

8.712

23.805

67.392

78.750

24.336

13.122

Jumlah



40



2.937

216.117

Dengan metode coding:

Diameter

65 – 67

68 – 70

71 – 73

74 – 76

77 – 79

80 – 82

66

69

72

75

78

81

2

5

13

14

4

2

-3

-2

-1

0

1

2

9

4

1

0

1

4

-6

-10

-13

0

4

4

18

20

13

0

4

8

Jumlah



40



-21

63

            Hasil perhitungan dengan menggunakan ketiga rumus adalah sama, namun dengan menggunakan rumus ke-3, perhitungannya jauh lebih sederhana dan cepat. Perhatikan bahwa dengan menggunakan varians, disperse data tersebut jauh lebih besar jika dibandingkan dengan menggunakan simpangan rata-rata. Hal ini diakibatkan oleh variansi yang menggunakan kuadrat selisih nilai-nilai data terhadap rata-rata hitung, sehingga simpangannya membesar secara drastis. Ini berarti varians bukan merupakan ukuran dispersi yang baik untuk menggambarkan penyebaran data. Kelemahan varians disebabkan oleh bentuk kuadrat yang dipakai dalam rumus, sementara dispersi data sesungguhnya merupakan ukuran yang bentuknya linier. Oleh karena itu varians juga jarang digunakan dalam analisis data. Namun demikian, variansi masih mempunyai kelebihan karena melibatkan selisih dari semua nilai data.

Varians gabungan

Misalkan, terdapat  buah subsample sebagai berikut:

–               Sub-sampel 1, berukuran  dengan varians

–               Sub-sampel 2, berukuran  dengan varians

–               ……………., …………           ………     ……

–               Sub-sampel berukuran  dengan varians

Jika subsampel-subsampel tersebut digabungkan menjadi sebuah sampel berukuran  , maka varians gabungannya adalah:

     atau

Contoh: Hasil pengamatan terhadap 20 objek mendapatkan s = 4. Pengamatan

              terhadap 30 objek mendapatkan s = 5. Berapakah varians gabungannya?

2 komentar:

  1. #include
    #include

    main()
    {
    int a=1,b=19,n;

    for(a=a;a<=b;a+=2)
    {
    cout<<a;
    if(a<b)
    {
    cout<<"+";
    }
    }

    cout<<"=";
    n=(b+1)/2;
    n=n*n;
    cout<<n;

    getch();
    }

    BalasHapus
  2. #include
    #include
    #include
    main()
    {
    float luas, panjang, lebar, tinggi, volume;
    cout<<"Masukan panjang balok : ";cin>>panjang;
    cout<<"Masukan lebar balok : ";cin>>lebar;
    cout<<"Masukan tinggi balok : ";cin>>tinggi;

    luas=2 * (panjang * lebar) + (panjang * tinggi) + (lebar * tinggi);
    volume=2 * (panjang * lebar * tinggi);

    cout<<"Luas dari balok = "<<luas;
    cout<<"\nVolume balok = "<<volume;

    getche();
    }

    BalasHapus