Goresan Penaku: Landasan teori Distribusi diskrit dan Kontinu

BAB II

LANDASAN TEORI

2.1 Sampel Random Dan Statistik

Sebuah peristiwa E dapat terjadi sebanyak n kali di antara N peristiwa yang saling eksklusif (saling asing / terjadinya peristiwa yang satu mencegah terjadinya peristiwa yang lain) dan masing-masing terjadi dengan kesempatan yang sama. Maka peluang peristiwa E terjadi adalah :

dengan batas-batas : 0 ≤ P(E) ≤ 1.

Jika P(E) = 0, maka diartikan peristiwa E pasti tidak terjadi, sedangkan jika P(E) = 1 diartikan peristiwa E pasti terjadi. Apabila

menyatakan bukan peristiwa E, maka diperoleh :

) = 1 – P(E).

Atau berlaku hubungan :

P(E) + P(

) = 1

Sedangkan yang dimaksud dengan frekuensi nisbi suatu kejadian ialah :

Bila u = {u1, u2, …, un} dan P1 dicatat sebagai frekuensi nisbi timbulnya kejadian dasar (ui) maka :

Irisan dua kejadian A dan B dinyatakan dengan lambang :

A∩B, ialah kejadian yang unsurnya termasuk dalam A dan B.

Gabungan dua kejadian A dan B dinyatakan dengan lambang :

B, ialah kejadian yang mengandung semua unsur yang termasuk A atau B atau keduanya.

P(A

B) = P(A) + P(B) - P(A∩B)

P(A∩B) = 1 - P(A

B).

1. Sampel Random

Populasi adalah totalitas semua nilai yang mungkin dengan karakteristik tertentu, baik hasil menghitung maupun pengukuran, kuantitas maupun kualitatif, mengenai sekumpulan obyek yang lengkap dan jelas. Atau populasi adalah kumpulan seluruh elemen/obyek yang diteliti. Dengan kata lain populasi adalah wilayah generalisasi yang terdiri atas obyek/subyek yang mempunyai kuantitas dan karakteristik tetentu yang ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik kesimpulannya.

Jadi populasi bukan hanya orang, tetapi juga benda-benda alam yang lain. Populasi bukan juga sekedar jumlah yang ada pada obyek/subyek yang dipelajari, tetapi meliputi seluruh karakteristik/sifat yang dimiliki oleh obyek/subyek tersebut.

Misalnya akan melakukan penelitian di lembaga X, maka lembaga X ini merupakan populasi. Lembaga X mempunyai sejumlah orang/obyek dan obyek yang lain. Hal ini berarti populasi dalam arti jumlah/kuantitas. Tetapi lembaga X juga mempunyai karakteristik orang-orangnya, misalnya motivasi kerjanya, disiplin kerjanya, kepemimpinannya, iklim organisasinya dan lain-lain. Dan juga mempunyai karakteristik obyek yang lain misalnya, kebijakan, prosedur kerja, tata ruang, produk yang dihasilkan dan lain-lain. Yang terakhir populasi dalam arti karakteristik.

Dalam mempelajari statistika induktif kita sering menjumpai istilah populasi dan sampel. Populasi dalam defenisi statistik adalah seluruh kumpulan obyek-obyek atau orang-orang yang akan dipelajari atau diteliti, yang dari padanya dapat diambil suatu sampel. Maka sampel sendiri memiliki arti suatu bagian yang diambil dari suatu populasi. Populasi sangat banyak macamnya dan memiliki ukuran dari terbatas sampai tak terhingga. Beberapa contoh populasi :

- Populasi orang-orang yang memiliki hak suara dalam pemilu di AS (jika orang-orang yang memiliki hak suara dalam pemilu di AS merupakan obyek peneliti)

- Populasi konsumen produk tertentu

- Populasi mahasiswa di Yogyakarta

- Populasi mahasiswa di suatu PTS

Satu orangpun dapat digunakan sebagai populasi, karena satu orang itu mempunyai karakteristik, misalnya gaya bicara, disiplin pribadi, hobi, cara bergaul, kepemimpinannya, dan lain-lain.

Pengambilan sampel dari pupulasi merupakan proses utama dalam statistik induktif. Sampling dilakukan karena seorang peneliti tidak mungkin (kalaupun mungkin tidak efisien) meneliti seluruh populasi, apalagi kalau populasi tersebut relatif besar.

Misalnya, kasus meneliti preferensi konsumen terhadap Coca Cola rasa baru atau Coca Cola klasik. Jika perusahaan melakukan penelitian terhadap seluruh konsumen yang jumlahnya ratusan juta yang tersebar di seluruh dunia, penelitian tersebut tidak akan selesai dalam 1-2 tahun dan tentunya memerlukan biaya yang besar sekali. Dengan cara pengambilan sampel, seorang peneliti dapat menghemat waktu dan biaya penelitian.

Apakah sampel yang diambil cukup representative, artinya memberikan gambaran yang sama dengan populasinya ? Dengan teknik pengambilan sampel yang baik, seorang peneliti dapat memperoleh sampel yang representative. Contohnya adalah poll atau pengumpulan pendapat yang dilakukan oleh perusahaan riset bernama Gallup yang pengumpulan pendapatnya dikenal sebagai Gallup Poll. Gallup selalu melakukan poll pada saat menjelang pemilu di AS. Gallup mengambil hanya sekitar 1500 sampai dengan 2000 pemilih sebagai sampel yang akan diteliti.

Kemudian hasil penelitian terhadap sampel tersebut digunakan untuk menduga populasi. Misalnya dari sampel tersebut diketahui 45% memilih Dukakis dan 55% memilih Bush, maka kedua angka tersebut merupakan penduga untuk proporsi populasi pemilih di AS yang memilih Bush dan Dukakis.

Bukti empiris bahwa dari 13 kali pemilihan presiden di AS, hanya sekali Gallup Poll membuat kesalahan prediksi.

Sampel adalah sebagai yang diambil dari populasi dengan menggunakan cara-cara tertentu. Atau sampel adalah bagian dari populasi. Dengan kata lain sampel adalah sebagian dari jumlah dan karakteristik yang dimiliki oleh karakteristik tersebut.

Bila populasi besar, dan peneliti tidak mungkin mempelajari semua yang ada pada populasi, misalnya karena keterbatasan dana, tenaga dan waktu, maka peneliti dapat menggunakan sampel yang diambil dari populasi itu. Apa yang dipelajari dari sampel itu, kesimpulannya akn diberlakukan untuk populasi. Untuk itu sampel yang diambil dari populasi haus betul-betul representatif (mewakili).

Bila sampel tidak representatif, ibarat orang buta disuruh menyimpulkan karakteristik gajah. Satu orang memegang telinga gajah, maka ia menyimpulkan gajah itu seperti kipas. Orang kedua memegang badan gajah, maka ia menyimpulkan gajah itu seperti tembok besar. Begitulah bila sampel yang dipilih tidak representatif, maka ibarat dua orang buta itu yang membuat kesimpulan yang salah tentang gajah.

Secara matematis kita dapat menggambarkan populasi dan sampel menggunakan ukuran-ukuran seperti : rata-rata hitung (mean), median, modus, deviasi standar, dan proporsi. Yang dimaksud dengan statistik sampel adalah karakteristik suatu sampel. Sedangkan karakteristik populasi disebut parameter populasi.

Parameter populasi	Statistik Sampel
Ukuran populasi = N Rata-rata populasi = Standar deviasi populasi = Proporsi populasi = P	Ukuran sampel = n Rata-rata sampel = Standar deviasi sampel = s Proporsi sampel = p

Sampel random dari populasi variabel random X adalah sampel yang terdiri dari himpunan variabel-variabel random X1, X2, …., Xn yang berdistribusi sama dan saling bebas.

Teknik sampling pada dasarnya dapat dikelompokkan menjadi dua yaitu :

a. Probabiliti Sampling

Probabiliti sampling adalah teknik sampling yang memberikan peluang yang sama bagi setiap unsur (anggota) populasi untuk dipilih menjadi anggota sampel. Teknik ini meliputi :

1. Simple Random Sampling

Dikatakan simple (sederhana) karena pengambilan sampel anggota populasi dilakukan secara acak tanpa memperhatikan strata yang ada dalam populasi itu. Cara itu dapat digunakan bila anggota populasi dianggap homogen.

2. Proportionate Stratified Random Sampling

Teknik ini digunakan bila populasi mempunyai anggota/unsur yang tidak homogen dan berstrata secara proporsional.

3. Disproportionate Stratified Random Sampling

Teknik ini digunakan untuk menentukan jumlah sampel, bila populasi berstrata tetapi kurang proporsional.

4. Cluster Sampling (Area Sampling)

Teknik sampling daerah digunakan untuk menentukan sampel bila obyek yang akan diteliti atau sumber data sangat luas, misal penduduk dari suatu negara, propinsi, atau kabupaten.

b. Nonprobability Sampling

Nonprobabiliti sampling adalah teknik yang tidak memberi peluang/kesempatan sama bagi setiap unsur atau anggota populasi untuk dipilih menjadi sampel. Teknik sampel ini meliputi :

1. Sampling Sistematis

Sampling sistematis adalah teknik penentuan sampel berdasarkan urutan dari anggota populasi yang telah diberi nomor urut. Misalnya anggota populasi yang terdiri atas 100 orang. Dari semua anggota kelompok itu diberi nomor urut 1 sampai dengan nomor 100.

2. Sampling Kuota

Sampling kuota adalah teknik untuk menentukan sampel dari populasi yang mempunyai ciri-ciri tertentu sampai jumlah (kuota) yang diinginkan.

3. Sampling Aksidental

Sampling aksidental adalah teknik penentuan sampel berdasarkan kebetulan, yaitu siapa saja yang kebetulan bertemu dengan peneliti dapat digunakan sebagai sampel, bila dipandang orang yang ditemui itu cocok sebagai sumber data.

4. Sampling Purposive

Sampling purposive adalah teknik penentuan sampel dengan pertimbangan tertentu.

5. Sampling Jenuh

Sampling jenuh adalah teknik penentuan sampel jika semua anggota populasi digunakan sebagai sampel. Hal ini biasa dilakukan bila jumlah populasi relatif kecil, kurang dari 30.

6. Snowball Sampling

Snowball sampling adalah teknik penentuan sampel yang mula-mula jumlahnya kecil, kemudian sampel ini disuruh memilih teman-temannya untuk dijadikan sampel, begitu seterusnya hingga jumlah sampel semakin banyak.

2. Pengertian Statistik

Kata statistik mempunyai arti yang berbeda untuk orang yang berbeda. Bagi seorang menejer tim sepak bola, statistik bisa berarti beberapa kali kesebelasan yang dipimpinnya menang, kalah atau draw. Bagi seorang menejer perusahaan, statistik dapat berarti jumlah penjualan dari tahun ke tahun, dan bagi seorang mahasiswa, statistik bisa berarti salah satu bidang studi yang harus dipelajari.

Kata “statistik” berasal dari bahasa Italia “statista” yang berarti negarawan. Istilah tersebut pertama digunakan oleh Gottfried Achenwall (1719 – 1772). Ia mengambil kata statistik karena melihat bahwa yang mula-mula menyadari kegunaan data atau keterangan tentang rakyat adalah Negara. Pada abad pertengahan, Negara-negara mengadakan sensus penduduk untuk memudahkan mereka memobilisasi rakyat dan menarik pajak. Achenwall mengartikan statistik sebagai keterangan-keterangan yang butuhkan oleh Negara.

Pada perkembangan lebih lanjut, kata statistik dapat diartikan sebagai data maupun metoda ilmiah. Dewasa ini statistik sebagai data lebih dikenal dengan istilah data statistik dan statistik sebagai metode ilmiah disebut statistik.

Kemudian dikenallah “Statistik Induktif” yang didefenisikan sebagai kumpulan metoda yang digunakan untuk menganalisis informasi yang ada pada sampel untuk mengambil kesimpulan bagi populasi.

Ukuran-ukuran pada populasi disebut parameter populasi dan ukuran-ukuran pada sampel disebut sebagai statistik sampel. Pada statistik induktif hasil analisis pada statistik sampel digunakan untuk mengambil kesimpulan (menduga) parameter populasi.

Agar diperoleh suatu sampel yang representatif, maka teknik pengambilan sampel (teknik sampling) harus baik. Pada statistik induktif diasumsikan bahwa pengambilan sampel bersifat random atau acak, artinya setiap anggota populasi memiliki probabilita yang sama untuk dipilih sebagai sampel.

Fungsi dari variabel random yang terkait dengan sampel random disebut sebagai statistik. Jika X1, X2, …, Xn adalah sampel random berukuran n dengan nilai masing-masing X1, X2, …, Xn dan H adalah fungsi untuk X1, X2, …, Xn maka :

Y = H {X1, X2, …, Xn}

Sebagai statistik dengan nilai statistiknya adalah :

y = h {X1, X2, …., Xn}

3. Defenisi Distribusi Sampel

Distribusi sampel statistik y adalah distribusi probabilitas dari statistik Y. Jika kita anggap bahwa pemilihan sampel acak sederhana sebagai suatu eksperimen, maka rata-rata sampel X merupakan deskripsi numerik dari hasil percobaan. Dari contoh penarikan sampel yang yang telah dijelaskan di atas, kita tahu bahwa ada lebih dari satu kemungkinan hasil. Pada contoh di atas untuk populasi berukuran N = 5 dan sampel berukuran n = 3 diambil dari populasi tersebut, maka terdapat kombinasi nilai-nilai dalam sampel sebanyak ₅C₃= 10 macam kombinasi. Dari setiap kombinasi ini dapat dicari nilai rata-ratanya. Jadi dalam hal ini, rata-rata sampel, merupakan variabel acak.

Karena terdapat beberapa nilai nilai X yang diperoleh dari 10 kemungkinan sampel, maka rata-rata dari seluruh kemungkinana nilai X juga mempunyai varians dan distribusi probabilitas. Karena berbagai macam kemungkinan nilai X adalah hasil dari sampel acak sederhana yang berbeda, maka distribusi probabilitas dari X disebut distribusi penarikan sampel dari nilai rata-rata .

Dalam prakteknya kita hanya memilih satu sampel acak sederhana dari populasi diantara seluruh kemungkinan yang ada. Disamping distribusi penarikan sampel nilai rata-rata

, kita juga mengenal distribusi penarikan sampel untuk proporsi P.

Distribusi penarikan sampel dari

adalah distribusi probabilitas dari seluruh kemungkinan nilai-nilai dari rata-rata sampel

Distribusi Sampling merupakan distribusi teoritis dari semua hasil sampel yang mungkin, dengan ukuran sampel yang tetap N. pada statistic yang digeneralisasikan ke populasi.

Beberapa Teknik Penarikan Penarikan Sampel :

· Penarikan sampel acak sederhana : Pengacakan dapat dilakukan dengan undian, tabel bilangan acak, program komputer.

· Penarikan Sampel Sistematik : Tetapkan interval lalu pilih secara acak anggota pertama sampel.

· Penarikan Sampel acak berlapis : populasi terdiri dari beberapa kelas/kelompok. Dari setiap kelas diambil sampel secara acak.

· Penarikan Sampel Gerombol/kelompok : populasi juga terdiri dari beberapa kelas/kelompok sampel yang diambil berupa kelompok bukan individu anggota.

· Penarikan sampel area : prinsipnya sama dengan cluster sampling. Pengelompokan ditentukan oleh letak geografis atau administrative.

4. Distribusi Sampling Rata-Rata

Beberapa notasi :

n : ukuran sampel N : ukuran populasi

: rata-rata sampel m : rata-rata populasi

s : standar deviasi sampel s :standar deviasi populasi

: rata-rata antar semua sampel

: standar deviasi sampel

2.1 Distribusi Sampling Rata-rata Sampel Besar

Dalil 1

JIKA

Sampel: ü

berukuran = n ³ 30 ý diambil DENGAN PEMULIHAN dari

rata-rata =

ì Populasi berukuran = N

í Terdistribusi NORMAL

î Rata-rata = m ; simpangan baku = s

MAKA

Distribusi Rata-rata akan mendekati distribusi Normal dengan :

= m dan

dan nilai

Dalil 2

JIKA

Sampel: ü

berukuran = n ³ 30 ý diambil TANPA PEMULIHAN dari

rata-rata =

ì Populasi berukuran = N

í Terdistribusi NORMAL

î Rata-rata = m ; simpangan baku = s

MAKA

Distribusi Rata-rata akan mendekati distribusi Normal dengan :

= m dan

dan nilai

disebut sebagai FAKTOR KOREKSI populasi terhingga.

b. Faktor Koreksi (FK) akan menjadi penting jika sampel berukuran n diambil dari populasi berukuran N yang terhingga/ terbatas besarnya

c. Jika sampel berukuran n diambil dari populasi berukuran N yang sangat besar maka FK akan mendekati 1 ®

, hal ini mengantar kita pada dalil ke-3 yaitu

DALIL LIMIT PUSAT = DALIL BATAS TENGAH = THE CENTRAL LIMIT THEOREM

Dalil 3 DALIL LIMIT PUSAT

JIKA

Sampel: ü

berukuran = n ý diambil dari

rata-rata =

ì Populasi berukuran = N yang BESAR

í distribusi : SEMBARANG

î Rata-rata = m ; simpangan baku = s

MAKA

Distribusi Rata-rata akan mendekati distribusi Normal dengan :

= m dan

dan nilai

· Dalil Limit Pusat berlaku untuk : - penarikan sampel dari populasi yang sangat besar,

- distribusi populasi tidak dipersoalkan

· Beberapa buku mencatat hal berikut : Populasi dianggap BESAR jika ukuran sampel

KURANG DARI 5 % ukuran populasi atau

Dalam pengerjaan soal DISTRIBUSI SAMPLING RATA-RATA perhatikan asumsi-asumsi dalam soal sehingga anda dapat dengan mudah dan tepat menggunakan dalil-dalil tersebut!

Contoh 1:

PT AKUA sebuah perusahaan air mineral rata-rata setiap hari memproduksi 100 juta gelas air mineral. Perusahaan ini menyatakan bahwa rata-rata isi segelas AKUA adalah 250 ml dengan standar deviasi = 15 ml. Rata-rata populasi dianggap menyebar normal.

1. Jika setiap hari diambil 100 gelas AKUA sebagai sampel acak DENGAN

PEMULIHAN, hitunglah :

a. standard error atau galat baku sampel tersebut?

b. peluang rata-rata sampel akan berisi kurang dari 253 ml?

2. Jika sampel diperkecil menjadi 25 gelas, hitunglah :

a. standard error atau galat baku sampel tersebut?

b. peluang rata-rata sampel akan berisi lebih dari 255 ml?

1. Diselesaikan dengan DALIL 1 ® karena PEMULIHAN

Diselesaikan dengan DALIL 3 ® karena POPULASI SANGAT BESAR

N = 100 000 000

= m = 250 s = 15 n = 100

< 253) = P(z < ?)

GALAT BAKU =

Jadi P(

< 253) = P(z < 2.0) = 0.5 + 0.4772 = 0.9772

2. Diselesaikan dengan DALIL 3 ® karena POPULASI SANGAT BESAR

N = 100 000 000

= m = 250 s = 15 n = 25

> 255) = P(z > ?)

GALAT BAKU =

Jadi P(

> 255 ) = P(z > 1.67) = 0.5 - 0.4525 = 0.0475

Contoh 2 :

Dari 500 mahasiswa FE-GD diketahui rata-rata tinggi badan = 165 cm dengan standar deviasi = 12 cm, diambil 36 orang sebagai sampel acak. Jika penarikan sampel dilakukan TANPA PEMULIHAN dan rata-rata tinggi mahasiswa diasumsikan menyebar normal, hitunglah :

a. galat baku sampel?

b. peluang sampel akan memiliki rata-rata tinggi badan kurang dari 160 cm?

Diselesaikan dengan DALIL 2 ® TANPA PEMULIHAN

N = 500

= m = 165 s = 12 n = 36

Catatan

® Dalil Limit Pusat tidak dapat digunakan

< 160) = P(z < ?)

FK =

GALAT BAKU

x FK =

= 2 x 0.964... = 1.928...

< 160) = P(z < -2.59) = 0.5 - 0.4952 = 0.0048

6. Distribusi Sampling Rata-rata Sampel Kecil

· Distribusi Sampling didekati dengan distribusi t Student = distribusi t (W.S. Gosset). Distribusi-t pada prinsipnya adalah pendekatan distribusi sampel kecil dengan distribusi normal.

Dua hal yang perlu diperhatikan dalam Tabel t adalah

1. derajat bebas (db)

2. nilai a

Derajat bebas (db) = degree of freedom = v = n - 1.

n : ukuran sampel.

· Nilai a adalah luas daerah kurva di kanan nilai t atau luas daerah kurva di kiri nilai -t

· Nilai a ® 0.1 (10%) ; 0.05 (5%) ; 0.025(2.5%) ; 0.01 (1%) ; 0.005(0.5%)

Nilai a terbatas karena banyak kombinasi db yang harus disusun!

· Kelak Distribusi t akan kita gunakan dalam PENGUJIAN HIPOTESIS

· Pembacaan Tabel Distribusi-t

Misalkan n = 9 ® db = 8; Nilai a ditentukan = 2.5% di kiri dan kanan kurva

t tabel (db, a) = t tabel(8; 0.025) = 2.306

Jadi t = 2.306 dan -t = -2.306

2.5% 95 % 2.5%

-2.306 0 2.306

Arti Gambar di atas nilai t sampel berukuran n = 9, berpeluang 95% jatuh dalam selang -2.306 < t < 2.306. Peluang t >2.306 = 2.5 % dan Peluang t < -2.306 = 2.5 %

Coba cari nilai t tabel untuk beberapa nilai db dan a yang lain!

· Perbedaan Tabel z dan Tabel t

Tabel z ® nilai z menentukan nilai a

Tabel t ® nilai a dan db menentukan nilai t

· Dalam banyak kasus nilai simpangan baku populasi (s) tidak diketahui, karenanya nilai s diduga dari nilai simpangan baku sampel (s).

Dalil 4

JIKA

Sampel: ü

ukuran KECIL n < 30 ý diambil dari

rata-rata =

simp. baku = s þ

ì Populasi berukuran = N

í terdistribusi : NORMAL

î Rata-rata = m

MAKA

Distribusi Rata-rata akan mendekati distribusi-t dengan :

= m dan

dan nilai

pada derajat bebas = n-1 dan suatu nilai a

Contoh 3 :

Manajemen PT JURAM menyatakan bahwa 95% rokok produksinya rata-rata mengandung nikotin 1.80 mg, data tersebar normal. Yayasan Konsumen melakukan pengujian nikotin terhadap 9 batang rokok dan diketahui rata-rata sampel = 1.95 mg nikotin dengan standar deviasi = 0.24 mg. Apakah hasil penelitian Yayasan Konsumen mendukung pernyataan Manajemen PT JURAM?

Jawab : 95 % berada dalam selang ® berarti 5 % berada di luar selang;

2.5 % di kiri t dan 2.5% di kanan t

a = 2.5 % = 0.025

n = 9 ® db = n - 1 = 8

t tabel (db, a) = t-tabel(8; 0.025) = 2.306

Jadi 95 % berada dalam selang -2.306 < t < 2.306

Nilai t-hitung = ? m = 1.80 n = 9

= 1.95

s = 0.24

Nilai t hitung = 1.875 berada dalam selang -2.306 < t < 2.306 jadi hasil penelitian Yayasan Konsumen masih sesuai dengan pernyataan manajemen PT JURAM.

7. Distribusi Sampling Bagi Beda 2 Rata-rata

Dalil 5

JIKA

Dua (2) Sampel ü

berukuran

dan

ý diambil dari

rata-rata =

dan

þ ì Dua (2) Populasi berukuran BESAR

í Rata-rata

dan

î Ragam

dan

MAKA

Distribusi Rata-rata akan mendekati distribusi Normal dengan :

dan standard error =

dan

nilai z

· Beda atau selisih 2 rata-rata =

® ambil nilai mutlaknya!

· Melibatkan 2 populasi yang BERBEDA dan SALING BEBAS

· Sampel-sampel yang diambil dalam banyak kasus (atau jika dilihat secara akumulatif) adalah sampel BESAR

Contoh 4:

Diketahui rata-rata IQ mahasiswa Eropa = 125 dengan ragam = 119 sedangkan rata-rata IQ mahasiswa Asia = 128 dengan ragam 181. diasumsikan kedua populasi berukuran besar. Jika diambil 100 mahasiswa Eropa dan 100 mahasiswa Asia sebagai sampel, berapa peluang terdapat perbedaan IQ kedua kelompok akan kurang dari 2?

Jawab :

Populasi

Parameter	populasi ke-1 (Mhs. Eropa)	populasi ke-2 (Mhs. Asia)
Rata-rata (m)	125	128
Ragam (s²)	119	181

Beda 2 Rata-rata =

Sampel :

= 100

<2 ) = P ( z < ?)

P(z<-0.58) = 0.5 - 0.2190 = 0.2810

2.2 Mean Sampel Random

Jika X1, X2, …, Xn adalah sampel random berukuran n dari populasi variabel X dengan mean populasi E(X), varians populasi

, dan mean sampel random.

, maka

Ekspetasi mean sampel random

E(X) = E(X)

Dan Variansi mean sampel random

Dimana :

varians mean sampel random

varians populasi

n = ukuran sampel

2.3 Dalil Limit Sentral

Jika

adalah mean dari suatu sampel random berukuran n yang diambil dari populasi dengan mean

dan varians

, maka limit distribusinya adalah :

Dimana :

Z = limit distribusi

= rata-rata populasi

X = rata-rata sampel

n = ukuran sampel

= varians

Dengan n

merupakan distribusi normal standar n(z, 0, 10).

The Central Limit Theorem adalah suatu dalil yang sangat penting peranannya dalam distribusi sampling. Dalil ini mengatakan : “Untuk suatu populasi dengan rata-rata

dan varians

, distribusi sampling rata-rata dari semua kemungkinan sampel berukuran n yang diambil dari populasi, akan terdistribusi secara normal dengan rata-rata

dan deviasi standar

, dimana

sama dengan rata-rata populasi (

) dan

sama dengan deviasi standar populasi dibagi akar n atau

, dengan asumsi bahwa ukuran sampel cukup besar”.

Dalam pemilihan sampel acak sederhana dengan ukuran n dari suatu populasi yang berasal dari distribusi apapun (Binomial, Poisson, dan sebagainya) maka distribusi dari rata-rata sampel dapat didekati dengan distribusi probabilitas normal untuk ukuran sampel yang besar.

Hal-hal penting yang perlu diingat dari dalil ini adalah :

1. Jika ukuran sampel (n) lebih besar, distribusi rata-rata sampel akan mendekati normal, tidak peduli apakah populasinya terdistribusi, secara normal atau tidak.

dan

Dimana :

rata-rata populasi

deviasi standar dari distribusi sampling rata-rata

= deviasi standar populasi

n = ukuran sampel

3. Tidak ada angka yang pasti tentang “ukuran sampel yang cukup besar”, tapi biasa angka n > 30 dianggap cukup besar.

Distribusi sampling rata-rata telah dibicarakan sebelumnya. Hakekatnya distribusi sampling rata-rata adalah distribusi probabilita rata-rata sejumlah C sampel, dimana N adalah ukuran populasi dan n adalah ukuran sampel yang diambil dari populasi.

Distribusi ini memiliki rata-rata

dan deviasi standar

dan menurut Central Limit Theorem,

dan

Misalnya pada “Bank Pasti Aman” menghitung tabungan seluruh nasabahnya ternyata rata-rata tabungan / nasabahnya adalah Rp. 2000,- dengan deviasi standar Rp. 600,-. Bila seorang peneliti mengambil sampel sebanyak 100 nasabah dari populasi 600, maka akan terdapat

kombinasi sampel yang mungkin dengan kata lain akan terdapat sebanyak

rata-rata sampel. Jumlah rata-rata sampel tersebut cukup banyak sehingga distribusinya akan normal (hal ini konsisten dengan Central Limit Theorem). Distribusi sampling rata-rata ini memiliki rata-rata dan deviasi standar sebagai berikut :

= 60

2.4 Faktor Koreksi Untuk Populasi Terbatas.

Jika populasi (keseluruhan obyek penelitian) sangat besar, kita asumsikan populasi tersebut tidak terbatas (infinite). Bagaimana jika populasi tidak tak terbatas (tidak infinite) atau tidak sangat besar ? Dalam kasus ini kita akan melakukan beberapa penyesuaian/koreksi terhadap deviasi standar dari distribusi sampling caranya adalah mengalikan

dengan suatu faktor koreksi sebesar

atau

Dimana ;

N = ukuran populasi (yang trebatas/tidak terbatas)

n = ukuran sampel

Mengapa faktor koreksi ini perlu dan apa efeknya ? Jika sampel adalah suatu persentase yang cukup besar dari populasinya, maka kita mengharapkan ukurannya akan lebih tepat dari pada ukuran suatu sampel yang lebih kecil. Perhatikan efek dari faktor koreksi, misalkan kita mengambil sampel dengan ukuran 100 dari populasi dengan ukuran 1000 faktor koreksinya adalah sebesar.

Jika dikendalikan dengan faktor koreksi tersebut, deviasi standar distribusi sampling rata-rata (atau standar error of the mean) akan berkurang sebesar 1 – 94,92 % = 5%. Semakin besar ukuran sampel, pengurangan standar error ini semakin besar, demikian sebaliknya.

Perhitungan faktor koreksi untuk berbagai ukuran sampel jika populasi adalah 1000.

Ukuran Sampel n	Bagian dari populasinya (n/N)	Faktor Koreksi
10	1%	99,55%
25	2,5%	98,79%
50	5%	97,52%
100	10%	94,92%
200	20%	89,49%
500	50%	70,75%

Nampak jika n/N lebih kecil dari 5%, faktor koreksi mendekati 1 sehingga muncul aturan jika n/N lebih kecil dari 5%, faktor koreksi tidak perlu digunakan, kalaupun digunakan, tidak akan banyak pengaruhnya karena nilainya mendekati 1.

Misalnya bila sampel random dengan n = 10 dipilih dari populasi sebesar 40 dengan rata-rata 5,5 dan deviasi standar 2,9155, berapa rata-rata dan deviasi distribusi sampling rata-rata.

Maka, menurut Central Limit Theorem dan penyesuaian terhadap koreksi :

dan

= 0,27735

2.5 Pengujian Hipotesis

Hipotesis adalah asumsi atau dugaan dengan mengenai sesuatu, yang memerlukan pengecekan untuk membuktikannya. Jika asumsi atau dugaan itu dikhususkan untuk populasi, umumnya mengenai nilai parameter populasi, maka hipotesis itu disebut hipotesis statistik.

Suatu penduga tunggal (point estimator) ialah pendugaan yang terdiri dari satu nilai saja misalnya, rata-rata konsumsi susu per bulan tiap keluarga sebanyak 35 kaleng (

= 35 sebagai penduga dari

), ataupun persentase nasabah yang tidak puas sebesar 25% (

sebagai penduga p.

dan

disebut penduga atau estimator,

dan p yang merupakan parameter. Di bawah ini akan diberikan beberapa penduga dan parameter, yaitu :

Penduga :

s r b

Parameter :

Dimana

(dibaca rho) adalah koofisien korelasi sebenarnya, dan B adalah koofisien regresi sebenarnya. Satu parameter dapat mempunyai beberapa penduga.

Penduga tunggal merupakan fungsi dari nilai observasi yang berasal dari sampel dengan n elemen.

Dalam prakteknya, pendugaan tunggal yang terdiri dari satu angka tidak memberikan gambaran mengenai berapa jarak/selisih nilai penduga tersebut terhadap nilai sebenarnya. Kecuali kalau diberikan besarnya kesalahan yang mungkin terjadi. Misalnya, kalau sampel suatu perusahaan diselidiki dan memiliki nilai penduga modal (=

) sebesar Rp 100 juta, berapa niali rata modal sebenarnya (=

)? Kita tahu bahwa

kesalahan).

Itulah sebabnya sering digunakan pendugaan interval (selang), yaitu suatu pendugaan berupa interval yang dibatasi oleh dua nilai, yang disebut nilai batas bawah dan nilai batas atas. Misalnya rata-rata modal akan terletak dalam interval antara Rp. 95 juta – Rp. 105 juta.

Kita mengharapkan bahwa nilai rata-rata modal sebenarnya akan terletak di dalam interval tersebut. Interval yang demikian itu disebut interval keyakinan atau selang keyakinan (confidence interval).

Persentase = proporsi x 100%. Perkiraan proporsi ini sangat penting, misalnya dalam penelitian pendapat umum untuk mengetahui berapa % yang setuju dengan calon presiden; dalam pemasaran berapa % dari ibu rumah tangga yang akan membeli mesin jahit, berapa % barang produksi yang rusak; berapa % penduduk suatu daerah yang masih buta huruf; berapa % karyawan suatu perusahaan yang lesu; berapa % nasabah suatu bank yang tidak puas dengan layanan bank tersebut; berapa % petani peminjam kredit Bimas yang tidak bisa mengembalikan pinjaman tersebut; berapa % proyek yang tidak selesai pada waktunya, dan lain sebagainya.

Di dalam setiap penelitian, elemen populasi/sampel dapat dikategorikan sesuai dengan karakteristik tertentu. Misalnya, elemen populasi/sampel dapat dikategorikan sesuai dengan karakteristik tertentu. Misalnya elemen populasi/sampel tersebut dibagi menjadi dua kelompok atau kategori, yaitu pemilih dikelompokkan menjadi setuju dan tidak setuju; ibu rumah tangga dikelompokkan menjadi amu membeli dan tidak mau membeli TV, dan lain sebagainya.

Bila kita ingin mengetahui apakah distribusi frekuensi hasil percobaan kita sesuai dengan distribusi frekuensi yang kita harapkan, maka maka kita akan mengadakan pengujian. Salah satu metode yang terkenal adalah metode Goodness Of Fit. Pengujian ini didasarkan atas statistik :

X² hit =

Dengan :

Oi = fekuensi observasi (hasil percobaan) untuk kelas ke-i

ei = frekuensi yang diharapkan untuk kelas ke-i

k = jumlah kelas

X = nilai variabel random yang distribusi sampelnya didekati dengan distribusi chi-square dengan derajat kebebasan v = k – r – 1, dengan r adalah banyaknya parameter yang ditaksir dari populasi adalah mean dan simpangan baku, maka r = 2

Frekuensi harapan pada tiap kelas sebaiknya tidak lebih kecil dari 5, jika hal ini terjadi maka harus dilakukan penggabungan dengan kelas-kelas yang berdekatan dengan kelas tersebut. Sehingga diperoleh sebuah kelas baru dengan frekuensi harapan lebih besar atau sama dengan 5 (dengan demikian jumlah total kelas seluruhnya k akan berkurang dari semula).

Untuk dapat mengambil kesimpulan apakah hipotesis kita terhadap data yang diperoleh dari percobaan mengikuti pola distribusi frekuensi yang kita duga (harapkan), maka harus dilakukan perbandingan sebagai berikut :

X² hit > X²

Dengan

adalah tingkat kepercayaan dari harga X²

y diperoleh dari tabel chi kuadrat. Apabila pertidaksamaan di atas dipenuhi, maka hipotesis nol ditolak. Untuk lebih jelasnya, praktikan disarankan untuk mempelajari uji Goodness of Fit dari buku-buku statistika. Tabel yang digunakan untuk memudahkan perhitungan pengujian distribusi dengan metode Goodness of Fit disajikan di tabel sebagaiman yang terdapat dalam bab selanjutnya.

2.6 Distribusi Frekuensi

Distribusi frekuensi merupakan suatu ringkasan dalam bentuk tabel dari suatu kelompok data yang menunjukkan frekuensi item-item (kategori-kategori) dalam beberapa kelas. Adapun langkah-langkah yang perlu dilakukan untuk membuat daftar distribusi frekuensi adalah sebagai berikut :

1. Tentukan rentang, selisih nilai terbesar dan terkecil.

2. Tentukan jumlah kelas, k dengan menggunakan rumus :

k = 1 + 3.322 log n, n : banyaknya nilai observasi.

3. Tentukan jumlah interval kelas (c), dengan rumus :

Dimana : k : Banyaknya kelas

X_n : Nilai observasi terbesar

X₁ : Nilai observasi terkecil.

4. Tentukan tepi batas kelas

Batas kelas bawah menunjukkan kemungkinan nilai data terkecil pada suatu kelas. Sedangkan batas kelas atas mengidentifikasikan kemungkinan nilai data terbesar dalam suatu kelas.

Seringkali dalam penyusunan tabel distribusi frekuensi, tabel distribusi frekuensi relatif dan kumulatif serta grafik juga disertakan dengan tujuan untuk mempermudah memahami data.

Tabel 2.1. Frekuensi Hipotesis Relatif dan Kumulatif

X	F	Fr	Fk*	Fk**
(1)	(2)	(3)	(4)	(5)
X₁ X₂ … X_i … X_k	f₁ f₂ … f_i … f_k	f₁/n f₂/n … f_i/n … f_k/n	f₁ f₁ + f2 … f₁ + f₂ + … + f_i … f₁ + f₂ + … + f_i + … + f_k	f₁ + f₂ + … + f_i + … + f_k f₂ + … + f_i + … + f_k … f₁ + f_k … f_k
Jumlah

*Sama atau kurang dari

**Sama atau lebih dari

Grafik dalam distribusi frekuensi sering digambarkan dalam bentuk histogram atau grafik batangan (bar chart) dan frekuensi poligon.

Gambar 2.1. Bentuk Histogram dan Kurva Frekuensi Poligon.

Perhitungan distribusi frekuensi untuk data berkelompok dapat dicari berdasarkan ukuran pemusatannya, ukuran letaknya, dan ukuran variansinya.

Tabel 2.2. Rumus Ukuran Pemusatan

Jenis Ukuran	Data Yang diperlukan	Rumus	Keterangan
Rata-Rata Hitung	Titik data dan frekuensinya.		X_i: Data f_i : Frekuensi data
Rata-Rata Ukur	Nilai titik tengah dan frekuensinya.		X_i : Nilai tengah f_i : Frekuensi data
Modus	Tepi batas kelas, interval kelas, frekuensi masing-masing kelas.		o Tb : Tepi bawah kelas modus o d1 : Frekuensi kelas modus – frekuensi kelas sebelumnya. o d2 : Frekuensi kelas modus – frekuensi kelas sesudahnya. o C : Interval kelas

Tabel 2.3. Rumus Ukuran Letak

Jenis Ukuran	Data Yang diperlukan	Rumus	Keterangan
Median (Med)	Tepi batas kelas, interval kelas, frekuensi kumulatif, frekuensi masing-masing kelas.		o tb : Tepi bawah kelas yang memuat median o c : Interval kelas. o f_k : Frekuensi kumulatif sebelum kelas yang memuat median. o f : Frekuansi yang memuat median
Kuartil (Qi)	Tepi batas kelas, frekuensi kumulatif, frekuensi masing-masing kelas, panjang interval kelas.	* Letaknya : Qi = [i / 4] x n, dimana i = 1, 2, 3. * Nilai / besarnya :	o tb : Tepi bawah keas Qi. o f_ki : Frekuensi kumulatif sebelum kelas Qi. o f_i : Frekuensi kelas Qi. o n : Banyaknya data.
Desil (Di)	Tepi batas kelas, frekuensi kumulatif, frekuensi masing-masing kelas, panjang interval kelas.	Letaknya : Di = [i / 10] x n, dimana i = 1, 2, 3, … , 9. Nilai / besarnya :	o tb : Tepi bawah keas Di. o f_ki : Frekuensi kumulatif sebelum kelas Di. o f_i : Frekuensi kelas Di. o n : Banyaknya data.
Persentil (Pi)	Tepi batas kelas, frekuensi kumulatif, frekuensi masing-masing kelas, panjang interval kelas.	Letaknya : Pi = [i / 100] x n, dimana i = 1, 2, 3, … , 99. Nilai / besarnya :	o tb : Tepi bawah keas Di. o f_ki : Frekuensi kumulatif sebelum kelas Di. o f_i : Frekuensi kelas Di. o n : Banyaknya data.

Tabel 2.4. Rumus Ukuran Variansi

	Jenis Ukuran	Data Yang diperlukan	Rumus	Keterangan
	Variansi	Data dan frekuensi masing-masing kelas, rata-rata data.		n : Sƒ_i X_i : Data ke-i. : Rata-rata data. ƒ_i : Frekuensi data ke-i.
	Simpangan Baku	Data dan frekuensi masing-masing kelas, rata-rata data.		S² : Varinsi
	Simpangan Rata-Rata	Data dan frekuensi masing-masing kelas, rata-rata data.		X_i : Data ke-i. : Rata-rata data. ƒ_i : Frekuensi data ke-i.
	Simpangan Kuartil	Interval kelas, frekuensi masing-masing kelas, tepi batas kelas, dan frekuensi kumulatif.	, dimana :	o f₁ : frekuensi yang memuat Q1. o f₃ : frekuensi yang memuat Q3. o f_k1 : frekuensi kumulatif sebelum kelas Q1 o f_k3 : frekuensi kumulatif sebelum kelas Q3.
	Skewness (Kemiringan)	Data dan frekuensi masing-masing kelas, rata-rata data.		S : Simpangan baku.
Kurtosis (Keruncingan)		Data dan frekuensi masing-masing kelas, rata-rata data.		S : Simpangan baku.

Distribusi Diskrit

a. Distribusi probabilitas uniform diskrit

Algoritma

Bangkitkan U(0,1)
Dapatkan X = a+(b-a+1)*U

Contoh

Sebuah perusahaan bakery membuat suatu kelompok jenis donat yang dijual ke toko-toko dengan distribusi diskrit uniform dengan kebutuhan harian maksimum 100 unit dan minimum 40 unit.

Tentukan bilangan acak dari distribusi diskrit uniform dengan a = 77 z₀ = 12357 dan m = 128

b. Distribusi Poisson

Algoritma

Hitung a=, b =1 dan i =0
Bangkitkan U_i+1= U(0,1)
Ganti b = bU_i+1
Jika b<a maka dapatkan X = i dan jika tidak lanjutkan ke langkah 5
Ganti i = i+1 kembali ke langkah 2

Contoh:

Suatu kejadian berdistribusi poisson dengan rata-rata 3 kejadian perjam dan terjadi selama periode waktu 1,4 jam.Tentukan bilangan acak dari distribusi poisson dengan a = 17 z₀ = 12357 dan m = 1237.

c. Distribusi Binomial

Metode transformasi dari distribusi binomial

Dengan mempergunakan fungsi densitas binomial yang dinyatakan dengan :

, k = 0,1, 2 .. n

${n\choose k}=\frac{n!}{k!(n-k)!}$

F(x) =

Contoh

Dari suatu distribusi binomial, diketahui p =0,5 dan n =2.

Tentukan bilangan acak dari distribusi binomial dengan a = 77 z₀ = 12357 dan m = 127.

d. Distribusi Geometri

Algoritma

Bangkitkan U(0,1)
Dapatkan X = ln(U)/ln(1-p)

Contoh: Pada seleksi karyawan baru sebuah perusahaan terdapat 30 % pelamar yang sudah mempunyai keahlian komputer tingkat advance dalam pembuatan program. Para pelamar diinterview secara insentif dan diseleksi secara acak.

Tentukan bilangan acak dengan a = 43, m = 1237 dan z₀ = 12357.

Distribusi Kontinu

a. Distr probabilitas uniform kontinu

Algoritma

1. Bangkitkan U(0,1)

2. Dapatkan X = a+(b-a)*U

Contoh

Pada suatu sentra telpon ternyata distribusi pelayanan telponnya berdistribusi uniform kontinu dengan minimal waktu 3 menit dan maksimal 5 menit. Tentukan bilangan dengan a = 173 z₀ = 12357 dan m = 1237.

b. Distribusi Eksponensial

Algoritma

1. Bangkitkan U(0,1)

2. Dapatkan X =

Dengan

rata-rata dengan nilai > 0

Contoh

Pada suatu sentra telpon ternyata distribusi penerimaan telponnya berdistribusi eksponensial dengan mean = 0,1 menit. Tentukan bilangan 10 acak dengan a = 173 z₀ = 12357 dan m = 1237.

c. Distribusi Normal

Algoritma

1. Bangkitkan U₁,U₂= U(0,1)

2. Hitung V₁= 2U₁-1 dan V₂= 2U₂-1

3. Hitung W = V₁² + V₂²

4. Jika W > 1 maka kembali ke langkah 1 dan jika tidak lanjutkan ke langkah 5

5. Hitung

6. Dapatkan X₁= V₁Y dan X₂=V₂Y

Contoh

Sebuah rumah sakit berniat mempelajari penggunaan suatu alat pada ruang emergency. Jika diketahui bahwa lamanya seorang pasien yang di’treat’ menggunakan alat tsb berdistribusi normal dgn mean 0.8 jam dan standard deviasi 0.2 jam, tentukan bilangan acak yang mewakili lamanya penggunaan alat tersebut oleh 6 orang pasien.

d. Distribusi Gamma

Algoritma

1.Bangkitkan U₁ dan U₂

2.X = -b ln (U₁ * U₂)

di mana b adalah parameter.

Contoh:

Mesin pada suatu pabrik perlu diperbaiki setiap saat ‘breakdown’ dengan biaya $100/hari. Jika lama perbaikan mesin berdistribusi gamma dengan parameter a = 2 dan b = 1/3, tentukan rata-rata biaya untuk 30 kali ‘breakdown’, jika diketahui mesin breakdown ke 29 kali mengalami lama perbaikan selama 0.38 hari dengan rata-rata lama perbaikan 0.68 hari dgn variansi S² = 0.02.

Jawab:

U1 = 0.818

U2 = 0.322

X30 = -b ln (U1 * U2)

= - 1/3 ln (0.818 * 0.322)

= 0.445 hari

\ Biaya untuk memperbaiki mesin yg breakdown ke 30 kali adalah $100 x 0.445 hari = $ 44.5

X30 - X29