BAB
II
LANDASAN TEORI
2.1
Sampel Random Dan Statistik
Sebuah peristiwa E dapat terjadi
sebanyak n kali di antara N peristiwa yang saling eksklusif (saling asing /
terjadinya peristiwa yang satu mencegah terjadinya peristiwa yang lain) dan
masing-masing terjadi dengan kesempatan yang sama. Maka peluang peristiwa E terjadi adalah :
dengan batas-batas : 0 ≤
P(E) ≤ 1.
Jika P(E) = 0,
maka diartikan peristiwa E pasti tidak terjadi, sedangkan jika P(E) = 1
diartikan peristiwa E pasti terjadi. Apabila menyatakan bukan
peristiwa E, maka diperoleh :
P() = 1 – P(E).
Atau berlaku hubungan :
P(E)
+ P() = 1
Sedangkan yang dimaksud dengan frekuensi nisbi suatu
kejadian ialah :
Bila u
= {u1, u2, …, un} dan P1 dicatat
sebagai frekuensi nisbi timbulnya
kejadian dasar (ui) maka :
Irisan dua kejadian A dan B dinyatakan
dengan lambang :
A∩B, ialah kejadian yang unsurnya termasuk dalam A dan B.
Gabungan dua kejadian A dan B dinyatakan dengan lambang :
AB, ialah kejadian yang mengandung semua unsur yang termasuk A
atau B atau keduanya.
P(AB) =
P(A) + P(B) -
P(A∩B)
P(A∩B) = 1 -
P(AB).
1.
Sampel Random
Populasi adalah
totalitas semua nilai yang mungkin dengan karakteristik tertentu, baik hasil
menghitung maupun pengukuran, kuantitas maupun kualitatif, mengenai sekumpulan
obyek yang lengkap dan jelas. Atau populasi adalah kumpulan seluruh
elemen/obyek yang diteliti. Dengan kata lain populasi adalah wilayah
generalisasi yang terdiri atas obyek/subyek yang mempunyai kuantitas dan
karakteristik tetentu yang ditetapkan oleh peneliti untuk dipelajari dan
kemudian ditarik kesimpulannya.
Jadi populasi
bukan hanya orang, tetapi juga benda-benda alam yang lain. Populasi bukan juga
sekedar jumlah yang ada pada obyek/subyek yang dipelajari, tetapi meliputi
seluruh karakteristik/sifat yang dimiliki oleh obyek/subyek tersebut.
Misalnya akan
melakukan penelitian di lembaga X, maka lembaga X ini merupakan populasi.
Lembaga X mempunyai sejumlah orang/obyek dan obyek yang lain. Hal ini berarti
populasi dalam arti jumlah/kuantitas. Tetapi lembaga X juga mempunyai
karakteristik orang-orangnya, misalnya motivasi kerjanya, disiplin kerjanya,
kepemimpinannya, iklim organisasinya dan lain-lain. Dan juga mempunyai
karakteristik obyek yang lain misalnya, kebijakan, prosedur kerja, tata ruang,
produk yang dihasilkan dan lain-lain. Yang terakhir populasi dalam arti
karakteristik.
Dalam
mempelajari statistika induktif kita sering menjumpai istilah populasi dan
sampel. Populasi dalam defenisi statistik adalah seluruh kumpulan obyek-obyek atau
orang-orang yang akan dipelajari atau diteliti, yang dari padanya dapat diambil
suatu sampel. Maka sampel sendiri memiliki arti suatu bagian yang diambil dari
suatu populasi. Populasi sangat banyak macamnya dan memiliki ukuran dari
terbatas sampai tak terhingga. Beberapa contoh populasi :
-
Populasi
orang-orang yang memiliki hak suara dalam pemilu di AS (jika orang-orang yang
memiliki hak suara dalam pemilu di AS merupakan obyek peneliti)
-
Populasi
konsumen produk tertentu
-
Populasi
mahasiswa di Yogyakarta
-
Populasi
mahasiswa di suatu PTS
Satu orangpun
dapat digunakan sebagai populasi, karena satu orang itu mempunyai
karakteristik, misalnya gaya bicara, disiplin pribadi, hobi, cara bergaul,
kepemimpinannya, dan lain-lain.
Pengambilan
sampel dari pupulasi merupakan proses utama dalam statistik induktif. Sampling
dilakukan karena seorang peneliti tidak mungkin (kalaupun mungkin tidak
efisien) meneliti seluruh populasi, apalagi kalau populasi tersebut relatif
besar.
Misalnya, kasus
meneliti preferensi konsumen terhadap Coca Cola rasa baru atau Coca Cola
klasik. Jika perusahaan melakukan penelitian terhadap seluruh konsumen yang
jumlahnya ratusan juta yang tersebar di seluruh dunia, penelitian tersebut
tidak akan selesai dalam 1-2 tahun dan tentunya memerlukan biaya yang besar
sekali. Dengan cara pengambilan sampel, seorang peneliti dapat menghemat waktu
dan biaya penelitian.
Apakah sampel
yang diambil cukup representative, artinya memberikan gambaran yang sama dengan
populasinya ? Dengan teknik pengambilan sampel yang baik, seorang peneliti
dapat memperoleh sampel yang representative. Contohnya adalah poll atau
pengumpulan pendapat yang dilakukan oleh perusahaan riset bernama Gallup yang pengumpulan
pendapatnya dikenal sebagai Gallup Poll. Gallup
selalu melakukan poll pada saat
menjelang pemilu di AS. Gallup
mengambil hanya sekitar 1500 sampai dengan 2000 pemilih sebagai sampel yang
akan diteliti.
Kemudian hasil
penelitian terhadap sampel tersebut digunakan untuk menduga populasi. Misalnya
dari sampel tersebut diketahui 45% memilih Dukakis dan 55% memilih Bush, maka
kedua angka tersebut merupakan penduga untuk proporsi populasi pemilih di AS
yang memilih Bush dan Dukakis.
Bukti empiris bahwa dari 13 kali
pemilihan presiden di AS, hanya sekali Gallup Poll membuat kesalahan
prediksi.
Sampel adalah
sebagai yang diambil dari populasi dengan menggunakan cara-cara tertentu. Atau
sampel adalah bagian dari populasi. Dengan kata lain sampel adalah sebagian
dari jumlah dan karakteristik yang dimiliki oleh karakteristik tersebut.
Bila populasi
besar, dan peneliti tidak mungkin mempelajari semua yang ada pada populasi,
misalnya karena keterbatasan dana, tenaga dan waktu, maka peneliti dapat
menggunakan sampel yang diambil dari populasi itu. Apa yang dipelajari dari
sampel itu, kesimpulannya akn diberlakukan untuk populasi. Untuk itu sampel
yang diambil dari populasi haus betul-betul representatif (mewakili).
Bila sampel
tidak representatif, ibarat orang buta disuruh menyimpulkan karakteristik
gajah. Satu orang memegang telinga gajah, maka ia menyimpulkan gajah itu
seperti kipas. Orang kedua memegang badan gajah, maka ia menyimpulkan gajah itu
seperti tembok besar. Begitulah bila sampel yang dipilih tidak representatif,
maka ibarat dua orang buta itu yang membuat kesimpulan yang salah tentang
gajah.
Secara matematis
kita dapat menggambarkan populasi dan sampel menggunakan ukuran-ukuran seperti
: rata-rata hitung (mean), median, modus, deviasi standar, dan proporsi. Yang
dimaksud dengan statistik sampel adalah karakteristik suatu sampel. Sedangkan
karakteristik populasi disebut parameter populasi.
Parameter populasi
|
Statistik Sampel
|
Ukuran populasi = N
Rata-rata populasi =
Standar deviasi populasi =
Proporsi populasi = P
|
Ukuran sampel = n
Rata-rata sampel =
Standar deviasi sampel = s
Proporsi sampel = p
|
Sampel random dari populasi variabel random X
adalah sampel yang terdiri dari himpunan variabel-variabel random X1, X2, ….,
Xn yang berdistribusi sama dan saling bebas.
Teknik sampling
pada dasarnya dapat dikelompokkan menjadi dua yaitu :
a. Probabiliti Sampling
Probabiliti sampling adalah teknik
sampling yang memberikan peluang yang sama bagi setiap unsur (anggota) populasi
untuk dipilih menjadi anggota sampel. Teknik ini meliputi :
1. Simple Random Sampling
Dikatakan simple (sederhana) karena
pengambilan sampel anggota populasi dilakukan secara acak tanpa memperhatikan
strata yang ada dalam populasi itu. Cara itu dapat digunakan bila anggota
populasi dianggap homogen.
2. Proportionate Stratified Random Sampling
Teknik ini digunakan bila populasi
mempunyai anggota/unsur yang tidak homogen dan berstrata secara proporsional.
3. Disproportionate
Stratified Random Sampling
Teknik ini digunakan untuk
menentukan jumlah sampel, bila populasi berstrata tetapi kurang proporsional.
4. Cluster Sampling (Area Sampling)
Teknik sampling daerah digunakan untuk menentukan sampel bila obyek yang
akan diteliti atau sumber data sangat luas, misal penduduk dari suatu negara,
propinsi, atau kabupaten.
b. Nonprobability Sampling
Nonprobabiliti sampling adalah teknik yang tidak memberi
peluang/kesempatan sama bagi setiap unsur atau anggota populasi untuk dipilih
menjadi sampel. Teknik sampel ini meliputi :
1. Sampling
Sistematis
Sampling sistematis adalah teknik penentuan sampel berdasarkan urutan
dari anggota populasi yang telah diberi nomor urut. Misalnya anggota populasi
yang terdiri atas 100 orang. Dari semua anggota kelompok itu diberi nomor urut
1 sampai dengan nomor 100.
2. Sampling Kuota
Sampling kuota adalah teknik untuk menentukan sampel dari populasi yang
mempunyai ciri-ciri tertentu sampai jumlah (kuota) yang diinginkan.
3. Sampling Aksidental
Sampling aksidental adalah teknik penentuan sampel berdasarkan
kebetulan, yaitu siapa saja yang kebetulan bertemu dengan peneliti dapat
digunakan sebagai sampel, bila dipandang orang yang ditemui itu cocok sebagai
sumber data.
4. Sampling Purposive
Sampling purposive adalah teknik penentuan sampel dengan pertimbangan
tertentu.
5. Sampling Jenuh
Sampling jenuh adalah teknik penentuan sampel jika semua anggota
populasi digunakan sebagai sampel. Hal ini biasa dilakukan bila jumlah populasi
relatif kecil, kurang dari 30.
6. Snowball Sampling
Snowball sampling adalah teknik
penentuan sampel yang mula-mula jumlahnya kecil, kemudian sampel ini disuruh
memilih teman-temannya untuk dijadikan sampel, begitu seterusnya hingga jumlah
sampel semakin banyak.
2.
Pengertian Statistik
Kata statistik
mempunyai arti yang berbeda untuk orang yang berbeda. Bagi seorang menejer tim sepak
bola, statistik bisa berarti beberapa kali kesebelasan yang dipimpinnya menang,
kalah atau draw. Bagi seorang menejer perusahaan, statistik dapat berarti
jumlah penjualan dari tahun ke tahun, dan bagi seorang mahasiswa, statistik
bisa berarti salah satu bidang studi yang harus dipelajari.
Kata “statistik”
berasal dari bahasa Italia “statista” yang berarti negarawan. Istilah tersebut
pertama digunakan oleh Gottfried Achenwall (1719 – 1772). Ia mengambil kata
statistik karena melihat bahwa yang mula-mula menyadari kegunaan data atau
keterangan tentang rakyat adalah Negara. Pada abad pertengahan, Negara-negara
mengadakan sensus penduduk untuk memudahkan mereka memobilisasi rakyat dan
menarik pajak. Achenwall mengartikan statistik sebagai keterangan-keterangan
yang butuhkan oleh Negara.
Pada
perkembangan lebih lanjut, kata statistik dapat diartikan sebagai data maupun
metoda ilmiah. Dewasa ini statistik sebagai data lebih dikenal dengan istilah
data statistik dan statistik sebagai metode ilmiah disebut statistik.
Kemudian
dikenallah “Statistik Induktif” yang didefenisikan sebagai kumpulan metoda yang
digunakan untuk menganalisis informasi yang ada pada sampel untuk mengambil
kesimpulan bagi populasi.
Ukuran-ukuran
pada populasi disebut parameter populasi dan ukuran-ukuran pada sampel disebut
sebagai statistik sampel. Pada statistik induktif hasil analisis pada statistik
sampel digunakan untuk mengambil kesimpulan (menduga) parameter populasi.
Agar diperoleh
suatu sampel yang representatif, maka teknik pengambilan sampel (teknik
sampling) harus baik. Pada statistik induktif diasumsikan bahwa pengambilan
sampel bersifat random atau acak, artinya setiap anggota populasi memiliki
probabilita yang sama untuk dipilih sebagai sampel.
Fungsi dari
variabel random yang terkait dengan sampel random disebut sebagai statistik.
Jika X1, X2, …, Xn adalah sampel random berukuran n dengan nilai masing-masing
X1, X2, …, Xn dan H adalah fungsi untuk X1, X2, …, Xn maka :
Y = H {X1, X2,
…, Xn}
Sebagai
statistik dengan nilai statistiknya adalah :
y = h
{X1, X2, …., Xn}
3.
Defenisi Distribusi Sampel
Distribusi
sampel statistik y adalah distribusi probabilitas dari statistik Y. Jika kita
anggap bahwa pemilihan sampel acak sederhana sebagai suatu eksperimen, maka
rata-rata sampel X merupakan deskripsi numerik dari hasil percobaan. Dari
contoh penarikan sampel yang yang telah dijelaskan di atas, kita tahu bahwa ada
lebih dari satu kemungkinan hasil. Pada contoh di atas untuk populasi berukuran
N = 5 dan sampel berukuran n = 3 diambil dari populasi tersebut, maka terdapat
kombinasi nilai-nilai dalam sampel sebanyak 5C3 = 10
macam kombinasi. Dari setiap kombinasi ini dapat dicari nilai rata-ratanya.
Jadi dalam hal ini, rata-rata sampel, merupakan variabel acak.
Karena terdapat
beberapa nilai nilai X yang diperoleh dari 10 kemungkinan sampel, maka
rata-rata dari seluruh kemungkinana nilai X juga mempunyai varians dan
distribusi probabilitas. Karena berbagai macam kemungkinan nilai X adalah hasil
dari sampel acak sederhana yang berbeda, maka distribusi probabilitas dari X
disebut distribusi penarikan sampel dari
nilai rata-rata .
Dalam prakteknya
kita hanya memilih satu sampel acak sederhana dari populasi diantara seluruh
kemungkinan yang ada. Disamping distribusi penarikan sampel nilai rata-rata , kita juga mengenal distribusi penarikan sampel untuk
proporsi P.
Distribusi
penarikan sampel dari adalah distribusi
probabilitas dari seluruh kemungkinan nilai-nilai dari rata-rata sampel .
Distribusi Sampling merupakan distribusi
teoritis dari semua hasil sampel yang mungkin, dengan ukuran sampel yang tetap
N. pada statistic yang digeneralisasikan ke populasi.
Beberapa Teknik Penarikan Penarikan Sampel :
·
Penarikan sampel acak sederhana : Pengacakan dapat dilakukan dengan undian, tabel bilangan
acak, program komputer.
·
Penarikan Sampel Sistematik :
Tetapkan interval lalu pilih secara acak anggota pertama sampel.
·
Penarikan Sampel acak berlapis :
populasi terdiri dari beberapa kelas/kelompok. Dari setiap kelas diambil sampel
secara acak.
·
Penarikan Sampel Gerombol/kelompok
: populasi juga terdiri dari beberapa kelas/kelompok sampel yang diambil berupa
kelompok bukan individu anggota.
·
Penarikan sampel area : prinsipnya
sama dengan cluster sampling. Pengelompokan ditentukan oleh letak geografis
atau administrative.
4. Distribusi Sampling Rata-Rata
Beberapa notasi :
n : ukuran sampel N : ukuran populasi
: rata-rata sampel m : rata-rata populasi
s
: standar deviasi sampel s :standar
deviasi populasi
: rata-rata antar
semua sampel : standar deviasi
sampel
2.1 Distribusi
Sampling Rata-rata Sampel Besar
Dalil 1
JIKA
Sampel: ü
berukuran = n ³ 30 ý
diambil DENGAN PEMULIHAN dari
rata-rata = þ
ì Populasi berukuran = N
í
Terdistribusi NORMAL
î Rata-rata = m ; simpangan baku = s
MAKA
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
= m dan dan nilai
Dalil 2
JIKA
Sampel: ü
berukuran = n ³ 30 ý diambil TANPA PEMULIHAN dari
rata-rata = þ
ì Populasi berukuran = N
í
Terdistribusi NORMAL
î Rata-rata = m ; simpangan baku = s
MAKA
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
= m dan dan nilai
a.
disebut sebagai FAKTOR
KOREKSI populasi terhingga.
b.
Faktor Koreksi (FK) akan menjadi
penting jika sampel berukuran n diambil dari populasi berukuran N yang
terhingga/ terbatas besarnya
c.
Jika sampel berukuran n diambil dari
populasi berukuran N yang sangat besar maka FK akan mendekati 1 ® , hal ini mengantar kita pada dalil ke-3 yaitu
DALIL LIMIT PUSAT = DALIL BATAS TENGAH = THE CENTRAL LIMIT THEOREM
Dalil 3 DALIL LIMIT PUSAT
JIKA
Sampel: ü
berukuran = n ý diambil dari
rata-rata = þ
ì Populasi berukuran = N yang BESAR
í
distribusi : SEMBARANG
î Rata-rata = m ; simpangan baku = s
MAKA
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
= m dan dan nilai
·
Dalil Limit Pusat berlaku untuk :
- penarikan sampel dari populasi yang sangat besar,
-
distribusi populasi tidak
dipersoalkan
·
Beberapa buku mencatat hal berikut
: Populasi dianggap BESAR jika ukuran sampel
KURANG DARI 5 % ukuran populasi
atau
Dalam pengerjaan soal DISTRIBUSI SAMPLING RATA-RATA perhatikan
asumsi-asumsi dalam soal sehingga anda dapat dengan mudah dan tepat menggunakan dalil-dalil tersebut!
Contoh 1:
PT
AKUA sebuah perusahaan air mineral rata-rata setiap hari memproduksi 100
juta gelas air mineral. Perusahaan ini
menyatakan bahwa rata-rata isi segelas AKUA adalah 250 ml dengan standar
deviasi = 15 ml. Rata-rata populasi
dianggap menyebar normal.
1.
Jika setiap hari diambil 100 gelas
AKUA sebagai sampel acak DENGAN
PEMULIHAN, hitunglah :
a. standard error atau galat baku sampel
tersebut?
b. peluang rata-rata sampel akan berisi kurang dari 253 ml?
2.
Jika sampel diperkecil menjadi 25
gelas, hitunglah :
a. standard error atau
galat baku sampel tersebut?
b. peluang rata-rata sampel akan berisi lebih dari 255 ml?
1.
Diselesaikan dengan DALIL 1 ® karena PEMULIHAN
Diselesaikan
dengan DALIL 3 ® karena POPULASI SANGAT BESAR
N = 100 000 000 = m = 250 s = 15 n = 100
P( < 253) = P(z <
?)
GALAT BAKU =
Jadi P( < 253) = P(z <
2.0) = 0.5 + 0.4772 = 0.9772
2.
Diselesaikan dengan DALIL 3 ® karena POPULASI SANGAT BESAR
N = 100 000 000 = m = 250 s = 15 n = 25
P( > 255) = P(z >
?)
GALAT BAKU =
Jadi P( > 255 ) = P(z >
1.67) = 0.5 - 0.4525 = 0.0475
Contoh 2 :
Dari 500 mahasiswa FE-GD diketahui
rata-rata tinggi badan = 165 cm dengan standar deviasi = 12 cm, diambil 36
orang sebagai sampel acak. Jika
penarikan sampel dilakukan TANPA PEMULIHAN dan rata-rata tinggi mahasiswa
diasumsikan menyebar normal, hitunglah :
a. galat baku sampel?
b. peluang sampel akan memiliki rata-rata tinggi badan
kurang dari 160 cm?
Diselesaikan dengan DALIL 2 ® TANPA PEMULIHAN
N = 500 = m = 165 s = 12 n = 36
Catatan ® Dalil Limit Pusat tidak dapat digunakan
P(< 160) = P(z < ?)
FK =
GALAT BAKU x FK = = 2 x 0.964... = 1.928...
P(< 160) = P(z < -2.59) = 0.5 - 0.4952 = 0.0048
6. Distribusi Sampling Rata-rata
Sampel Kecil
·
Distribusi Sampling didekati
dengan distribusi t Student = distribusi t (W.S. Gosset). Distribusi-t pada prinsipnya
adalah pendekatan distribusi sampel kecil dengan distribusi normal.
Dua hal yang perlu diperhatikan dalam
Tabel t adalah
1. derajat bebas (db)
2.
nilai a
Derajat bebas (db) = degree
of freedom = v = n - 1.
n : ukuran sampel.
·
Nilai a adalah luas daerah kurva di kanan nilai t atau luas daerah kurva di kiri nilai -t
·
Nilai a ® 0.1 (10%) ; 0.05 (5%) ;
0.025(2.5%) ; 0.01 (1%) ; 0.005(0.5%)
Nilai a terbatas
karena banyak kombinasi db yang harus disusun!
·
Kelak Distribusi t akan kita
gunakan dalam PENGUJIAN HIPOTESIS
·
Pembacaan Tabel Distribusi-t
Misalkan n = 9 ® db = 8; Nilai a ditentukan = 2.5% di kiri dan kanan kurva
t tabel (db, a) = t tabel(8; 0.025) = 2.306
Jadi t = 2.306 dan -t =
-2.306
2.5% 95 % 2.5%
-2.306 0 2.306
Arti Gambar di atas nilai t sampel
berukuran n = 9, berpeluang 95% jatuh dalam selang -2.306 < t < 2.306. Peluang t >2.306
= 2.5 %
dan Peluang t < -2.306 = 2.5 %
Coba cari nilai t tabel untuk beberapa
nilai db dan a yang lain!
·
Perbedaan Tabel z dan Tabel t
Tabel z ® nilai z
menentukan nilai a
Tabel t ® nilai a dan db menentukan nilai t
·
Dalam banyak kasus nilai simpangan baku populasi (s) tidak diketahui, karenanya nilai s diduga dari nilai simpangan baku sampel (s).
Dalil 4
JIKA
Sampel: ü
ukuran KECIL n < 30 ý diambil dari
rata-rata = simp. baku = s þ
ì Populasi berukuran = N
í terdistribusi : NORMAL
î Rata-rata = m
MAKA
Distribusi Rata-rata akan mendekati distribusi-t dengan :
= m dan dan nilai
pada derajat bebas = n-1 dan suatu nilai a
Contoh 3 :
Manajemen PT JURAM menyatakan bahwa 95%
rokok produksinya rata-rata mengandung nikotin 1.80 mg, data tersebar
normal. Yayasan Konsumen melakukan
pengujian nikotin terhadap 9 batang rokok dan diketahui rata-rata sampel = 1.95
mg nikotin dengan standar deviasi = 0.24 mg. Apakah hasil penelitian Yayasan
Konsumen mendukung pernyataan Manajemen PT JURAM?
Jawab : 95
% berada dalam selang ® berarti 5 %
berada di luar selang;
2.5 % di kiri t dan 2.5% di kanan t
a = 2.5 % =
0.025
n = 9 ® db = n - 1 = 8
t tabel (db, a) =
t-tabel(8; 0.025) = 2.306
Jadi 95 % berada dalam selang -2.306 < t < 2.306
Nilai t-hitung = ? m = 1.80 n =
9 = 1.95
s = 0.24
=
Nilai t hitung = 1.875 berada dalam selang -2.306 < t < 2.306 jadi hasil
penelitian Yayasan Konsumen masih sesuai dengan pernyataan manajemen PT JURAM.
7. Distribusi Sampling Bagi Beda
2 Rata-rata
Dalil 5
JIKA
Dua (2) Sampel ü
berukuran dan ý diambil dari
rata-rata = dan þ ì Dua (2) Populasi berukuran BESAR
í Rata-rata dan
î Ragam dan
MAKA
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
dan standard
error = dan
nilai z
·
Beda atau selisih 2 rata-rata = ® ambil nilai mutlaknya!
·
Melibatkan 2 populasi yang BERBEDA
dan SALING BEBAS
·
Sampel-sampel yang diambil dalam banyak kasus (atau jika
dilihat secara akumulatif) adalah sampel BESAR
Contoh 4:
Diketahui rata-rata IQ mahasiswa Eropa =
125 dengan ragam = 119 sedangkan rata-rata IQ mahasiswa Asia = 128 dengan ragam
181. diasumsikan kedua populasi berukuran besar. Jika diambil 100 mahasiswa
Eropa dan 100 mahasiswa Asia sebagai sampel, berapa peluang terdapat perbedaan
IQ kedua kelompok akan kurang dari 2?
Jawab :
Populasi
Parameter
|
populasi
ke-1 (Mhs. Eropa)
|
populasi
ke-2 (Mhs. Asia)
|
Rata-rata
(m)
|
125
|
128
|
Ragam
(s²)
|
119
|
181
|
Beda 2 Rata-rata = =
Sampel : = 100 = 100
P( <2 ) = P ( z < ?)
P(z<-0.58) = 0.5 - 0.2190 = 0.2810
2.2
Mean Sampel Random
Jika X1, X2, …,
Xn adalah sampel random berukuran n dari populasi variabel X dengan mean
populasi E(X), varians populasi , dan mean sampel random.
, maka
Ekspetasi mean sampel random
E(X) = E(X)
Dan Variansi mean sampel random
Dimana :
varians mean sampel random
varians populasi
n = ukuran sampel
2.3
Dalil Limit Sentral
Jika adalah mean dari suatu
sampel random berukuran n yang diambil dari populasi dengan mean dan varians , maka limit distribusinya adalah :
Dimana :
Z = limit distribusi
= rata-rata populasi
X = rata-rata sampel
n = ukuran sampel
= varians
Dengan n merupakan distribusi
normal standar n(z, 0, 10).
The Central
Limit Theorem adalah suatu dalil yang sangat penting peranannya dalam
distribusi sampling. Dalil ini mengatakan : “Untuk suatu populasi dengan
rata-rata dan varians , distribusi sampling rata-rata dari semua kemungkinan sampel
berukuran n yang diambil dari populasi, akan terdistribusi secara normal dengan
rata-rata dan deviasi standar , dimana sama dengan rata-rata
populasi () dan sama dengan deviasi
standar populasi dibagi akar n atau , dengan asumsi bahwa ukuran sampel cukup besar”.
Dalam pemilihan
sampel acak sederhana dengan ukuran n dari suatu populasi yang berasal dari
distribusi apapun (Binomial, Poisson, dan sebagainya) maka distribusi dari
rata-rata sampel dapat didekati dengan distribusi probabilitas normal untuk
ukuran sampel yang besar.
Hal-hal penting yang perlu diingat dari dalil ini adalah :
1. Jika ukuran sampel (n) lebih besar, distribusi
rata-rata sampel akan mendekati normal, tidak peduli apakah populasinya
terdistribusi, secara normal atau tidak.
2. dan
Dimana : rata-rata populasi
deviasi standar dari
distribusi sampling rata-rata
= deviasi standar populasi
n =
ukuran sampel
3. Tidak ada angka yang pasti tentang “ukuran
sampel yang cukup besar”, tapi biasa
angka n > 30 dianggap cukup besar.
Distribusi
sampling rata-rata telah dibicarakan sebelumnya. Hakekatnya distribusi sampling
rata-rata adalah distribusi probabilita rata-rata sejumlah C sampel, dimana N
adalah ukuran populasi dan n adalah ukuran sampel yang diambil dari populasi.
Distribusi ini
memiliki rata-rata dan deviasi standar dan menurut Central
Limit Theorem, dan .
Misalnya pada
“Bank Pasti Aman” menghitung tabungan seluruh nasabahnya ternyata rata-rata
tabungan / nasabahnya adalah Rp. 2000,- dengan deviasi standar Rp. 600,-. Bila
seorang peneliti mengambil sampel sebanyak 100 nasabah dari populasi 600, maka
akan terdapat kombinasi sampel yang
mungkin dengan kata lain akan terdapat sebanyak rata-rata sampel.
Jumlah rata-rata sampel tersebut cukup banyak sehingga distribusinya akan
normal (hal ini konsisten dengan Central Limit Theorem). Distribusi sampling
rata-rata ini memiliki rata-rata dan deviasi standar sebagai berikut :
= = 60
2.4
Faktor Koreksi Untuk Populasi Terbatas.
Jika populasi
(keseluruhan obyek penelitian) sangat besar, kita asumsikan populasi tersebut
tidak terbatas (infinite). Bagaimana jika populasi tidak tak terbatas (tidak
infinite) atau tidak sangat besar ? Dalam kasus ini kita akan melakukan
beberapa penyesuaian/koreksi terhadap deviasi standar dari distribusi sampling
caranya adalah mengalikan dengan suatu faktor
koreksi sebesar atau
x
Dimana ;
N = ukuran populasi (yang
trebatas/tidak terbatas)
n
= ukuran sampel
Mengapa faktor koreksi ini perlu dan apa
efeknya ? Jika sampel adalah suatu persentase yang cukup besar dari
populasinya, maka kita mengharapkan ukurannya akan lebih tepat dari pada ukuran
suatu sampel yang lebih kecil. Perhatikan efek dari faktor koreksi, misalkan
kita mengambil sampel dengan ukuran 100 dari populasi dengan ukuran 1000 faktor
koreksinya adalah sebesar.
Jika dikendalikan
dengan faktor koreksi tersebut, deviasi standar distribusi sampling rata-rata
(atau standar error of the mean) akan berkurang sebesar 1 – 94,92 % = 5%.
Semakin besar ukuran sampel, pengurangan standar error ini semakin besar,
demikian sebaliknya.
Perhitungan
faktor koreksi untuk berbagai ukuran sampel jika populasi adalah 1000.
Ukuran Sampel n
|
Bagian dari populasinya
(n/N)
|
Faktor Koreksi
|
10
|
1%
|
99,55%
|
25
|
2,5%
|
98,79%
|
50
|
5%
|
97,52%
|
100
|
10%
|
94,92%
|
200
|
20%
|
89,49%
|
500
|
50%
|
70,75%
|
Nampak jika n/N
lebih kecil dari 5%, faktor koreksi mendekati 1 sehingga muncul aturan jika n/N
lebih kecil dari 5%, faktor koreksi tidak perlu digunakan, kalaupun digunakan,
tidak akan banyak pengaruhnya karena nilainya mendekati 1.
Misalnya bila
sampel random dengan n = 10 dipilih dari populasi sebesar 40 dengan rata-rata
5,5 dan deviasi standar 2,9155, berapa rata-rata dan deviasi distribusi
sampling rata-rata.
Maka, menurut
Central Limit Theorem dan penyesuaian terhadap koreksi :
dan
x
=
0,27735
2.5
Pengujian Hipotesis
Hipotesis adalah
asumsi atau dugaan dengan mengenai sesuatu, yang memerlukan pengecekan untuk
membuktikannya. Jika asumsi atau dugaan itu dikhususkan untuk populasi, umumnya
mengenai nilai parameter populasi, maka hipotesis itu disebut hipotesis
statistik.
Suatu penduga
tunggal (point estimator) ialah pendugaan yang terdiri dari satu nilai saja
misalnya, rata-rata konsumsi susu per bulan tiap keluarga sebanyak 35 kaleng ( = 35 sebagai penduga
dari ), ataupun persentase nasabah yang tidak puas sebesar 25% ( sebagai penduga p. dan disebut penduga atau estimator, dan p yang merupakan
parameter. Di bawah ini akan diberikan beberapa penduga dan parameter, yaitu :
Penduga : s r b
Parameter : p B
Dimana (dibaca rho) adalah
koofisien korelasi sebenarnya, dan B adalah koofisien regresi sebenarnya. Satu
parameter dapat mempunyai beberapa penduga.
Penduga tunggal
merupakan fungsi dari nilai observasi yang berasal dari sampel dengan n elemen.
Dalam
prakteknya, pendugaan tunggal yang terdiri dari satu angka tidak memberikan
gambaran mengenai berapa jarak/selisih nilai penduga tersebut terhadap nilai
sebenarnya. Kecuali kalau diberikan besarnya kesalahan yang mungkin terjadi.
Misalnya, kalau sampel suatu perusahaan diselidiki dan memiliki nilai penduga
modal (= ) sebesar Rp 100 juta, berapa niali rata modal sebenarnya (= )? Kita tahu bahwa kesalahan).
Itulah sebabnya
sering digunakan pendugaan interval (selang), yaitu suatu pendugaan berupa
interval yang dibatasi oleh dua nilai, yang disebut nilai batas bawah dan nilai
batas atas. Misalnya rata-rata modal akan terletak dalam interval antara Rp. 95
juta – Rp. 105 juta.
Kita
mengharapkan bahwa nilai rata-rata modal sebenarnya akan terletak di dalam
interval tersebut. Interval yang demikian itu disebut interval keyakinan atau
selang keyakinan (confidence interval).
Persentase =
proporsi x 100%. Perkiraan proporsi ini sangat penting, misalnya dalam
penelitian pendapat umum untuk mengetahui berapa % yang setuju dengan calon
presiden; dalam pemasaran berapa % dari ibu rumah tangga yang akan membeli
mesin jahit, berapa % barang produksi yang rusak; berapa % penduduk suatu
daerah yang masih buta huruf; berapa % karyawan suatu perusahaan yang lesu;
berapa % nasabah suatu bank yang tidak puas dengan layanan bank tersebut;
berapa % petani peminjam kredit Bimas yang tidak bisa mengembalikan pinjaman
tersebut; berapa % proyek yang tidak selesai pada waktunya, dan lain
sebagainya.
Di dalam setiap
penelitian, elemen populasi/sampel dapat dikategorikan sesuai dengan
karakteristik tertentu. Misalnya, elemen populasi/sampel dapat dikategorikan
sesuai dengan karakteristik tertentu. Misalnya elemen populasi/sampel tersebut
dibagi menjadi dua kelompok atau kategori, yaitu pemilih dikelompokkan menjadi
setuju dan tidak setuju; ibu rumah tangga dikelompokkan menjadi amu membeli dan
tidak mau membeli TV, dan lain sebagainya.
Bila kita ingin
mengetahui apakah distribusi frekuensi hasil percobaan kita sesuai dengan
distribusi frekuensi yang kita harapkan, maka maka kita akan mengadakan
pengujian. Salah satu metode yang terkenal adalah metode Goodness Of Fit. Pengujian ini didasarkan atas statistik
:
X2
hit =
Dengan :
Oi = fekuensi
observasi (hasil percobaan) untuk kelas ke-i
ei = frekuensi yang diharapkan untuk kelas ke-i
k =
jumlah kelas
X = nilai
variabel random yang distribusi sampelnya didekati dengan distribusi chi-square dengan derajat kebebasan
v = k – r – 1, dengan r adalah banyaknya parameter yang ditaksir dari populasi
adalah mean dan simpangan baku,
maka r = 2
Frekuensi
harapan pada tiap kelas sebaiknya tidak lebih kecil dari 5, jika hal ini terjadi
maka harus dilakukan penggabungan dengan kelas-kelas yang berdekatan dengan
kelas tersebut. Sehingga diperoleh sebuah kelas baru dengan frekuensi harapan
lebih besar atau sama dengan 5 (dengan demikian jumlah total kelas seluruhnya k
akan berkurang dari semula).
Untuk dapat
mengambil kesimpulan apakah hipotesis kita terhadap data yang diperoleh dari
percobaan mengikuti pola distribusi frekuensi yang kita duga (harapkan), maka
harus dilakukan perbandingan sebagai berikut :
X2
hit > X2 y
Dengan adalah tingkat
kepercayaan dari harga X2y diperoleh dari tabel chi kuadrat. Apabila pertidaksamaan di
atas dipenuhi, maka hipotesis nol ditolak. Untuk lebih jelasnya, praktikan
disarankan untuk mempelajari uji Goodness of
Fit dari buku-buku statistika. Tabel yang digunakan untuk memudahkan
perhitungan pengujian distribusi dengan metode Goodness of Fit disajikan di
tabel sebagaiman yang terdapat dalam bab selanjutnya.
2.6 Distribusi Frekuensi
Distribusi frekuensi merupakan
suatu ringkasan dalam bentuk tabel dari suatu kelompok data yang menunjukkan
frekuensi item-item (kategori-kategori) dalam beberapa kelas. Adapun
langkah-langkah yang perlu dilakukan untuk membuat daftar distribusi frekuensi
adalah sebagai berikut :
1.
Tentukan rentang, selisih nilai
terbesar dan terkecil.
2.
Tentukan jumlah kelas, k dengan
menggunakan rumus :
k = 1 +
3.322 log n, n : banyaknya nilai
observasi.
3.
Tentukan jumlah interval kelas
(c), dengan rumus :
Dimana : k : Banyaknya kelas
Xn : Nilai observasi terbesar
X1 : Nilai
observasi terkecil.
4.
Tentukan tepi batas kelas
Batas kelas bawah menunjukkan kemungkinan nilai data
terkecil pada suatu kelas. Sedangkan batas kelas atas mengidentifikasikan kemungkinan
nilai data terbesar dalam suatu kelas.
Seringkali dalam penyusunan tabel distribusi frekuensi, tabel
distribusi frekuensi relatif dan kumulatif serta grafik juga disertakan dengan
tujuan untuk mempermudah memahami data.
Tabel 2.1. Frekuensi Hipotesis
Relatif dan Kumulatif
X
|
F
|
Fr
|
Fk*
|
Fk**
|
(1)
|
(2)
|
(3)
|
(4)
|
(5)
|
X1
X2
…
Xi
…
Xk
|
f1
f2
…
fi
…
fk
|
f1/n
f2/n
…
fi/n
…
fk/n
|
f1
f1 + f2
…
f1 + f2 + … + fi
…
f1 + f2 + … + fi + … + fk
|
f1 + f2 + … + fi + … + fk f2 + … + fi
+ … + fk
…
f1 + fk
…
fk
|
Jumlah
|
|
|
|
|
*Sama atau kurang dari
**Sama atau lebih
dari
Grafik dalam distribusi frekuensi sering
digambarkan dalam bentuk histogram atau grafik batangan (bar chart) dan frekuensi poligon.
Gambar 2.1. Bentuk Histogram dan
Kurva Frekuensi Poligon.
Perhitungan distribusi frekuensi untuk data berkelompok dapat dicari
berdasarkan ukuran pemusatannya,
ukuran letaknya, dan ukuran variansinya.
Tabel 2.2.
Rumus Ukuran Pemusatan
Jenis Ukuran
|
Data Yang diperlukan
|
Rumus
|
Keterangan
|
Rata-Rata Hitung
|
Titik data dan
frekuensinya.
|
|
Xi : Data
fi : Frekuensi data
|
Rata-Rata Ukur
|
Nilai titik tengah
dan frekuensinya.
|
|
Xi : Nilai tengah
fi : Frekuensi data
|
Modus
|
Tepi batas kelas,
interval kelas, frekuensi masing-masing kelas.
|
|
o Tb : Tepi bawah kelas modus
o d1 : Frekuensi kelas modus –
frekuensi kelas sebelumnya.
o d2 : Frekuensi kelas modus –
frekuensi kelas sesudahnya.
o C : Interval kelas
|
Tabel 2.3. Rumus Ukuran Letak
Jenis Ukuran
|
Data Yang diperlukan
|
Rumus
|
Keterangan
|
Median (Med)
|
Tepi batas kelas,
interval kelas, frekuensi kumulatif, frekuensi masing-masing kelas.
|
|
o tb : Tepi bawah kelas yang memuat median
o c : Interval kelas.
o fk : Frekuensi kumulatif sebelum kelas yang memuat
median.
o f : Frekuansi yang memuat median
|
Kuartil (Qi)
|
Tepi batas kelas,
frekuensi kumulatif, frekuensi masing-masing kelas, panjang interval kelas.
|
* Letaknya :
Qi
= [i / 4] x n,
dimana i =
1, 2, 3.
* Nilai / besarnya
:
|
o tb : Tepi bawah keas Qi.
o fki : Frekuensi kumulatif sebelum kelas Qi.
o fi : Frekuensi kelas Qi.
o n : Banyaknya data.
|
Desil
(Di)
|
Tepi batas kelas,
frekuensi kumulatif, frekuensi masing-masing kelas, panjang interval kelas.
|
Letaknya :
Di = [i
/ 10] x n,
dimana i = 1, 2, 3, … , 9.
Nilai / besarnya :
|
o tb : Tepi bawah keas Di.
o fki : Frekuensi kumulatif sebelum kelas Di.
o fi : Frekuensi kelas Di.
o n : Banyaknya data.
|
Persentil
(Pi)
|
Tepi batas kelas,
frekuensi kumulatif, frekuensi masing-masing kelas, panjang interval kelas.
|
Letaknya :
Pi = [i
/ 100] x n,
dimana i = 1, 2, 3, … , 99.
Nilai / besarnya :
|
o tb : Tepi bawah keas Di.
o fki : Frekuensi kumulatif sebelum kelas Di.
o fi : Frekuensi kelas Di.
o n : Banyaknya data.
|
Tabel 2.4. Rumus Ukuran Variansi
Jenis Ukuran
|
Data Yang diperlukan
|
Rumus
|
Keterangan
|
|
Variansi
|
Data dan frekuensi
masing-masing kelas, rata-rata data.
|
|
n : Sƒi
Xi : Data ke-i.
: Rata-rata data.
ƒi : Frekuensi data ke-i.
|
|
Simpangan Baku
|
Data dan frekuensi
masing-masing kelas, rata-rata data.
|
|
S2 : Varinsi
|
|
Simpangan
Rata-Rata
|
Data dan frekuensi
masing-masing kelas, rata-rata data.
|
|
Xi : Data ke-i.
: Rata-rata data.
ƒi : Frekuensi data ke-i.
|
|
Simpangan
Kuartil
|
Interval kelas,
frekuensi masing-masing kelas, tepi batas kelas, dan frekuensi kumulatif.
|
, dimana :
|
o f1 : frekuensi yang memuat Q1.
o f3 : frekuensi yang memuat Q3.
o fk1 : frekuensi kumulatif sebelum kelas Q1
o fk3 : frekuensi kumulatif sebelum kelas Q3.
|
|
Skewness
(Kemiringan)
|
Data dan frekuensi
masing-masing kelas, rata-rata data.
|
|
S : Simpangan
baku.
|
|
Kurtosis
(Keruncingan)
|
Data dan frekuensi
masing-masing kelas, rata-rata data.
|
|
S : Simpangan baku.
|
|
Distribusi Diskrit
a. Distribusi probabilitas uniform diskrit
Algoritma
- Bangkitkan U(0,1)
- Dapatkan X = a+(b-a+1)*U
Contoh
Sebuah perusahaan bakery membuat suatu kelompok jenis donat
yang dijual ke toko-toko dengan distribusi diskrit uniform dengan kebutuhan
harian maksimum 100 unit dan minimum 40 unit.
Tentukan bilangan acak dari
distribusi diskrit uniform dengan a = 77 z0 = 12357 dan m = 128
b.
Distribusi Poisson
Algoritma
- Hitung a=, b =1 dan i =0
- Bangkitkan Ui+1= U(0,1)
- Ganti b = bUi+1
- Jika b<a maka dapatkan X = i dan jika tidak lanjutkan ke langkah 5
- Ganti i = i+1 kembali ke langkah 2
Contoh:
Suatu kejadian berdistribusi
poisson dengan rata-rata 3 kejadian perjam dan terjadi selama periode waktu 1,4
jam.Tentukan bilangan acak dari distribusi poisson dengan a = 17 z0
= 12357 dan m = 1237.
c. Distribusi Binomial
Metode transformasi dari
distribusi binomial
Dengan
mempergunakan fungsi densitas binomial yang dinyatakan dengan : , k = 0,1, 2 .. n
F(x) =
Contoh
Dari suatu distribusi
binomial, diketahui p =0,5 dan n =2.
Tentukan bilangan acak dari
distribusi binomial dengan a = 77 z0 = 12357 dan m = 127.
d. Distribusi Geometri
Algoritma
- Bangkitkan U(0,1)
- Dapatkan X = ln(U)/ln(1-p)
Contoh: Pada seleksi karyawan
baru sebuah perusahaan terdapat 30 % pelamar yang sudah mempunyai keahlian
komputer tingkat advance dalam pembuatan program. Para pelamar diinterview
secara insentif dan diseleksi secara acak.
Tentukan bilangan acak dengan
a = 43, m = 1237 dan z0 = 12357.
Distribusi Kontinu
a. Distr probabilitas uniform kontinu
Algoritma
1. Bangkitkan U(0,1)
2.
Dapatkan X = a+(b-a)*U
Contoh
Pada suatu sentra telpon
ternyata distribusi pelayanan telponnya berdistribusi uniform kontinu dengan
minimal waktu 3 menit dan maksimal 5 menit. Tentukan bilangan dengan a =
173 z0 = 12357 dan m = 1237.
b. Distribusi Eksponensial
Algoritma
1. Bangkitkan U(0,1)
2.
Dapatkan X =
Dengan rata-rata dengan nilai > 0
Contoh
Pada suatu sentra telpon
ternyata distribusi penerimaan telponnya berdistribusi eksponensial dengan mean
= 0,1 menit. Tentukan bilangan 10 acak dengan a = 173 z0 = 12357 dan m = 1237.
c.
Distribusi Normal
Algoritma
1.
Bangkitkan U1,U2=
U(0,1)
2. Hitung V1= 2U1-1 dan
V2= 2U2-1
3.
Hitung W = V12
+ V22
4. Jika W > 1 maka kembali ke langkah 1
dan jika tidak lanjutkan ke langkah 5
5. Hitung
6. Dapatkan X1= V1Y dan
X2=V2Y
7.
Contoh
Sebuah rumah sakit berniat
mempelajari penggunaan suatu alat pada ruang emergency. Jika diketahui bahwa
lamanya seorang pasien yang di’treat’ menggunakan alat tsb berdistribusi normal
dgn mean 0.8 jam dan standard deviasi 0.2 jam, tentukan bilangan acak yang
mewakili lamanya penggunaan alat tersebut oleh 6 orang pasien.
d. Distribusi Gamma
Algoritma
1.Bangkitkan U1 dan U2
2.X = -b ln (U1 * U2)
di mana
b adalah parameter.
Contoh:
Mesin
pada suatu pabrik perlu diperbaiki setiap saat ‘breakdown’ dengan biaya
$100/hari. Jika lama perbaikan mesin berdistribusi gamma dengan parameter a = 2 dan b = 1/3, tentukan rata-rata biaya untuk 30
kali ‘breakdown’, jika diketahui mesin breakdown ke 29 kali mengalami lama
perbaikan selama 0.38 hari dengan rata-rata lama perbaikan 0.68 hari dgn
variansi S2 = 0.02.
Jawab:
U1 = 0.818
U2 = 0.322
X30 =
-b ln (U1 * U2)
= - 1/3 ln (0.818 *
0.322)
= 0.445 hari
\ Biaya
untuk memperbaiki mesin yg breakdown ke 30 kali adalah $100 x 0.445 hari = $
44.5
X30 - X29
Rata-rata ke 30 kali =
X30 = X29 +
30
0.445 - 0.38
= 0.68 +
30
=
0.68 + 0.0022
=
0.6822
Tidak ada komentar:
Posting Komentar