Minggu, 05 Mei 2013

Landasan teori Distribusi diskrit dan Kontinu



BAB II
LANDASAN TEORI
2.1    Sampel Random Dan Statistik
Sebuah peristiwa E dapat terjadi sebanyak n kali di antara N peristiwa yang saling eksklusif (saling asing / terjadinya peristiwa yang satu mencegah terjadinya peristiwa yang lain) dan masing-masing terjadi dengan kesempatan yang sama. Maka peluang  peristiwa E terjadi adalah :
      dengan batas-batas :  0  ≤ P(E) ≤ 1.
Jika P(E)  =  0, maka diartikan peristiwa E pasti tidak terjadi, sedangkan jika P(E)  =  1 diartikan peristiwa E pasti terjadi. Apabila  menyatakan bukan peristiwa E, maka diperoleh :

P()  =  1 – P(E).

Atau berlaku hubungan :
P(E)  +  P()  =  1
Sedangkan yang dimaksud dengan frekuensi nisbi suatu kejadian ialah :
Bila u  =  {u1, u2, …, un} dan P1 dicatat sebagai frekuensi nisbi timbulnya kejadian dasar (ui) maka :


Irisan dua kejadian A dan B dinyatakan dengan lambang :
A∩B, ialah kejadian yang unsurnya termasuk dalam A dan B.

Gabungan dua kejadian A dan B dinyatakan dengan lambang :
AB, ialah kejadian yang mengandung semua unsur yang termasuk A atau B atau keduanya.
       P(AB)              =  P(A) +  P(B)  -  P(A∩B)
P(A∩B)    =          1    -     P(AB).

1.    Sampel Random
Populasi adalah totalitas semua nilai yang mungkin dengan karakteristik tertentu, baik hasil menghitung maupun pengukuran, kuantitas maupun kualitatif, mengenai sekumpulan obyek yang lengkap dan jelas. Atau populasi adalah kumpulan seluruh elemen/obyek yang diteliti. Dengan kata lain populasi adalah wilayah generalisasi yang terdiri atas obyek/subyek yang mempunyai kuantitas dan karakteristik tetentu yang ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik kesimpulannya.
Jadi populasi bukan hanya orang, tetapi juga benda-benda alam yang lain. Populasi bukan juga sekedar jumlah yang ada pada obyek/subyek yang dipelajari, tetapi meliputi seluruh karakteristik/sifat yang dimiliki oleh obyek/subyek tersebut.
Misalnya akan melakukan penelitian di lembaga X, maka lembaga X ini merupakan populasi. Lembaga X mempunyai sejumlah orang/obyek dan obyek yang lain. Hal ini berarti populasi dalam arti jumlah/kuantitas. Tetapi lembaga X juga mempunyai karakteristik orang-orangnya, misalnya motivasi kerjanya, disiplin kerjanya, kepemimpinannya, iklim organisasinya dan lain-lain. Dan juga mempunyai karakteristik obyek yang lain misalnya, kebijakan, prosedur kerja, tata ruang, produk yang dihasilkan dan lain-lain. Yang terakhir populasi dalam arti karakteristik.
Dalam mempelajari statistika induktif kita sering menjumpai istilah populasi dan sampel. Populasi dalam defenisi statistik adalah seluruh kumpulan obyek-obyek atau orang-orang yang akan dipelajari atau diteliti, yang dari padanya dapat diambil suatu sampel. Maka sampel sendiri memiliki arti suatu bagian yang diambil dari suatu populasi. Populasi sangat banyak macamnya dan memiliki ukuran dari terbatas sampai tak terhingga. Beberapa contoh populasi :
-          Populasi orang-orang yang memiliki hak suara dalam pemilu di AS (jika orang-orang yang memiliki hak suara dalam pemilu di AS merupakan obyek peneliti)
-          Populasi konsumen produk tertentu
-          Populasi mahasiswa di Yogyakarta
-          Populasi mahasiswa di suatu PTS
Satu orangpun dapat digunakan sebagai populasi, karena satu orang itu mempunyai karakteristik, misalnya gaya bicara, disiplin pribadi, hobi, cara bergaul, kepemimpinannya, dan lain-lain.
Pengambilan sampel dari pupulasi merupakan proses utama dalam statistik induktif. Sampling dilakukan karena seorang peneliti tidak mungkin (kalaupun mungkin tidak efisien) meneliti seluruh populasi, apalagi kalau populasi tersebut relatif besar.
Misalnya, kasus meneliti preferensi konsumen terhadap Coca Cola rasa baru atau Coca Cola klasik. Jika perusahaan melakukan penelitian terhadap seluruh konsumen yang jumlahnya ratusan juta yang tersebar di seluruh dunia, penelitian tersebut tidak akan selesai dalam 1-2 tahun dan tentunya memerlukan biaya yang besar sekali. Dengan cara pengambilan sampel, seorang peneliti dapat menghemat waktu dan biaya penelitian.
Apakah sampel yang diambil cukup representative, artinya memberikan gambaran yang sama dengan populasinya ? Dengan teknik pengambilan sampel yang baik, seorang peneliti dapat memperoleh sampel yang representative. Contohnya adalah poll atau pengumpulan pendapat yang dilakukan oleh perusahaan riset bernama Gallup yang pengumpulan pendapatnya dikenal sebagai Gallup Poll. Gallup selalu melakukan poll  pada saat menjelang pemilu di AS. Gallup mengambil hanya sekitar 1500 sampai dengan 2000 pemilih sebagai sampel yang akan diteliti.
Kemudian hasil penelitian terhadap sampel tersebut digunakan untuk menduga populasi. Misalnya dari sampel tersebut diketahui 45% memilih Dukakis dan 55% memilih Bush, maka kedua angka tersebut merupakan penduga untuk proporsi populasi pemilih di AS yang memilih Bush dan Dukakis.
Bukti empiris bahwa dari 13 kali pemilihan presiden di AS, hanya sekali Gallup Poll membuat kesalahan prediksi.  
Sampel adalah sebagai yang diambil dari populasi dengan menggunakan cara-cara tertentu. Atau sampel adalah bagian dari populasi. Dengan kata lain sampel adalah sebagian dari jumlah dan karakteristik yang dimiliki oleh karakteristik tersebut.
Bila populasi besar, dan peneliti tidak mungkin mempelajari semua yang ada pada populasi, misalnya karena keterbatasan dana, tenaga dan waktu, maka peneliti dapat menggunakan sampel yang diambil dari populasi itu. Apa yang dipelajari dari sampel itu, kesimpulannya akn diberlakukan untuk populasi. Untuk itu sampel yang diambil dari populasi haus betul-betul representatif (mewakili).
Bila sampel tidak representatif, ibarat orang buta disuruh menyimpulkan karakteristik gajah. Satu orang memegang telinga gajah, maka ia menyimpulkan gajah itu seperti kipas. Orang kedua memegang badan gajah, maka ia menyimpulkan gajah itu seperti tembok besar. Begitulah bila sampel yang dipilih tidak representatif, maka ibarat dua orang buta itu yang membuat kesimpulan yang salah tentang gajah.
Secara matematis kita dapat menggambarkan populasi dan sampel menggunakan ukuran-ukuran seperti : rata-rata hitung (mean), median, modus, deviasi standar, dan proporsi. Yang dimaksud dengan statistik sampel adalah karakteristik suatu sampel. Sedangkan karakteristik populasi disebut parameter populasi.

Parameter populasi
Statistik Sampel
Ukuran populasi = N
Rata-rata populasi =
Standar deviasi populasi =
Proporsi populasi = P
Ukuran sampel = n
Rata-rata sampel =
Standar deviasi sampel = s
Proporsi sampel = p
 Sampel random dari populasi variabel random X adalah sampel yang terdiri dari himpunan variabel-variabel random X1, X2, …., Xn yang berdistribusi sama dan saling bebas.
Teknik sampling pada dasarnya dapat dikelompokkan menjadi dua yaitu :
a.       Probabiliti Sampling
Probabiliti sampling adalah teknik sampling yang memberikan peluang yang sama bagi setiap unsur (anggota) populasi untuk dipilih menjadi anggota sampel. Teknik ini meliputi :
1.      Simple Random Sampling
Dikatakan simple (sederhana) karena pengambilan sampel anggota populasi dilakukan secara acak tanpa memperhatikan strata yang ada dalam populasi itu. Cara itu dapat digunakan bila anggota populasi dianggap homogen.
2.   Proportionate Stratified Random Sampling
Teknik ini digunakan bila populasi mempunyai anggota/unsur yang tidak homogen dan berstrata secara proporsional.
3.   Disproportionate Stratified Random Sampling
Teknik ini digunakan untuk menentukan jumlah sampel, bila populasi berstrata tetapi kurang proporsional.
4.      Cluster Sampling (Area Sampling)
Teknik sampling daerah digunakan untuk menentukan sampel bila obyek yang akan diteliti atau sumber data sangat luas, misal penduduk dari suatu negara, propinsi, atau kabupaten.
b.      Nonprobability Sampling
Nonprobabiliti sampling adalah teknik yang tidak memberi peluang/kesempatan sama bagi setiap unsur atau anggota populasi untuk dipilih menjadi sampel. Teknik sampel ini meliputi :
1.   Sampling Sistematis
Sampling sistematis adalah teknik penentuan sampel berdasarkan urutan dari anggota populasi yang telah diberi nomor urut. Misalnya anggota populasi yang terdiri atas 100 orang. Dari semua anggota kelompok itu diberi nomor urut 1 sampai dengan nomor 100.
2.      Sampling Kuota
Sampling kuota adalah teknik untuk menentukan sampel dari populasi yang mempunyai ciri-ciri tertentu sampai jumlah (kuota) yang diinginkan.
3.      Sampling Aksidental
Sampling aksidental adalah teknik penentuan sampel berdasarkan kebetulan, yaitu siapa saja yang kebetulan bertemu dengan peneliti dapat digunakan sebagai sampel, bila dipandang orang yang ditemui itu cocok sebagai sumber data.
4.      Sampling Purposive
Sampling purposive adalah teknik penentuan sampel dengan pertimbangan tertentu.
5.      Sampling Jenuh
Sampling jenuh adalah teknik penentuan sampel jika semua anggota populasi digunakan sebagai sampel. Hal ini biasa dilakukan bila jumlah populasi relatif  kecil, kurang dari 30.
6.      Snowball Sampling
Snowball sampling adalah teknik penentuan sampel yang mula-mula jumlahnya kecil, kemudian sampel ini disuruh memilih teman-temannya untuk dijadikan sampel, begitu seterusnya hingga jumlah sampel semakin banyak.

2.    Pengertian Statistik
Kata statistik mempunyai arti yang berbeda untuk orang yang berbeda. Bagi seorang menejer tim sepak bola, statistik bisa berarti beberapa kali kesebelasan yang dipimpinnya menang, kalah atau draw. Bagi seorang menejer perusahaan, statistik dapat berarti jumlah penjualan dari tahun ke tahun, dan bagi seorang mahasiswa, statistik bisa berarti salah satu bidang studi yang harus dipelajari.
Kata “statistik” berasal dari bahasa Italia “statista” yang berarti negarawan. Istilah tersebut pertama digunakan oleh Gottfried Achenwall (1719 – 1772). Ia mengambil kata statistik karena melihat bahwa yang mula-mula menyadari kegunaan data atau keterangan tentang rakyat adalah Negara. Pada abad pertengahan, Negara-negara mengadakan sensus penduduk untuk memudahkan mereka memobilisasi rakyat dan menarik pajak. Achenwall mengartikan statistik sebagai keterangan-keterangan yang butuhkan oleh Negara.
Pada perkembangan lebih lanjut, kata statistik dapat diartikan sebagai data maupun metoda ilmiah. Dewasa ini statistik sebagai data lebih dikenal dengan istilah data statistik dan statistik sebagai metode ilmiah disebut statistik.
Kemudian dikenallah “Statistik Induktif” yang didefenisikan sebagai kumpulan metoda yang digunakan untuk menganalisis informasi yang ada pada sampel untuk mengambil kesimpulan bagi populasi.
Ukuran-ukuran pada populasi disebut parameter populasi dan ukuran-ukuran pada sampel disebut sebagai statistik sampel. Pada statistik induktif hasil analisis pada statistik sampel digunakan untuk mengambil kesimpulan (menduga) parameter populasi.
Agar diperoleh suatu sampel yang representatif, maka teknik pengambilan sampel (teknik sampling) harus baik. Pada statistik induktif diasumsikan bahwa pengambilan sampel bersifat random atau acak, artinya setiap anggota populasi memiliki probabilita yang sama untuk dipilih sebagai sampel.  
Fungsi dari variabel random yang terkait dengan sampel random disebut sebagai statistik. Jika X1, X2, …, Xn adalah sampel random berukuran n dengan nilai masing-masing X1, X2, …, Xn dan H adalah fungsi untuk X1, X2, …, Xn maka :
Y = H {X1, X2, …, Xn}
            Sebagai statistik dengan nilai statistiknya adalah :
y = h  {X1, X2, …., Xn}
3.    Defenisi Distribusi Sampel
Distribusi sampel statistik y adalah distribusi probabilitas dari statistik Y. Jika kita anggap bahwa pemilihan sampel acak sederhana sebagai suatu eksperimen, maka rata-rata sampel X merupakan deskripsi numerik dari hasil percobaan. Dari contoh penarikan sampel yang yang telah dijelaskan di atas, kita tahu bahwa ada lebih dari satu kemungkinan hasil. Pada contoh di atas untuk populasi berukuran N = 5 dan sampel berukuran n = 3 diambil dari populasi tersebut, maka terdapat kombinasi nilai-nilai dalam sampel sebanyak 5C3 = 10 macam kombinasi. Dari setiap kombinasi ini dapat dicari nilai rata-ratanya. Jadi dalam hal ini, rata-rata sampel, merupakan variabel acak.
Karena terdapat beberapa nilai nilai X yang diperoleh dari 10 kemungkinan sampel, maka rata-rata dari seluruh kemungkinana nilai X juga mempunyai varians dan distribusi probabilitas. Karena berbagai macam kemungkinan nilai X adalah hasil dari sampel acak sederhana yang berbeda, maka distribusi probabilitas dari X disebut distribusi penarikan sampel dari nilai rata-rata .
Dalam prakteknya kita hanya memilih satu sampel acak sederhana dari populasi diantara seluruh kemungkinan yang ada. Disamping distribusi penarikan sampel nilai rata-rata , kita juga mengenal distribusi penarikan sampel untuk proporsi P.
Distribusi penarikan sampel dari  adalah distribusi probabilitas dari seluruh kemungkinan nilai-nilai dari rata-rata sampel .
Distribusi Sampling merupakan distribusi teoritis dari semua hasil sampel yang mungkin, dengan ukuran sampel yang tetap N. pada statistic yang digeneralisasikan ke populasi.
Beberapa Teknik Penarikan Penarikan Sampel :
·      Penarikan sampel acak sederhana : Pengacakan dapat dilakukan dengan undian, tabel bilangan acak, program komputer.
·      Penarikan Sampel Sistematik : Tetapkan interval lalu pilih secara acak anggota pertama sampel.
·      Penarikan Sampel acak berlapis : populasi terdiri dari beberapa kelas/kelompok. Dari setiap kelas diambil sampel secara acak.
·      Penarikan Sampel Gerombol/kelompok : populasi juga terdiri dari beberapa kelas/kelompok sampel yang diambil berupa kelompok bukan individu anggota.
·      Penarikan sampel area : prinsipnya sama dengan cluster sampling. Pengelompokan ditentukan oleh letak geografis atau administrative.
4.    Distribusi Sampling Rata-Rata
Beberapa notasi :
n          : ukuran sampel                       N         :  ukuran populasi
         : rata-rata sampel                     m          :  rata-rata populasi
s           : standar deviasi sampel          s          :standar deviasi populasi
      : rata-rata antar semua sampel      : standar deviasi sampel

2.1       Distribusi Sampling Rata-rata Sampel Besar 
Dalil 1

JIKA
Sampel:                       ü
berukuran = n ³ 30      ý diambil  DENGAN PEMULIHAN dari
rata-rata =                þ
                                                            ì Populasi berukuran = N
                                                           í  Terdistribusi NORMAL
                                                            î  Rata-rata = m ;  simpangan baku = s
MAKA
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
            = m               dan           dan nilai
Dalil 2

JIKA
Sampel:                       ü
berukuran = n  ³ 30     ý diambil  TANPA PEMULIHAN  dari
rata-rata =                þ
                                                            ì Populasi berukuran = N
                                                           í  Terdistribusi NORMAL
                                                            î  Rata-rata = m ;  simpangan baku = s
MAKA

Distribusi Rata-rata akan mendekati distribusi Normal dengan :
= m              dan         dan nilai

a.        disebut sebagai FAKTOR KOREKSI populasi terhingga.
b.      Faktor Koreksi (FK) akan menjadi penting jika sampel berukuran n diambil dari populasi berukuran N yang terhingga/ terbatas besarnya
c.       Jika sampel berukuran n diambil dari populasi berukuran N yang sangat besar maka FK akan mendekati 1 ® , hal ini mengantar kita pada dalil ke-3 yaitu

DALIL LIMIT PUSAT = DALIL BATAS TENGAH = THE CENTRAL LIMIT THEOREM


Dalil 3 DALIL LIMIT PUSAT

JIKA
Sampel:                       ü
berukuran = n              ý diambil dari
rata-rata =                þ
                                                            ì Populasi berukuran = N yang BESAR
                                                           í  distribusi : SEMBARANG
                                                            î  Rata-rata = m ;  simpangan baku = s
MAKA
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
            = m               dan           dan nilai

·      Dalil Limit Pusat berlaku untuk : - penarikan sampel dari populasi yang sangat besar,
-  distribusi populasi tidak dipersoalkan
·      Beberapa buku mencatat hal berikut : Populasi dianggap BESAR jika ukuran sampel
    KURANG DARI  5 % ukuran populasi atau

Dalam pengerjaan soal DISTRIBUSI SAMPLING RATA-RATA perhatikan asumsi-asumsi dalam soal sehingga anda dapat dengan mudah dan  tepat menggunakan dalil-dalil tersebut!

Contoh 1:
PT  AKUA sebuah perusahaan air mineral rata-rata setiap hari memproduksi 100 juta gelas air mineral.  Perusahaan ini menyatakan bahwa rata-rata isi segelas AKUA adalah 250 ml dengan standar deviasi = 15 ml.  Rata-rata populasi dianggap menyebar normal. 
1.    Jika setiap hari diambil 100 gelas AKUA sebagai sampel acak DENGAN
PEMULIHAN, hitunglah :           
a. standard error atau galat baku sampel tersebut?
b. peluang rata-rata sampel akan berisi kurang dari 253 ml?
2.    Jika sampel diperkecil menjadi 25 gelas, hitunglah :
                        a. standard error atau galat baku sampel tersebut?
b. peluang rata-rata sampel akan berisi lebih dari 255 ml?

1.    Diselesaikan dengan DALIL 1 ® karena PEMULIHAN
Diselesaikan dengan DALIL 3 ® karena POPULASI SANGAT BESAR
N = 100 000 000         = m = 250             s = 15             n = 100
P( < 253) = P(z < ?)
GALAT BAKU =          


Jadi P( < 253) = P(z < 2.0) = 0.5 + 0.4772 = 0.9772

2.    Diselesaikan dengan DALIL 3 ® karena POPULASI SANGAT BESAR
N = 100 000 000         = m = 250             s = 15             n = 25 
P( > 255) = P(z > ?)
GALAT BAKU =            
Jadi P( > 255 ) = P(z > 1.67) = 0.5 - 0.4525 = 0.0475

Contoh 2 :
Dari 500 mahasiswa FE-GD diketahui rata-rata tinggi badan = 165 cm dengan standar deviasi = 12 cm, diambil 36 orang sebagai sampel acak.  Jika penarikan sampel dilakukan TANPA PEMULIHAN dan rata-rata tinggi mahasiswa diasumsikan menyebar normal, hitunglah :
a. galat baku sampel?
b. peluang sampel akan memiliki rata-rata tinggi badan kurang dari 160 cm?   

Diselesaikan dengan DALIL 2 ® TANPA PEMULIHAN
N = 500           = m = 165             s = 12             n = 36             
Catatan  ® Dalil Limit Pusat tidak dapat digunakan
P(< 160) = P(z < ?)
FK =
GALAT BAKU  x FK  = = 2 x 0.964... = 1.928...
P(< 160) = P(z < -2.59) = 0.5 - 0.4952 = 0.0048
6.    Distribusi Sampling Rata-rata Sampel Kecil
·      Distribusi Sampling didekati dengan distribusi t Student = distribusi t (W.S. Gosset). Distribusi-t pada prinsipnya adalah pendekatan distribusi sampel kecil dengan distribusi normal.
Dua hal yang perlu diperhatikan dalam Tabel t adalah     
1. derajat bebas (db)          
2.  nilai a
Derajat bebas (db)  = degree of freedom = v = n - 1.
                        n : ukuran sampel.      
·      Nilai a adalah luas daerah kurva di kanan nilai  t atau luas daerah kurva di kiri nilai -t
·      Nilai a   ®  0.1 (10%) ; 0.05 (5%) ; 0.025(2.5%) ; 0.01 (1%) ; 0.005(0.5%)
                 Nilai a terbatas karena banyak kombinasi db yang harus disusun!
·      Kelak Distribusi t akan kita gunakan dalam PENGUJIAN HIPOTESIS
·      Pembacaan Tabel Distribusi-t
Misalkan     n = 9 ® db = 8;          Nilai a ditentukan = 2.5% di kiri dan kanan kurva
                        t tabel (db, a) = t tabel(8; 0.025)  = 2.306
                        Jadi t = 2.306 dan -t = -2.306


                                                           


                          2.5%                       95 %                             2.5%











 


                                   
                            -2.306                     0                       2.306

Arti Gambar di atas nilai t sampel berukuran n = 9, berpeluang 95% jatuh dalam selang  -2.306 < t < 2.306. Peluang t >2.306 =  2.5 %  dan Peluang t < -2.306 = 2.5 %

Coba cari nilai t tabel untuk beberapa nilai db dan a yang lain!

·      Perbedaan Tabel z dan Tabel t
                   Tabel z ® nilai z menentukan nilai a
                   Tabel t ® nilai a dan db menentukan nilai t
·      Dalam  banyak kasus nilai simpangan baku populasi (s) tidak diketahui, karenanya nilai s diduga dari nilai simpangan baku sampel (s).
Dalil 4

JIKA
Sampel:                                   ü
ukuran KECIL n < 30             ý diambil dari
rata-rata =    simp. baku = s þ
                                                                        ì Populasi berukuran = N
                                                                        í  terdistribusi : NORMAL
                                                                        î  Rata-rata = m
MAKA
Distribusi Rata-rata akan mendekati distribusi-t  dengan :
            = m              dan         dan nilai
pada derajat bebas = n-1 dan suatu nilai a
Contoh 3 :
Manajemen PT JURAM menyatakan bahwa 95% rokok produksinya rata-rata mengandung nikotin 1.80 mg, data tersebar normal.  Yayasan Konsumen melakukan pengujian nikotin terhadap 9 batang rokok dan diketahui rata-rata sampel = 1.95 mg nikotin dengan standar deviasi = 0.24 mg. Apakah hasil penelitian Yayasan Konsumen mendukung pernyataan Manajemen PT JURAM?
Jawab :            95 % berada dalam selang ® berarti 5 % berada di luar selang;
                         2.5 % di kiri t dan 2.5% di kanan t
                         a = 2.5 % = 0.025
n = 9 ® db = n - 1 = 8
t tabel (db, a) = t-tabel(8; 0.025)  = 2.306
Jadi 95 % berada dalam selang  -2.306 < t < 2.306

Nilai t-hitung = ?         m = 1.80                       n = 9                = 1.95
            s = 0.24
 =

Nilai t hitung = 1.875 berada dalam selang  -2.306 < t < 2.306 jadi hasil penelitian Yayasan Konsumen masih sesuai dengan pernyataan manajemen PT JURAM.
7.      Distribusi Sampling Bagi Beda 2 Rata-rata
Dalil 5
JIKA
Dua (2) Sampel           ü
berukuran  dan    ý diambil dari
rata-rata = dan    þ                                  ì Dua (2) Populasi berukuran BESAR
                                                                        í Rata-rata  dan  
                                                                        î Ragam  dan             
MAKA
Distribusi Rata-rata akan mendekati distribusi Normal dengan :
           dan   standard error =           dan
nilai z                


·      Beda atau selisih 2 rata-rata =  ® ambil nilai mutlaknya!
·      Melibatkan 2 populasi yang BERBEDA dan SALING BEBAS
·      Sampel-sampel  yang diambil dalam banyak kasus (atau jika dilihat secara akumulatif) adalah sampel BESAR

Contoh 4:
Diketahui rata-rata IQ mahasiswa Eropa = 125 dengan ragam = 119 sedangkan rata-rata IQ mahasiswa Asia = 128 dengan ragam 181. diasumsikan kedua populasi berukuran besar. Jika diambil 100 mahasiswa Eropa dan 100 mahasiswa Asia sebagai sampel, berapa peluang terdapat perbedaan IQ kedua kelompok akan kurang dari 2?
Jawab :
Populasi
Parameter
populasi ke-1 (Mhs. Eropa)
populasi ke-2 (Mhs. Asia)
Rata-rata (m)
125
128
Ragam (s²)
119
181
Beda 2 Rata-rata = =
Sampel : = 100    = 100
P( <2  ) = P ( z < ?)


P(z<-0.58) = 0.5 - 0.2190 = 0.2810

2.2    Mean Sampel Random
Jika X1, X2, …, Xn adalah sampel random berukuran n dari populasi variabel X dengan mean populasi E(X), varians populasi , dan mean sampel random.
, maka
Ekspetasi mean sampel random
   E(X) = E(X)
Dan Variansi mean sampel random
       
Dimana :
varians mean sampel random
varians populasi
  n  = ukuran sampel

2.3    Dalil Limit Sentral
Jika  adalah mean dari suatu sampel random berukuran n yang diambil dari populasi dengan mean  dan varians , maka limit distribusinya adalah :


Dimana :
                        Z = limit distribusi
  = rata-rata populasi
  X = rata-rata sampel
   n = ukuran sampel
                       = varians
Dengan n     merupakan distribusi normal standar n(z, 0, 10).

The Central Limit Theorem adalah suatu dalil yang sangat penting peranannya dalam distribusi sampling. Dalil ini mengatakan : “Untuk suatu populasi dengan rata-rata  dan varians , distribusi sampling rata-rata dari semua kemungkinan sampel berukuran n yang diambil dari populasi, akan terdistribusi secara normal dengan rata-rata  dan deviasi standar , dimana  sama dengan rata-rata populasi () dan  sama dengan deviasi standar populasi dibagi akar n atau , dengan asumsi bahwa ukuran sampel cukup besar”.
Dalam pemilihan sampel acak sederhana dengan ukuran n dari suatu populasi yang berasal dari distribusi apapun (Binomial, Poisson, dan sebagainya) maka distribusi dari rata-rata sampel dapat didekati dengan distribusi probabilitas normal untuk ukuran sampel yang besar.
Hal-hal penting yang perlu diingat dari dalil ini adalah :
1.      Jika ukuran sampel (n) lebih besar, distribusi rata-rata sampel akan mendekati normal, tidak peduli apakah populasinya terdistribusi, secara normal atau tidak.
2.       dan
Dimana :  rata-rata populasi
            deviasi standar dari distribusi sampling rata-rata
                =  deviasi standar populasi
                n   = ukuran sampel
3.      Tidak ada angka yang pasti tentang “ukuran sampel yang cukup besar”, tapi biasa angka n > 30 dianggap cukup besar.
Distribusi sampling rata-rata telah dibicarakan sebelumnya. Hakekatnya distribusi sampling rata-rata adalah distribusi probabilita rata-rata sejumlah C sampel, dimana N adalah ukuran populasi dan n adalah ukuran sampel yang diambil dari populasi.
Distribusi ini memiliki rata-rata  dan deviasi standar  dan menurut Central Limit Theorem,  dan .
Misalnya pada “Bank Pasti Aman” menghitung tabungan seluruh nasabahnya ternyata rata-rata tabungan / nasabahnya adalah Rp. 2000,- dengan deviasi standar Rp. 600,-. Bila seorang peneliti mengambil sampel sebanyak 100 nasabah dari populasi 600, maka akan terdapat  kombinasi sampel yang mungkin dengan kata lain akan terdapat sebanyak  rata-rata sampel. Jumlah rata-rata sampel tersebut cukup banyak sehingga distribusinya akan normal (hal ini konsisten dengan Central Limit Theorem). Distribusi sampling rata-rata ini memiliki rata-rata dan deviasi standar sebagai berikut :
 =  = 60

2.4    Faktor Koreksi Untuk Populasi Terbatas.
Jika populasi (keseluruhan obyek penelitian) sangat besar, kita asumsikan populasi tersebut tidak terbatas (infinite). Bagaimana jika populasi tidak tak terbatas (tidak infinite) atau tidak sangat besar ? Dalam kasus ini kita akan melakukan beberapa penyesuaian/koreksi terhadap deviasi standar dari distribusi sampling caranya adalah mengalikan  dengan suatu faktor koreksi sebesar  atau
 x
Dimana ;
N = ukuran populasi (yang trebatas/tidak terbatas)
n  = ukuran sampel

Mengapa faktor koreksi ini perlu dan apa efeknya ? Jika sampel adalah suatu persentase yang cukup besar dari populasinya, maka kita mengharapkan ukurannya akan lebih tepat dari pada ukuran suatu sampel yang lebih kecil. Perhatikan efek dari faktor koreksi, misalkan kita mengambil sampel dengan ukuran 100 dari populasi dengan ukuran 1000 faktor koreksinya adalah sebesar.
Jika dikendalikan dengan faktor koreksi tersebut, deviasi standar distribusi sampling rata-rata (atau standar error of the mean) akan berkurang sebesar 1 – 94,92 % = 5%. Semakin besar ukuran sampel, pengurangan standar error ini semakin besar, demikian sebaliknya.

Perhitungan faktor koreksi untuk berbagai ukuran sampel jika populasi adalah 1000.
Ukuran Sampel n
Bagian dari populasinya
(n/N)
Faktor Koreksi
10
1%
99,55%
25
2,5%
98,79%
50
5%
97,52%
100
10%
94,92%
200
20%
89,49%
500
50%
70,75%

Nampak jika n/N lebih kecil dari 5%, faktor koreksi mendekati 1 sehingga muncul aturan jika n/N lebih kecil dari 5%, faktor koreksi tidak perlu digunakan, kalaupun digunakan, tidak akan banyak pengaruhnya karena nilainya mendekati 1.
Misalnya bila sampel random dengan n = 10 dipilih dari populasi sebesar 40 dengan rata-rata 5,5 dan deviasi standar 2,9155, berapa rata-rata dan deviasi distribusi sampling rata-rata.
Maka, menurut Central Limit Theorem dan penyesuaian terhadap koreksi :
 dan
 x
      = 0,27735

2.5    Pengujian Hipotesis
Hipotesis adalah asumsi atau dugaan dengan mengenai sesuatu, yang memerlukan pengecekan untuk membuktikannya. Jika asumsi atau dugaan itu dikhususkan untuk populasi, umumnya mengenai nilai parameter populasi, maka hipotesis itu disebut hipotesis statistik.
Suatu penduga tunggal (point estimator) ialah pendugaan yang terdiri dari satu nilai saja misalnya, rata-rata konsumsi susu per bulan tiap keluarga sebanyak 35 kaleng ( = 35 sebagai penduga dari ), ataupun persentase nasabah yang tidak puas sebesar 25% ( sebagai penduga p.  dan disebut penduga atau estimator,  dan p yang merupakan parameter. Di bawah ini akan diberikan beberapa penduga dan parameter, yaitu :
Penduga    :                        s           r           b
Parameter  :                p                          B
Dimana  (dibaca rho) adalah koofisien korelasi sebenarnya, dan B adalah koofisien regresi sebenarnya. Satu parameter dapat mempunyai beberapa penduga.
Penduga tunggal merupakan fungsi dari nilai observasi yang berasal dari sampel dengan n elemen.
Dalam prakteknya, pendugaan tunggal yang terdiri dari satu angka tidak memberikan gambaran mengenai berapa jarak/selisih nilai penduga tersebut terhadap nilai sebenarnya. Kecuali kalau diberikan besarnya kesalahan yang mungkin terjadi. Misalnya, kalau sampel suatu perusahaan diselidiki dan memiliki nilai penduga modal (= ) sebesar Rp 100 juta, berapa niali rata modal sebenarnya (= )? Kita tahu bahwa kesalahan).
Itulah sebabnya sering digunakan pendugaan interval (selang), yaitu suatu pendugaan berupa interval yang dibatasi oleh dua nilai, yang disebut nilai batas bawah dan nilai batas atas. Misalnya rata-rata modal akan terletak dalam interval antara Rp. 95 juta – Rp. 105 juta.
Kita mengharapkan bahwa nilai rata-rata modal sebenarnya akan terletak di dalam interval tersebut. Interval yang demikian itu disebut interval keyakinan atau selang keyakinan (confidence interval).
Persentase = proporsi x 100%. Perkiraan proporsi ini sangat penting, misalnya dalam penelitian pendapat umum untuk mengetahui berapa % yang setuju dengan calon presiden; dalam pemasaran berapa % dari ibu rumah tangga yang akan membeli mesin jahit, berapa % barang produksi yang rusak; berapa % penduduk suatu daerah yang masih buta huruf; berapa % karyawan suatu perusahaan yang lesu; berapa % nasabah suatu bank yang tidak puas dengan layanan bank tersebut; berapa % petani peminjam kredit Bimas yang tidak bisa mengembalikan pinjaman tersebut; berapa % proyek yang tidak selesai pada waktunya, dan lain sebagainya.
Di dalam setiap penelitian, elemen populasi/sampel dapat dikategorikan sesuai dengan karakteristik tertentu. Misalnya, elemen populasi/sampel dapat dikategorikan sesuai dengan karakteristik tertentu. Misalnya elemen populasi/sampel tersebut dibagi menjadi dua kelompok atau kategori, yaitu pemilih dikelompokkan menjadi setuju dan tidak setuju; ibu rumah tangga dikelompokkan menjadi amu membeli dan tidak mau membeli TV, dan lain sebagainya. 
Bila kita ingin mengetahui apakah distribusi frekuensi hasil percobaan kita sesuai dengan distribusi frekuensi yang kita harapkan, maka maka kita akan mengadakan pengujian. Salah satu metode yang terkenal adalah metode Goodness Of  Fit. Pengujian ini didasarkan atas statistik :
X2 hit =
Dengan :
Oi = fekuensi observasi (hasil percobaan) untuk kelas ke-i
ei  = frekuensi yang diharapkan untuk kelas ke-i
k   = jumlah kelas
X = nilai variabel random yang distribusi sampelnya didekati dengan  distribusi chi-square dengan derajat kebebasan v = k – r – 1, dengan r adalah banyaknya parameter yang ditaksir dari populasi adalah mean dan simpangan baku, maka r = 2

Frekuensi harapan pada tiap kelas sebaiknya tidak lebih kecil dari 5, jika hal ini terjadi maka harus dilakukan penggabungan dengan kelas-kelas yang berdekatan dengan kelas tersebut. Sehingga diperoleh sebuah kelas baru dengan frekuensi harapan lebih besar atau sama dengan 5 (dengan demikian jumlah total kelas seluruhnya k akan berkurang dari semula).
Untuk dapat mengambil kesimpulan apakah hipotesis kita terhadap data yang diperoleh dari percobaan mengikuti pola distribusi frekuensi yang kita duga (harapkan), maka harus dilakukan perbandingan sebagai berikut :
X2 hit > X2 y
Dengan  adalah tingkat kepercayaan dari harga X2y diperoleh dari tabel chi kuadrat. Apabila pertidaksamaan di atas dipenuhi, maka hipotesis nol ditolak. Untuk lebih jelasnya, praktikan disarankan untuk mempelajari uji Goodness of  Fit dari buku-buku statistika. Tabel yang digunakan untuk memudahkan perhitungan pengujian distribusi dengan metode Goodness of Fit disajikan di tabel sebagaiman yang terdapat dalam bab selanjutnya.
2.6    Distribusi Frekuensi
Distribusi frekuensi merupakan suatu ringkasan dalam bentuk tabel dari suatu kelompok data yang menunjukkan frekuensi item-item (kategori-kategori) dalam beberapa kelas. Adapun langkah-langkah yang perlu dilakukan untuk membuat daftar distribusi frekuensi adalah sebagai berikut :
1.      Tentukan rentang, selisih nilai terbesar dan terkecil.
2.      Tentukan jumlah kelas, k dengan menggunakan rumus :

                     k  =  1 + 3.322 log n,  n : banyaknya nilai observasi.

3.      Tentukan jumlah interval kelas (c), dengan rumus :
                                        
Dimana : k    :           Banyaknya kelas
          Xn  :   Nilai observasi terbesar
          X1  :   Nilai observasi terkecil.

4.      Tentukan tepi batas kelas
Batas kelas bawah menunjukkan kemungkinan nilai data terkecil pada suatu kelas. Sedangkan batas kelas atas mengidentifikasikan kemungkinan nilai data terbesar dalam suatu kelas.
Seringkali dalam penyusunan tabel distribusi frekuensi, tabel distribusi frekuensi relatif dan kumulatif serta grafik juga disertakan dengan tujuan untuk mempermudah memahami data.
Tabel 2.1.  Frekuensi Hipotesis Relatif dan Kumulatif

X
F
Fr
Fk*
Fk**
(1)
(2)
(3)
(4)
(5)
X1
X2
Xi
Xk
f1
f2
fi
fk
f1/n
f2/n
fi/n
fk/n
f1
f1 + f2
f1 + f2 + … + fi
f1 + f2 + … + fi + … +  fk
f1 + f2 + … + fi + … +  fk f2 + … + fi + … + fk
f1 + fk
fk
Jumlah




*Sama atau kurang dari
**Sama atau lebih dari

Grafik dalam distribusi frekuensi sering digambarkan dalam bentuk histogram atau grafik batangan (bar chart) dan frekuensi poligon.
Gambar 2.1.  Bentuk Histogram dan Kurva Frekuensi Poligon.

Perhitungan distribusi frekuensi untuk data berkelompok dapat dicari berdasarkan ukuran pemusatannya, ukuran letaknya, dan ukuran variansinya.
Tabel 2.2.  Rumus Ukuran Pemusatan
Jenis Ukuran
Data Yang diperlukan
Rumus
Keterangan
Rata-Rata Hitung
Titik data dan frekuensinya.
Xi  :  Data
fi   :  Frekuensi data
Rata-Rata Ukur
Nilai titik tengah dan frekuensinya.
Xi        :  Nilai tengah
fi  :  Frekuensi data
Modus
Tepi batas kelas, interval kelas, frekuensi masing-masing kelas.
o  Tb : Tepi bawah kelas modus
o  d1 : Frekuensi kelas modus – frekuensi kelas sebelumnya.
o  d2 : Frekuensi kelas modus – frekuensi kelas sesudahnya.
o  C   : Interval kelas

                                    Tabel 2.3. Rumus Ukuran Letak
Jenis Ukuran
Data Yang diperlukan
Rumus
Keterangan
Median (Med)
Tepi batas kelas, interval kelas, frekuensi kumulatif, frekuensi masing-masing kelas.
 
o  tb  :  Tepi bawah kelas  yang memuat median
o  c    : Interval kelas.
o  fk   : Frekuensi kumulatif sebelum kelas yang memuat median.
o  f    : Frekuansi yang memuat median
Kuartil (Qi)
Tepi batas kelas, frekuensi kumulatif, frekuensi masing-masing kelas, panjang interval kelas.
* Letaknya :
   Qi  =  [i / 4] x n,
   dimana i =  1, 2, 3.
* Nilai / besarnya :
o  tb  : Tepi bawah keas Qi.
o  fki : Frekuensi kumulatif   sebelum kelas Qi.
o  fi   : Frekuensi kelas Qi.
o  n   : Banyaknya data.
Desil
(Di)
Tepi batas kelas, frekuensi kumulatif, frekuensi masing-masing kelas, panjang interval kelas.
Letaknya :
Di  =  [i / 10] x n,
dimana i =  1, 2, 3, … , 9.
Nilai / besarnya :
o  tb  : Tepi bawah keas Di.
o  fki : Frekuensi kumulatif   sebelum kelas Di.
o  fi   : Frekuensi kelas Di.
o  n   : Banyaknya data.
Persentil
(Pi)
Tepi batas kelas, frekuensi kumulatif, frekuensi masing-masing kelas, panjang interval kelas.
Letaknya :
Pi  =  [i / 100] x n,
dimana i =  1, 2, 3, … , 99.
Nilai / besarnya :
o  tb  : Tepi bawah keas Di.
o  fki : Frekuensi kumulatif   sebelum kelas Di.
o  fi   : Frekuensi kelas Di.
o  n   : Banyaknya data.
                                   
Tabel 2.4. Rumus Ukuran Variansi

Jenis Ukuran
Data Yang diperlukan
Rumus
Keterangan

Variansi
Data dan frekuensi masing-masing kelas, rata-rata data.
n   :  Sƒi
Xi : Data ke-i.
    :   Rata-rata data.
ƒi  :  Frekuensi data ke-i.

Simpangan Baku
Data dan frekuensi masing-masing kelas, rata-rata data.
S2  : Varinsi

Simpangan Rata-Rata
Data dan frekuensi masing-masing kelas, rata-rata data.
Xi : Data ke-i.
    :   Rata-rata data.
ƒi  :  Frekuensi data ke-i.

Simpangan Kuartil
Interval kelas, frekuensi masing-masing kelas, tepi batas kelas, dan frekuensi kumulatif.
, dimana :

o  f1  :  frekuensi yang memuat Q1.
o  f3  :  frekuensi yang memuat Q3.
o  fk1 :  frekuensi kumulatif sebelum kelas Q1
o  fk3 :  frekuensi kumulatif sebelum kelas Q3.

Skewness (Kemiringan)
Data dan frekuensi masing-masing kelas, rata-rata data.
S      :   Simpangan baku.
Kurtosis (Keruncingan)
Data dan frekuensi masing-masing kelas, rata-rata data.
S     :  Simpangan baku.






Distribusi Diskrit
a.       Distribusi probabilitas uniform diskrit
Algoritma
    1. Bangkitkan U(0,1)
    2. Dapatkan X = a+(b-a+1)*U

Contoh
Sebuah perusahaan bakery membuat suatu kelompok jenis donat yang dijual ke toko-toko dengan distribusi diskrit uniform dengan kebutuhan harian maksimum 100 unit dan minimum 40 unit.
Tentukan bilangan acak dari distribusi diskrit uniform dengan a = 77 z0 = 12357 dan m = 128

b.            Distribusi Poisson
Algoritma
    1. Hitung a=, b =1 dan i =0 
    2. Bangkitkan Ui+1= U(0,1)
    3. Ganti b = bUi+1
    4. Jika b<a maka dapatkan X = i dan jika tidak lanjutkan ke langkah 5
    5. Ganti i = i+1 kembali ke langkah 2

            Contoh:
Suatu kejadian berdistribusi poisson dengan rata-rata 3 kejadian perjam dan terjadi selama periode waktu 1,4 jam.Tentukan bilangan acak dari distribusi poisson dengan a = 17 z0 = 12357 dan m = 1237.
c.       Distribusi Binomial
Metode transformasi dari distribusi binomial
Dengan mempergunakan fungsi densitas binomial yang dinyatakan dengan :                       , k = 0,1, 2 .. n
                     {n\choose k}=\frac{n!}{k!(n-k)!}
                     F(x) =
Contoh
Dari suatu distribusi binomial, diketahui p =0,5 dan n =2.
Tentukan bilangan acak dari distribusi binomial dengan a = 77 z0 = 12357 dan m = 127.

d.      Distribusi Geometri
Algoritma
    1. Bangkitkan U(0,1)
    2. Dapatkan X = ln(U)/ln(1-p)

Contoh: Pada seleksi karyawan baru sebuah perusahaan terdapat 30 % pelamar yang sudah mempunyai keahlian komputer tingkat advance dalam pembuatan program. Para pelamar diinterview secara insentif dan diseleksi secara acak.
Tentukan bilangan acak dengan a = 43, m = 1237 dan z0 = 12357.

Distribusi Kontinu

a.       Distr probabilitas uniform kontinu
Algoritma
1.      Bangkitkan U(0,1)
2.      Dapatkan X = a+(b-a)*U
Contoh
Pada suatu sentra telpon ternyata distribusi pelayanan telponnya berdistribusi uniform kontinu dengan minimal waktu 3 menit dan maksimal 5 menit. Tentukan bilangan dengan a = 173  z0 = 12357 dan m = 1237.

b.      Distribusi Eksponensial
Algoritma
1.      Bangkitkan U(0,1)
2.      Dapatkan X =
Dengan  rata-rata dengan nilai > 0
Contoh
Pada suatu sentra telpon ternyata distribusi penerimaan telponnya berdistribusi eksponensial dengan mean = 0,1 menit. Tentukan bilangan 10 acak dengan a = 173  z0 = 12357 dan m = 1237.
c.       Distribusi Normal

Algoritma
1.      Bangkitkan U1,U2= U(0,1)
2.      Hitung V1= 2U1-1 dan V2= 2U2-1
3.      Hitung W = V12 + V22
4.      Jika W > 1 maka kembali ke langkah 1 dan jika tidak lanjutkan ke langkah 5
5.      Hitung
6.      Dapatkan X1= V1Y dan X2=V2Y
7.     
Contoh
Sebuah rumah sakit berniat mempelajari penggunaan suatu alat pada ruang emergency. Jika diketahui bahwa lamanya seorang pasien yang di’treat’ menggunakan alat tsb berdistribusi normal dgn mean 0.8 jam dan standard deviasi 0.2 jam, tentukan bilangan acak yang mewakili lamanya penggunaan alat tersebut oleh 6 orang pasien.

d.      Distribusi Gamma
Algoritma
1.Bangkitkan U1 dan U2
2.X = -b ln (U1 * U2)
            di mana b adalah parameter.

Contoh:
Mesin pada suatu pabrik perlu diperbaiki setiap saat ‘breakdown’ dengan biaya $100/hari. Jika lama perbaikan mesin berdistribusi gamma dengan parameter a = 2 dan b = 1/3, tentukan rata-rata biaya untuk 30 kali ‘breakdown’, jika diketahui mesin breakdown ke 29 kali mengalami lama perbaikan selama 0.38 hari dengan rata-rata lama perbaikan 0.68 hari dgn variansi S2 = 0.02.
           
            Jawab:
            U1 = 0.818
            U2 = 0.322
            X30     = -b ln (U1 * U2)
                        = - 1/3 ln (0.818 * 0.322)
                        = 0.445 hari
            \         Biaya untuk memperbaiki mesin yg breakdown ke 30 kali adalah $100 x 0.445 hari = $ 44.5
                                                                           X30 - X29
            Rata-rata ke 30 kali = X30      = X29 +
                                                                                 30
                                                                           0.445 - 0.38
                                                            = 0.68 +
                                                                                 30
                                                            = 0.68 + 0.0022
                                                            = 0.6822

           



Tidak ada komentar:

Posting Komentar