Sunday, November 21, 2021

 Distribusi Frekuensi Dalam Statistika

Pengantar

Beberapa karakteristik yang umum digunakan untuk mendeskripsikan data yang kita miliki adalah dengan mencari tahu titik tengah data (center), variasi/sebaran data (variability/spread), dan bentuk data (shape).

Ini bisa dicapai bila data yang kita miliki dikelola dengan baik; salah satu cara yang paling mudah untuk mengelola data adalah dengan memanfaat distribusi frekuensi (frequency distribution)

Distribusi Frekuensi (Frequency Distribution)

Definisi

Distribusi frekuensi adalah bentuk pengelolaan data di mana data dikelompokkan ke dalam beberapa kelas (classes) berdasarkan interval tertentu.

Jumlah kemunculan data untuk tiap kelas akan dihitung dan dikenal sebagai frekuensi dari kelas.

apa itu Measure of Central Tendency?


Measure of Central Tendency dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan nilai tipikal atau sentral dari suatu dataset.


Mean


Mean dari suatu dataset merupakan penjumlahan dari keseluruhan entri pada dataset dibagi dengan banyaknya entri pada dataset tersebut. 


Median


Median dari suatu dataset merupakan nilai yang berada di tengah dengan mengacu pada nilai dataset yang sudah terurut. 


Untuk dataset dengan jumlah entri ganjil, nilai median dapat diperoleh dari nilai yang tepat berada di tengah.

Untuk dataset dengan jumlah entri genap, nilai median diperoleh dari rerata dua nilai yang berada di tengah.

Mode


Mode dari suatu dataset merupakan nilai dari dataset yang memiliki frekuensi kemunculan paling tinggi. 


Suatu dataset dapat memiliki lebih dari satu mode (multi-modal).

Suatu dataset juga bisa saja tidak memiliki mode, ketika frekuensi kemunculan dari tiap datanya sama.

Kelebihan dan Kekurangan Mean


Mean cukup bisa diandalkan karena mean memperhitungkan setiap entri dari dataset yang kita miliki.

Mean sangat rentan terhadap outlier.

Median bisa dijadikan alternatif bilamana terdapat outlier pada dataset.

Weighted Mean


Weighted Mean adalah nilai rerata dari suatu dataset di mana setiap entrinya memiliki bobot tertentu.


Mean of Grouped Data (Frequency Distribution)


Kita juga dapat melakukan estimasi nilai rerata dari suatu dataset yang sudah dikelompokkan ke dalam format distribusi frekuensi.


Measure of Variation

dalam Statistika



Apa itu Measure of Variation?


Measure of Variation dapat didefinisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan keberagaman atau sebaran data.


Range (Jangkauan)


Range dari suatu dataset merupakan hasil perhitungan selisih antara nilai tertinggi dengan nilai terrendah pada dataset tersebut.


Pengukuran nilai keberagaman dengan menggunakan range memiliki kelemahan di mana hanya menyertakan dua nilai saja dalam proses pengukuran.

Desain Eksperimen

Dalam Statistika

Studi Statistik (Statistical Study)

Studi Observasi (Observational Study)

Seorang peneliti hanya melakukan pengamatan terhadap subjek (e.g., pengukuran karakteristik) tanpa

melakukan tindakan apapun yang dapat mempengharuhi hasil pengamatan.


Studi Eksperimen (Experimental Study)

Seorang peneliti menerapkan suatu treatment tertentu terhadap subjek sebelum melakukan pengamatan untuk

memahami efek dari treatment yang diberikan.


Observational Study: contoh

Sebuah penelitian dilakukan untuk mengamati laju kecepatan kendaraan yang

melintas di Jalan Merdeka pada pukul 10 sampai dengan 12 malam.

Pengukuran kecepatan kendaraan dilakukan dengan bantuan speed gun selama 90

hari.


Experimental Study: contoh

Sebuah penelitian dilakukan untuk mengamati efek dari pemberian suplemen vitamin

D3 terhadap 140 pasien dengan tingkat anti-body rendah.

Sebanyak 70 pasien menerima 4000 IU vitamin D3 perhari selama 1 tahun dan 70

pasien sisanya menerima placebo.

Hasil pengamatan terhadap dua kelompok pasien ini lalu dibandingkan.


Desain Eksperimen (Experimental Design)

● Kendali (Control)

● Pengacakan (Randomisation)

● Replikasi (Replication)


Experimental Design: Control (kendali)


Subjek dalam experimental study yang menerima

treatment sebelum diamati.


Subjek dalam experimental study yang tidak

menerima treatment dan juga diamati.

Subjek seringkali menerima treatment palsu

(placebo/fake treatment).


Experimental Unit


Treatment Group Control Group


Experimental Design: Control (kendali)

● Kendali (control) dapat dilakukan dengan menerapkan:

○ Bliding

○ Double Blinding

● Blinding

○ Subjek eksperimen tidak mengetahui apakah dirinya menerima treatment atau placebo.

● Double Blinding

○ Baik peneliti maupun subjek eksperimen tidak mengetahui apakah seorang subjek menerima

treatment atau placebo.

○ Dibutuhkan pihak ketiga untuk mendistribusikan treatment dan placebo kepada subjek

eksperimen.


Experimental Design: Randomisation (pengacakan)

Penentuan subjek eksperimen ke dalam treatment group dan control group dilakukan

secara acak (random).


Experimental Unit Pemilihan

acak


Treatment

Group


Control

Group


Experimental Design: Randomisation (pengacakan)


Randomised Blocked Design:

● Keseluruhan subjek eksperimen akan

dikelompokkan berdasarkan kesamaan

karakteristik tertentu (e.g., rentang

usia, jenis kelamin).

● Subjek di tiap kelompok lalu dipilih

secara acak untuk dimasukkan dalam

treatment group dan control group.

 Treatment Group

Control Group

Treatment Group

Control Group


Treatment Group

Control Group


Experimental Design: Replication (replikasi)

Untuk meningkatkan validitas dari hasil eksperimen, dibutuhkan replikasi atau

pengulangan eksperimen dengan kondisi serupa atau mirip.

Replikasi melibatkan subjek eksperimen yang berbeda, dengan demikian replikasi juga

akan memperbesar ukuran dari subjek eksperimen (sample size) yang juga dapat

menunjang validitas dari hasil eksperimen.


Desain Eksperimen [contoh]

Sebuah perusahaan mendesain suatu eksperimen untuk menguji efektifitas dari suatu

produk permen karet yang dikembangkan untuk membantu seseorang yang ingin

berhenti merokok.

Sepuluh orang perokok berat dilibatkan sebagai subjek eksperimen. Lima orang di

antaranya diberikan permen karet dan lima sisanya diberikan placebo. Setelah dua

bulan berjalan, kesepuluh subjek eksperimen ini dievaluasi dan didapati kelima subjek

penerima permen karet telah berhenti merokok.

Apakah kita bisa menyimpulkan bahwa produk permen karet ini efektif? Permasalahan

apa yang terdapat pada desain eksperimen ini?


Desain Eksperimen [contoh]

Sebuah perusahaan mendesain suatu eksperimen untuk menguji efektifitas dari suatu

produk permen karet yang dikembangkan untuk membantu seseorang yang ingin

berhenti merokok.

Seribu orang perokok berat dilibatkan sebagai subjek eksperimen yang dikelompokkan

berdasarkan jenis kelamin. Kelompok wanita diberi permen karet dan kelompok pria

diberi placebo. Setelah dua bulan berjalan, keseribu subjek eksperimen ini dievaluasi

dan didapati adanya jumlah yang cukup signifikan dari kelompok penerima permen

karet yang berhenti merokok.

Apakah kita bisa menyimpulkan bahwa produk permen karet ini efektif? Permasalahan

apa yang terdapat pada desain eksperimen ini?


Tantangan dalam Experimental Study

● Confounding/Lurking variable

○ Faktor eksternal (dan tidak diperhitungkan sebelumnya) yang berpotensi memberikan pengaruh

terhadap hasil eksperimen.


● Placebo effect

○ Subjek eksperimen memberikan reaksi positif walau subjek tersebut menerima placebo (treatment

palsu).


● Hawthorne effect

○ Perubahan perilaku dari subjek eksperimen setelah mengetahui bahwa dirinya terlibat dalam

eksperimen.

Pengantar Statistika

Definisi

Statistika (Statistics)

Bidang keilmuan yang mencakup

● Pengumpulan (collecting)

● Pengelolaan (organising) 

● Analisis (analysing)

● Interpretasi (interpreting)

 data untuk pengambilan keputusan

 

 

 

Data

Kumpulan informasi yang diperoleh melalui:

● Pengamatan (observations)

● Penghitungan (counts)

● Pengukuran (measurements)

● Responsi (responses)

 

Populasi & Sampel

Populasi (Populations)

Kumpulan dari keseluruhan pengamatan, penghitungan, pengukuran, atau responsi terhadap topik yang ingin dikaji

 

 

 

Sampel (Samples)

● Bagian dari populasi

● Sampel yang baik adalah sampel yang

representatif terhadap populasi sehingga dapat digunakan untuk menarik simpulan (conclusions) terhadap populasi

● Oleh karenanya data sampel harus dikumpulkan dengan metode yang tepat

 

(e.g., random sampling)

 

 

 

Populasi & Sampel: contoh

Sampel:

Suatu survey dilakukan di 35 perguruan tinggi di Indonesia untuk menanyakan apakah seorang

mahasiswa pernah mengalami bully selama studi di perguruan tinggi.

Didapati 237 dari total 972 reponden mengaku pernah mengalami bully selama menjalani studi di

perguruan tinggi.

 

 

 

Populasi:

Warga kompleks perumahan Suka Rapi yang terdiri dari total 45 kepala keluarga berencana untuk

mempercantik kompleks dengan melakukan peremajaan paving jalan.

Pendanaan akan dilakukan secara kolektif berdasarkan ukuran lebar dari tiap rumah. Oleh karenanya

dilangsungkan pengukuran dan pendataan lebar muka dari tiap rumah.

 Parameter & Statistik Parameter

 

 

 

● Deskripsi numerik dari karakteristik suatu populasi (population)

● Terdapat hanya satu parameter untuk satu populasi

 Statistik (Statistic)

● Deskripsi numerik dari karakteristik suatu sampel (sample)

● Memungkinkan untuk mendapati

 sejumlah statistik dengan nilai yang beragam untuk satu populasi yang sama


Parameter & Statistik: contoh

 

 

Statistik:

Dari hasil uji emisi yang dilakukan secara acak terhadap kendaraan bermotor yang melintas di Jalan

Suka Makmur, didapati 48% kendaraan tidak memenuhi standar kelayakan.

Parameter:

Dari hasil ujian saringan masuk perguruan tinggi di Universitas Suka Pintar pada tahun ini, ditemui 78%

dari calon mahasiswa memiliki kemampuan analisis numerik di atas ambang batas yang disyaratkan.

 Cabang Ilmu Statistika

Statistika Deskriptif (Descriptive Statistics)

Cabang ilmu statistika yang berfokus pada:

 ● Pengelolaan data (organisation)

 ● Peringkasan data (summarisation)

 ● Visualisasi data (display/visualisation)

 

Statistika Inferensi (Inferential Statistics)

Cabang ilmu statistika yang berfokus pada pemanfaatan sampel untuk menarik simpulan

terhadap populasi

 

 

 

Cabang Ilmu Statistika: contoh

Statistika Inferensi: 

Sejumlah pria dewasa berusia 48 tahun dilibatkan dalam suatu program penelitian selama 18 tahun.

Berdasarkan data pengamatan, diprediksi bahwa 70% dari pria yang tidak menikah akan bertahan hidup

pada usia 65 tahun, dan 90% dari pria yang menikah akan hidup pada usia 65 tahun.

 


Statistika Deskriptif:Berdasarkan data sampel yang diperoleh dari Wall Street, didapati kesalahan yang dilakukan oleh analistdalam melakukan prediksi pendapatan perusahaan IT pada tahun ini mencapai angka 44%.

 

 Klasifikasi Data dalam Statistika

Tipe Data

Data Kualitatif (Qualitative) 

Data non numerik:

● Atribut

● Label

 

Data Kuantitatif (Quantitative)

Data numerik yang dihasilkan melalui:

● Penghitungan

● Pengukuran

 

 

 

Tipe Data: contoh

Menu

(kualitatif)

Harga

 (kuantitatif)

 Nasi Goreng Rp 25,000

 Nasi Pecel Rp 30,000

 Nasi Timbel Rp 35,000

 

Skala Pengukuran (Level of Measurements)

Terdapat 4 Skala Pengukuran (Level of Measurements) dalam bidang statistika: 

1. Nominal

2. Ordinal

3. Interval

4. Rasio (Ratio)

 

 

 

Skala Pengukuran Nominal

● Berasosiasi dengan tipe data kualitatif

● Berfokus pada pengelompokkan atau pengkategorian data berdasarkan nama,

label, atau kualitas

● Tidak dapat dikenakan operasi matematika

● Contoh:

○ merk kendaraan bermotor

○ kota kelahiran

○ nama siswa, nama bulan, nama hari

○ nomor kendaraan bermotor, nomor induk siswa

 

 

 

Skala Pengukuran Ordinal

● Berasosiasi dengan tipe data kualitatif

● Data dapat dikelompokkan

● Data dapat disusun berdasarkan urutan, peringkat, atau ranking

● Tidak dapat dikenakan operasi matematika

● Contoh:

○ tingkat kepuasan pelanggan: sangat puas, puas, cukup, kecewa, sangat kecewa

○ temperatur udara: panas, sejuk, dingin

○ peringkat siswa di kelas

 

 

 

Skala Pengukuran Interval

● Berasosiasi dengan tipe data kuantitatif

● Data dapat dikelompokkan

● Data dapat disusun berdasarkan urutan, peringkat, atau ranking

● Dapat dikenakan operasi matematika untuk menghitung selisih nilai

● Nilai numerik merepresentasikan posisi pada suatu skala ukur tertentu

● Tidak memiliki nilai nol yang absolut (no inherent zero)

● Tidak dapat dikenakan operasi matematika terkait perkalian

● Contoh:

○ temperatur udara 32 derajad celsius

○ tahun 2020

 

 

 

Skala Pengukuran Rasio (Ratio)

● Berasosiasi dengan tipe data kuantitatif

● Data dapat dikelompokkan

● Data dapat disusun berdasarkan urutan, peringkat, atau ranking

● Dapat dikenakan operasi matematika untuk menghitung selisih nilai

● Memiliki nilai nol yang absolut (inherent zero

● Dapat dikenakan operasi matematika terkait perkalian

 

● Contoh:

○ usia anak 7 tahun

○ berat badan 65 Kg

○ harga nasi goreng Rp 25,000