Cara Mengira Outliers: 7 Langkah (dengan Imej)

Isi kandungan:

Cara Mengira Outliers: 7 Langkah (dengan Imej)
Cara Mengira Outliers: 7 Langkah (dengan Imej)

Video: Cara Mengira Outliers: 7 Langkah (dengan Imej)

Video: Cara Mengira Outliers: 7 Langkah (dengan Imej)
Video: VISKOSITAS DAN KECEPATAN TERMINAL 2024, Mac
Anonim

Outlier adalah data pemerhatian yang jauh berbeza secara numerik dari pemerhatian lain dalam sampel. Istilah ini digunakan dalam kajian statistik dan dapat menunjukkan keabnormalan dalam set data atau kesalahan dalam pengukuran yang dilakukan. Mengetahui cara mengira outlier adalah penting untuk memastikan pemahaman data yang tepat dan akan menghasilkan kesimpulan yang lebih tepat dari kajian. Terdapat proses yang sangat mudah untuk menghitungnya untuk satu set pemerhatian tertentu.

langkah-langkah

Kira Outliers Langkah 1
Kira Outliers Langkah 1

Langkah 1. Belajar mengenali potensi luar

Sebelum mengira sama ada data pemerhatian mewakili orang luar atau tidak, selalu berguna untuk memeriksa set data dan mengenali potensi luaran. Sebagai contoh, pertimbangkan set data yang mewakili suhu 12 objek yang berbeza di dalam bilik. Sekiranya 11 objek mempunyai suhu sekitar 21 ° C, tetapi kedua belas (mungkin oven) mempunyai suhu 150 ° C, pemeriksaan cepat mungkin mengatakan bahawa oven itu lebih baik.

Kira Outliers Langkah 2
Kira Outliers Langkah 2

Langkah 2. Susun data pemerhatian dari yang paling kecil hingga yang terbesar

Teruskan dengan contoh di atas, pertimbangkan set data berikut yang mewakili suhu pelbagai objek: {22, 21, 24, 21, 21, 20, 21, 23, 22, 150, 22, 20}. Set ini harus diedarkan sebagai: {20, 20, 21, 21, 21, 21, 22, 22, 22, 23, 24, 150}.

Kira Outliers Langkah 3
Kira Outliers Langkah 3

Langkah 3. Kira median set data

Median adalah data pemerhatian yang terletak di atas separuh bawah data dan di bawah separuh atas. Sekiranya set data mengandungi pemerhatian yang sama rata, maka kedua istilah pertengahan itu mesti difikirkan. Dalam contoh di atas, dua istilah tengah adalah 21 dan 22, jadi mediannya adalah ((21 + 22) / 2), atau 21, 5.

Kira Outliers Langkah 4
Kira Outliers Langkah 4

Langkah 4. Hitung kuartil bawah

Titik ini, yang disebut Q1, adalah data pemerhatian yang berada di bawah 25% pemerhatian. Dalam contoh di atas, dua istilah harus difaktorkan lagi, kali ini 21 dan 21. Rata-rata kedua-duanya akan menjadi ((21 + 21) / 2), atau 21.

Kira Outliers Langkah 5
Kira Outliers Langkah 5

Langkah 5. Hitung kuartil atas

Titik ini, yang disebut Q3, adalah data pemerhatian yang berada di atas 25% dari pemerhatian. Teruskan dengan contoh kita, mengambil purata dua dadu 22 dan 23 menuju Q3, iaitu 22, 5.

Kira Outliers Langkah 6
Kira Outliers Langkah 6

Langkah 6. Cari "halangan dalaman" set data

Langkah pertama adalah mengalikan perbezaan antara Q1 dan Q3 (disebut julat interkuartil) dengan 1.5. Dalam contoh di atas, julat interkuartil adalah (22, 5 - 21), iaitu, 1, 5. Darabkan nilai ini dengan 1, 5 memberikan 2, 25. Tambahkan nombor ini ke Q3 dan tolak dari Q1 untuk membina halangan. Dalam contoh ini, halangan dalaman atas dan bawah adalah 24, 75 dan 18, 75.

Semua data pemerhatian di luar julat ini dianggap sebagai outlier sederhana. Dalam set data untuk contoh ini, hanya suhu ketuhar (150 ° C) yang dianggap sebagai penyekat sederhana

Kira Outliers Langkah 7
Kira Outliers Langkah 7

Langkah 7. Cari "penghalang luaran" set data

Ini dilakukan dengan cara yang sama seperti halangan dalaman, kecuali bahawa julat interkuartil dikalikan dengan 3 dan bukannya 1.5. Dengan mengalikan julat interkuartil di atas dengan 3, kita mendapat (1, 5 * 3), atau 4, 5. Oleh itu, penghalang luaran atas dan bawah adalah 27 dan 16, 5.

Sebarang nilai pemerhatian yang terdapat di luar rintangan luaran dianggap sebagai keterlaluan ekstrem. Dalam contoh ini, suhu ketuhar, 150º C, juga merupakan penyekat yang melampau

Disyorkan: