Hogyan számítsuk ki a statisztikák varianciáját?

Tartalomjegyzék:

Anonim

A statisztikák egyik legalapvetőbb fogalma az átlag, vagy számtani átlaga, számok halmazát. Az átlag az adatállomány központi értékét jelenti. A variancia egy adatkészlet mérése azt méri, hogy az adott adatkészlet elemeit milyen mértékben osztják ki az átlagtól. Az adatkészletek, amelyekben a számok közel állnak az átlaghoz, alacsony szórással rendelkeznek. Azok a készletek, amelyekben a számok jóval magasabbak vagy alacsonyabbak, mint az átlag, nagy eltérést mutatnak.

Számítsa ki az adatállomány átlagát

Számítsa ki a négyzetes különbségeket

A következő lépés az adatkészlet minden elemének és az átlagnak a különbségének kiszámítását jelenti. Mivel egyes elemek magasabbak lesznek az átlagnál, és egyesek alacsonyabbak lesznek, a varianciaszámítás a különbségek négyzetét használja.

1. nap értékesítés - átlagos értékesítés: $ 62,000 - 65414,29 $ = (- $ 3,414.29); (-3,414.29)2 = 11,657,346.94

2. nap értékesítés - átlagos értékesítés: $ 64,800 - $ 65414.29 = (- $ 614.29); (-614,29)2 = 377,346.94

3. nap értékesítés - átlagos értékesítés: $ 62,600 - 65414,29 $ = (- $ 2,814.29); (-2,814.29)2 = 7,920,204.08

4. nap értékesítés - átlagos értékesítés: 69 200 dollár - 65414,29 $ = (+ $ 3,785,71); (+3,785.71)2 = 14,331,632.65

5. nap értékesítés - átlagos értékesítés: $ 66,000 - 65414,29 $ = (+ $ 585.71); (585,71)2 = 343,061.22

6. nap értékesítés - átlagos értékesítés: $ 63,900 - 65414,29 $ = (- $ 1514.29); (-1,514.29)2 = 2,293,061.22

7. nap értékesítés - átlagos értékesítés: $ 69,400 - $ 65414.29 = (+ $ 3,985.71); (+3,985.71)2 = 15,885,918.37

JEGYZET: A négyzetes különbségeket nem dollárban mérik. Ezeket a számokat a variancia kiszámításához használja a következő lépésben.

Változás és standard eltérés

A variancia a négyzetes különbségek átlaga.

11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43

52,808,571.43/7 = 7,544,081.63

Mivel a variancia a különbség négyzetét használja, a variancia négyzetgyökér világosabb jelzést ad a tényleges terjedésre. A statisztikában a variancia négyzetgyökét a neve szórás.

SQRT (7,544,081,63) = 2,746,65 $

A szórás és a standard eltérés alkalmazása

Mind a szórás, mind a szórás rendkívül hasznos a statisztikai elemzésben. A variancia az átlagból származó adatkészlet általános terjedését méri. A szórás segít a detektálásban kiugró, vagy az adatállomány elemeit, amelyek túl messzire hagytak az átlagtól.

A fenti adatokban a variancia meglehetősen magas, mindössze két napi eladási összeget érünk el az átlag 1000 $ -án belül. Az adatállomány azt is mutatja, hogy a hét napi eladási összegből kettő több, mint egy átlagos szórás az átlag felett, míg kettő több, mint egy átlagos szórás az átlag alatt.