Hogyan kell kiszámítani a maradék varianciát

Tartalomjegyzék:

Anonim

A befektetők az eszközárak mozgásának modelljeit használják arra, hogy megjósolják, hogy a befektetés ára melyik időpontban lesz. Ezeknek az előrejelzéseknek az elkészítéséhez használt módszerek a statisztikai területen ismert mezők részét képezik regresszió analízis. A. T maradék variancia az értékek halmaza egy regressziós elemző eszköz, amely azt méri, hogy a modell előrejelzései mennyire pontosan egyeznek a tényleges értékekkel.

Regressziós vonal

A regressziós vonal megmutatja, hogyan változott az eszköz értéke a változók változása miatt. Más néven a trendvonal, a regressziós vonal az eszköz árának "trendjét" mutatja. A regressziós sort egy lineáris egyenlet mutatja:

Y = a + bX

ahol az "Y" az eszközérték, az "a" állandó, a "b" szorzó, az "X" pedig az eszközértékhez kapcsolódó változó.

Például, ha a modell azt jósolja, hogy egy egy hálószobás ház 300 000 dollárért értékesít, egy két hálószobás ház 400 000 dollárért ad eladást, és egy három hálószobás ház 500.000 dollárért ad eladást, a regressziós vonal úgy néz ki, mint:

Y = 200 000 + 100 000 X

ahol az "Y" az otthon eladási ára, az "X" pedig a hálószobák száma.

Y = 200 000 + 100 000 (1) = 300 000

Y = 200 000 + 100 000 (2) = 400 000

Y = 200 000 + 100 000 (3) = 500 000

szórásgörbe

A szórásgörbe azt a pontot mutatja, amely az eszközérték és a változó közötti tényleges korrelációt mutatja. A "scatterplot" kifejezés abból a tényből származik, hogy amikor ezeket a pontokat grafikonon ábrázoljuk, úgy tűnik, hogy "szétszórva" vannak, nem pedig tökéletesen a regressziós vonalon. A fenti példánál egy ilyen adatpontokkal rendelkezhet egy scatterplot:

Az 1. pont: 1BR 288 000 dollárért értékesített

2. pont: 1BR 315 000 dollárért értékesített

3. pont: 2BR 395 000 dollárért értékesített

4. pont: 2BR 410 000 dollárért értékesített

5. pont: 3BR 492 000 dollárért

6. pont: 3BR 507 000 dollárért

A fennmaradó variancia kiszámítása

A fennmaradó variancia kiszámítása a négyzetek összege az eszköz értékének különbségei a regressziós vonalon és az egyes megfelelő eszközök értéke a szórólapon.

A különbségek négyzetei itt láthatók:

1. pont: 288 000 dollár - 300 000 dollár = (- $ 12,000); (-12.000)2 = 144,000,000

2. pont: 315 000 $ - 300 000 $ = (+ 15 000 dollár); (15.000)2 = 225,000,000

3. pont: 395 000 dollár - 400 000 dollár = (- $ 5000); (-5000)2 = 25,000,000

4. pont: 410 000 dollár - 400 000 dollár = (+ $ 10,000); (10.000)2 = 100,000,000

5. pont: 492 000 $ - 500 000 dollár = (- $ 8,000); (-8,000)2 = 64,000,000

6. pont: 507 000 $ - 500 000 dollár = (+ 7000 $); (7000)2 = 49,000,000

A négyzetek összege = 607,000,000

A fennmaradó varianciát a négyzetek összege és az (n-2) osztja meg, ahol az "n" a szórási ponton lévő adatpontok száma.

RV = 607 000 000 / (6-2) = 607 000 000/4 = 151,750,000.

A maradék variancia használata

Míg a scatterplot minden pontja nem fog tökéletesen illeszkedni a regressziós vonalhoz, a stabil modell a regressziós vonal körüli rendszeres eloszlású pontokat kap. A fennmaradó variancia "hibatranszfer" néven is ismert. A magas maradék variancia azt mutatja, hogy az eredeti modell regressziós sora hibás lehet. Néhány táblázatkezelő funkció megmutatja a folyamatot a regressziós vonal létrehozása mögött, amely közelebb áll a scatterplot adatokhoz.