Hogyan határozzuk meg az adatok valószínűségi elosztási típusát?

Tartalomjegyzék:

Anonim

Amikor adatokat gyűjtött a rendszerről vagy a folyamatról, a következő lépés annak meghatározása, hogy milyen típusú valószínűségi eloszlás van. A valószínűségi eloszlás típusai a következők: diszkrét egyenlet, Bernoulli, binomiális, negatív binomiális, Poisson, geometriai, folyamatos egyenletes, normál (haranggörbe), exponenciális, gamma és béta eloszlások. A lehetőségek listájából még néhányat is szűkíthetünk, ami meghatározza, hogy melyik a legközelebbi R-négyzet értéke sokkal gyorsabb.

A szükséges elemek

  • Grafikus szoftver

  • Az R négyzet értékének kiszámításának eszközei (legjobb illeszkedési elemzés)

Rajzolja az adatokat az adattípus vizuális megjelenítéséhez.

Az egyik első lépés annak meghatározására, hogy milyen adatforgalom van - és így az adatok modellezéséhez használt egyenlet típus -, hogy kizárja, hogy mi nem lehet. • Ha az adatkészletben vannak csúcsok, nem lehet diszkrét egyenletes eloszlás. • Ha az adatoknak több csúcsa van, nem Poisson vagy binomiális. • Ha egyetlen görbéje van, nincs másodlagos csúcs, és mindkét oldalon lassú lejtője lehet, Poisson vagy gamma eloszlás lehet. De nem lehet diszkrét egyenletes eloszlás. • Ha az adatok egyenletesen oszlanak el, és az egyik oldalra nem ferde, biztonságosan kizárható a gamma vagy a Weibull eloszlás. • Ha a függvény egyenletes eloszlást vagy csúcsot mutat a grafikus eredmények közepén, ez nem geometriai eloszlás vagy exponenciális eloszlás. • Ha egy tényező környezeti változóként változik, valószínűleg nem Poisson-eloszlás.

Miután a valószínűségi eloszlás típusát szűkítették, végezzünk egy R négyzetes elemzést minden lehetséges valószínűségi eloszlás típusról. A legmagasabb R-négyzettel rendelkező érték valószínűleg helyes.

Távolítson el egy kimenő adatpontot. Ezután számítsa újra az R négyzetet. Ha ugyanaz a valószínűségi eloszlás típus jelenik meg, mint a legközelebbi mérkőzés, akkor nagy a bizalom, hogy ez a helyes valószínűségi eloszlás az adatkészlet számára.

tippek

  • Ha az adatok többszörös csúcsokat mutatnak, széles szórás lehetséges, hogy két különálló folyamat folyik, vagy a mintavételezett termék vegyes. Ismertesse az adatokat, majd elemezze újra.

Figyelem

Ellenőrizze a generált egyenleteket a későbbi adatkészletek ellen, hogy meggyőződjön arról, hogy az adatállomány még mindig pontos. Elképzelhető, hogy a környezeti tényezők és a folyamatok elmozdulása tévesek az aktuális egyenletekre és modellekre.