Empirikus eloszlásfüggvény. Empirikus eloszlásfüggvény, tulajdonságok Az empirikus eloszlásfüggvény az f x függvény

13. előadás A valószínűségi változók statisztikai becslésének fogalma

Legyen ismert egy X mennyiségi jellemző statisztikai gyakorisági eloszlása. Jelöljük azon megfigyelések számával, amelyekben a jellemző értéke kisebb, mint x, és n-el az összes megfigyelés számát. Nyilvánvalóan az X esemény relatív gyakorisága< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

Empirikus eloszlásfüggvény(mintavételi eloszlási függvény) egy olyan függvény, amely minden x értékhez meghatározza az X esemény relatív gyakoriságát< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

A minta empirikus eloszlásfüggvényével ellentétben a sokaságeloszlási függvényt ún elméleti eloszlásfüggvény. A különbség ezek között a függvények között az, hogy az elméleti függvény határozza meg valószínűség események X< x, тогда как эмпирическая – relatív gyakoriság ugyanaz az esemény.

Ahogy n növekszik, az X esemény relatív gyakorisága< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

Az empirikus eloszlásfüggvény tulajdonságai:

1) Az empirikus függvény értékei a szegmenshez tartoznak

2) - nem csökkenő funkció

3) Ha a legkisebb opció, akkor = 0 -ra, ha a legnagyobb, akkor = 1 -re.

A minta empirikus eloszlásfüggvénye a sokaság elméleti eloszlásfüggvényének becslésére szolgál.

Példa. Készítsünk egy empirikus függvényt a mintaeloszlás alapján:

Lehetőségek
Frekvenciák

Keressük meg a mintanagyságot: 12+18+30=60. A legkisebb opció a 2, tehát =0 x £ 2 esetén. Az x értéke<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Így a kívánt empirikus függvény alakja:

A statisztikai becslések legfontosabb tulajdonságai

Legyen szükséges az általános populáció néhány mennyiségi jellemzőjének tanulmányozása. Tételezzük fel, hogy elméleti megfontolások alapján ezt sikerült megállapítani melyiket pontosan az eloszlásnak van előjele, és meg kell becsülni azokat a paramétereket, amelyek alapján meghatározzák. Például, ha a vizsgált jellemző normálisan oszlik el a sokaságban, akkor meg kell becsülni a matematikai elvárást és a szórást; ha a karakterisztikának Poisson-eloszlása ​​van, akkor szükséges az l paraméter becslése.

Általában csak mintaadatok állnak rendelkezésre, például egy mennyiségi jellemző értékei, amelyeket n független megfigyelés eredményeként kaptunk. Független valószínűségi változóknak tekintve azt mondhatjuk egy elméleti eloszlás ismeretlen paraméterének statisztikai becslésének megtalálása azt jelenti, hogy megtaláljuk a megfigyelt valószínűségi változók függvényét, amely a becsült paraméter közelítő értékét adja meg. Például a normális eloszlás matematikai elvárásának becsléséhez a függvény szerepét a számtani átlag játssza.



Ahhoz, hogy a statisztikai becslések a becsült paraméterek helyes közelítését adják, bizonyos követelményeknek meg kell felelniük, amelyek közül a legfontosabbak a követelmények kitelepítetlen És fizetőképesség értékelések.

Legyen az elméleti eloszlás ismeretlen paraméterének statisztikai becslése. Legyen a becslés egy n méretű mintából. Ismételjük meg a kísérletet, i.e. vegyünk ki egy másik, azonos méretű mintát az általános sokaságból, és annak adatai alapján kapjunk eltérő becslést. A kísérletet sokszor megismételve különböző számokat kapunk. A pontszám felfogható egy valószínűségi változónak, a számok pedig annak lehetséges értékei.

Ha a becslés hozzávetőleges értéket ad bőségesen, azaz minden szám nagyobb, mint a valódi érték, és ennek következtében a valószínűségi változó matematikai elvárása (átlagértéke) nagyobb, mint:. Hasonlóképpen, ha becslést ad hátránnyal, Azt .

Így egy olyan statisztikai becslés alkalmazása, amelynek matematikai elvárása nem egyenlő a becsült paraméterrel, szisztematikus (azonos előjelű) hibákhoz vezetne. Ha éppen ellenkezőleg, akkor ez garantálja a szisztematikus hibákat.

Elfogulatlan statisztikai becslésnek nevezzük, amelynek matematikai elvárása megegyezik a becsült paraméterrel bármely mintaméret esetén.

Kitelepített becslésnek nevezzük, amely nem felel meg ennek a feltételnek.

A becslés torzítatlansága még nem garantálja a becsült paraméter jó közelítését, mivel a lehetséges értékek nagyon szétszórt átlagértéke körül, i.e. az eltérés szignifikáns lehet. Ebben az esetben például egy minta adataiból kapott becslés az átlagértéktől, tehát a becsült paramétertől lényegesen távolinak bizonyulhat.

Hatékony egy statisztikai becslés, amely adott n mintaméret esetén rendelkezik lehető legkisebb szórás .

Ha nagy mintákat veszünk figyelembe, statisztikai becslésekre van szükség fizetőképesség .

Gazdag statisztikai becslésnek nevezzük, amely, mivel n®¥ a becsült paraméterhez hajlik. Például, ha egy torzítatlan becslés szórása nullára hajlik n®¥-ként, akkor egy ilyen becslés konzisztensnek bizonyul.

Tanuljunk meg néhány mennyiségi tulajdonságot? általános sokaság, és feltételezzük, hogy bármely mintaméret esetén ismert ennek a jellemzőnek a gyakorisági eloszlása. A minta méretének rögzítésével a P,által jelöljük p x az opciók száma kisebb, mint x. Akkor nem nehéz belátni ezt a kapcsolatot njn egy esemény relatív gyakoriságát fejezi ki (?

Ez az arány egy rögzített x számtól függ, és ezért ennek az x mennyiségnek a függvénye. Jelöljük azzal F*(x).

Meghatározás 1.10. Funkció F*(x) = -, a relatív kifejezést kifejezve

esemény gyakorisága (? empirikus függvény

terjesztés (mintavételi eloszlási függvény vagy statisztikai eloszlásfüggvény).

Tehát definíció szerint

Emlékezzünk vissza, hogy a szolgáltatás elosztási függvénye ?, A populációt egy esemény valószínűségeként határozzuk meg (?

és az empirikus eloszlásfüggvénnyel ellentétben ún elméleti eloszlásfüggvény. Mivel az empirikus eloszlásfüggvény ugyanannak az eseménynek a valószínűsége, ezért Bernoulli tétele szerint (lásd 5.4. fejezet) nagy mintaméret mellett alig térnek el egymástól abban az értelemben, hogy

ahol e tetszőlegesen kis pozitív szám.

Az (1.2) összefüggés azt mutatja, hogy ha az elméleti eloszlásfüggvény ismeretlen, akkor a mintából talált empirikus eloszlásfüggvény használható mintabecslésként. Az (1.2) képletből egyúttal következik, hogy ez a becslés konzisztens (lásd a 2.4 definíciót).

Megjegyzés 1.6. Hozzáállás nJnúgy is értelmezhető Ossza meg a minta azon tagjai, amelyek egy rögzített x számtól balra fekszenek. Jelöljük tehát co^-vel.

Most nézzünk egy példát egy empirikus eloszlásfüggvény megalkotására egy diszkrét mintára.

Példa 1.2. A minta eloszlása ​​ismert (1.7. táblázat).

1.7. táblázat

lehetőség x.

FrekvenciaÉN.

Szerkessze meg empirikus eloszlásfüggvényét!

Először keressük meg a minta méretét:

választási lehetőség x x- a legkisebb. Ezért n x = 0 és F*(x)= 0 at x% 3, akkor P z = 6, azaz a ponttól balra x= 3 hat mintaérték van. Ennélfogva, F*(3) = - = 0,12. Balra x = 5 található

feleségek n x=5 = 6 + 9= 15 minta lehetőség. Ezért Fn(5) = - = 0,3. Így

Hogyan n x=1 = 6 + 9 + 18 = 33, akkor Fn(7) = - = 0,66. Hasonlóan találjuk

33 + 12 = 45. Ezért F* (9) = ^ = 0,9.

Az x 5 = 9 opció a legnagyobb. Ezért x > 9 esetén a teljes minta ettől az x ponttól balra fekszik. Ezért n x>9= 50 és F*(x) = -= 1, ha x > 9,50

A fenti számításokból tehát az következik, hogy a kívánt empirikus függvény a teljes valós tengelyen egyedileg definiált, darabonként állandó és alakja

Ennek a függvénynek a grafikonja egy lépéses ábrát mutat, és az ábrán látható. 1.6. ?

Ami a folytonos mintákra vonatkozó empirikus függvény megalkotásának kérdését illeti, ez a probléma általánosságban messze nem megoldott egyértelműen. Ennek oka az a tény, hogy az empirikus függvény értékei egyedileg csak azon részintervallumok végpontjaiban találhatók meg, amelyekre a mintapopulációt tartalmazó fő intervallum fel van osztva. De a részintervallumok belső pontjain nincs meghatározva. Ezeken a pontokon tovább határozza meg vagy egy darabonkénti konstans függvénnyel (lásd az előző példát), vagy valamilyen növekvő folytonos függvénnyel, például lineáris függvénnyel, pl. Az empirikus eloszlásfüggvény megalkotásához lineáris közelítést használunk.

1.3. példa. Az 1.3. táblázat szerint keresse meg a vállalkozás alkalmazottainak szolgálati idő szerinti empirikus eloszlási függvényét!

A határozottság kedvéért feltételezzük, hogy a vizsgált parciális intervallumok bal oldalon zártak, jobb oldalon nyitottak, azaz. csak a bal végüket tartalmazzák. Legyen x = 2. Ekkor az n esemény 2 = 0 és F*(2)= 0. Ha x e (2; 6), akkor ezen a ponton az érték p x már nincs definiálva, és vele együtt az empirikus függvény értéke sem. Például, ha x = 3, akkor a probléma körülményeiből nem lehet meghatározni a három évnél kevesebb munkatapasztalattal rendelkező munkavállalók számát, pl. nem találja a frekvenciát p xés ezért F*(x).

Továbbá, hasonló módon érvelve, meg vagyunk győződve arról, hogy a szükséges függvény F*(x) meghatározott értékeket vesz fel a részintervallumok bal végpontjainál, például: "6) = 4/100 = 0,04; "10) = 0,12; "14) = 0,24; "18) = 0,59; F*(22) = 0,78; "26) = 0,90"; "30) = 1, de nincs meghatározva a parciális intervallumok belső pontjain. A probléma végleges megoldása érdekében a kívánt függvényt a részintervallumok belső pontjain tovább definiáljuk vagy egy darabonkénti állandó függvénnyel (1.7. ábra), vagy valamilyen folytonosan növekvő függvénnyel (1.8. ábra, ahol a kívánt empirikus függvényt tovább definiáljuk: lineáris függvény). ?

Az empirikus eloszlásfüggvény meghatározása

Legyen $X$ egy valószínűségi változó. $F(x)$ egy adott valószínűségi változó eloszlásfüggvénye. Egy adott valószínűségi változón $n$ kísérletet végzünk azonos feltételek mellett, egymástól függetlenül. Ebben az esetben egy $x_1,\ x_2\ $, ... ,$\ x_n$ értéksorozatot kapunk, amelyet mintának nevezünk.

1. definíció

Minden $x_i$ értéket ($i=1,2\ $, ... ,$ \ n$) változatnak nevezünk.

Az elméleti eloszlásfüggvény egyik becslése az empirikus eloszlásfüggvény.

3. definíció

A $F_n(x)$ tapasztalati eloszlásfüggvény egy olyan függvény, amely minden $x$ értékhez meghatározza a $X \ esemény relatív gyakoriságát

ahol $n_x$ a $x$-nál kisebb opciók száma, $n$ a minta mérete.

Az empirikus és az elméleti függvény között az a különbség, hogy az elméleti függvény határozza meg a $X esemény valószínűségét

Az empirikus eloszlásfüggvény tulajdonságai

Tekintsük most az eloszlásfüggvény néhány alapvető tulajdonságát.

    A $F_n\left(x\right)$ függvény tartománya a $$ szegmens.

    A $F_n\left(x\right)$ egy nem csökkenő függvény.

    A $F_n\left(x\right)$ egy bal oldali folytonos függvény.

    A $F_n\left(x\right)$ egy darabonkénti állandó függvény, és csak a $X$ valószínűségi változó értékeinek pontjain növekszik

    Legyen $X_1$ a legkisebb és $X_n$ a legnagyobb lehetőség. Ezután $F_n\left(x\right)=0$ $(x\le X)_1$ és $F_n\left(x\right)=1$ $x\ge X_n$ esetén.

Vezessünk be egy tételt, amely összeköti az elméleti és az empirikus függvényeket.

1. tétel

Legyen $F_n\left(x\right)$ az empirikus eloszlásfüggvény, és $F\left(x\right)$ az általános minta elméleti eloszlásfüggvénye. Ekkor az egyenlőség érvényesül:

\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

Példák az empirikus eloszlásfüggvény megtalálásának problémáira

1. példa

Hagyja, hogy a mintavételi eloszlás a következő adatokat rögzítse táblázat segítségével:

1. kép

Keresse meg a minta méretét, hozzon létre egy empirikus eloszlásfüggvényt, és ábrázolja azt.

Mintanagyság: $n=5+10+15+20=50$.

Az 5. tulajdonság szerint $x\le 1$ $F_n\left(x\right)=0$ és $x>4$ esetén $F_n\left(x\right)=1$.

$x érték

$x érték

$x érték

Így kapjuk:

2. ábra.

3. ábra.

2. példa

Oroszország középső részének városai közül véletlenszerűen választottak ki 20 várost, amelyekre a tömegközlekedési díjakról a következő adatokat kaptuk: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13 , 13, 12, 12, 15, 14, 14.

Hozzon létre egy empirikus eloszlásfüggvényt ehhez a mintához, és ábrázolja azt.

Írjuk fel a mintaértékeket növekvő sorrendben, és számítsuk ki az egyes értékek gyakoriságát. A következő táblázatot kapjuk:

4. ábra.

Mintaméret: $n=20$.

Az 5. tulajdonság szerint a $x\le 12$ $F_n\left(x\right)=0$ és a $x>15$ esetén $F_n\left(x\right)=1$.

$x érték

$x érték

$x érték

Így kapjuk:

5. ábra.

Ábrázoljuk az empirikus eloszlást:

6. ábra.

Eredetiség: $92.12\%$.

Mint ismeretes, egy valószínűségi változó eloszlási törvénye többféleképpen megadható. Egy diszkrét valószínűségi változó megadható eloszlási sorozattal vagy integrálfüggvénnyel, a folytonos valószínűségi változó pedig integrállal vagy differenciálfüggvénnyel. Tekintsük e két függvény szelektív analógjait.

Legyen valamilyen véletlen térfogati változó értékeinek mintakészlete és ebből a halmazból minden opció a gyakoriságához van társítva. Engedd tovább egy valós szám, és – a valószínűségi változó mintaértékeinek száma
, kisebb .Akkor a szám a mintában megfigyelt mennyiségi értékek gyakorisága x, kisebb , azok. az esemény előfordulásának gyakorisága
. Amikor megváltozik xáltalános esetben az érték is megváltozik . Ez azt jelenti, hogy a relatív gyakoriság az argumentum függvénye . És mivel ezt a függvényt a kísérletek eredményeként kapott mintaadatokból találjuk meg, ezért szelektív ill empirikus.

Meghatározás 10.15. Empirikus eloszlásfüggvény(mintavételi eloszlási függvény) a függvény
, minden egyes értékhez meghatározva x az esemény relatív gyakorisága
.

(10.19)

Az empirikus mintavételi eloszlásfüggvénnyel ellentétben az eloszlásfüggvény F(x) nevezzük elméleti eloszlásfüggvény. A különbség köztük az, hogy az elméleti függvény F(x) meghatározza egy esemény valószínűségét
, az empirikus pedig ugyanazon esemény relatív gyakorisága. Bernoulli tételéből az következik

,
(10.20)

azok. szabadlábon valószínűség
és az esemény relatív gyakorisága
, azaz
alig különböznek egymástól. Ebből az következik, hogy célszerű a minta empirikus eloszlásfüggvényét használni az általános sokaság elméleti (integrális) eloszlásfüggvényének közelítésére.

Funkció
És
ugyanazokkal a tulajdonságokkal rendelkeznek. Ez a függvény definíciójából következik.

Tulajdonságok
:


10.4. példa. Készítsen empirikus függvényt a megadott mintaeloszlás alapján:

Lehetőségek

Frekvenciák

Megoldás: Keressük a minta méretét n= 12+18+30=60. A legkisebb lehetőség
, ennélfogva,
nál nél
. Jelentése
, nevezetesen
12 alkalommal figyelték meg, tehát:

=
nál nél
.

Jelentése x< 10, nevezetesen
És
12+18=30 alkalommal figyelték meg, ezért
=
nál nél
. Nál nél

.

A szükséges empirikus eloszlásfüggvény:

=

Menetrend
ábrán látható. 10.2

R
van. 10.2

Ellenőrző kérdések

1. Milyen főbb problémákat old meg a matematikai statisztika? 2. Általános és minta sokaság? 3. Határozza meg a minta méretét. 4. Milyen mintákat nevezünk reprezentatívnak? 5. Reprezentativitás hibái. 6. A mintavétel alapvető módszerei. 7. A gyakoriság, a relatív gyakoriság fogalmai. 8. A statisztikai sorozat fogalma. 9. Írd le a Sturges-képletet! 10. Fogalmazza meg a mintatartomány, medián és módus fogalmát! 11. Frekvenciapoligon, hisztogram. 12. A minta sokaság pontbecslésének fogalma. 13. Elfogult és elfogulatlan pontbecslés. 14. Fogalmazza meg a mintaátlag fogalmát! 15. Fogalmazza meg a minta variancia fogalmát! 16. Fogalmazza meg a minta szórásának fogalmát! 17. Fogalmazza meg a minta variációs együttható fogalmát! 18. Fogalmazza meg a minta geometriai átlag fogalmát!

Az empirikus eloszlásfüggvény meghatározása

Legyen $X$ egy valószínűségi változó. $F(x)$ egy adott valószínűségi változó eloszlásfüggvénye. Egy adott valószínűségi változón $n$ kísérletet végzünk azonos feltételek mellett, egymástól függetlenül. Ebben az esetben egy $x_1,\ x_2\ $, ... ,$\ x_n$ értéksorozatot kapunk, amelyet mintának nevezünk.

1. definíció

Minden $x_i$ értéket ($i=1,2\ $, ... ,$ \ n$) változatnak nevezünk.

Az elméleti eloszlásfüggvény egyik becslése az empirikus eloszlásfüggvény.

3. definíció

A $F_n(x)$ tapasztalati eloszlásfüggvény egy olyan függvény, amely minden $x$ értékhez meghatározza a $X \ esemény relatív gyakoriságát

ahol $n_x$ a $x$-nál kisebb opciók száma, $n$ a minta mérete.

Az empirikus és az elméleti függvény között az a különbség, hogy az elméleti függvény határozza meg a $X esemény valószínűségét

Az empirikus eloszlásfüggvény tulajdonságai

Tekintsük most az eloszlásfüggvény néhány alapvető tulajdonságát.

    A $F_n\left(x\right)$ függvény tartománya a $$ szegmens.

    A $F_n\left(x\right)$ egy nem csökkenő függvény.

    A $F_n\left(x\right)$ egy bal oldali folytonos függvény.

    A $F_n\left(x\right)$ egy darabonkénti állandó függvény, és csak a $X$ valószínűségi változó értékeinek pontjain növekszik

    Legyen $X_1$ a legkisebb és $X_n$ a legnagyobb lehetőség. Ezután $F_n\left(x\right)=0$ $(x\le X)_1$ és $F_n\left(x\right)=1$ $x\ge X_n$ esetén.

Vezessünk be egy tételt, amely összeköti az elméleti és az empirikus függvényeket.

1. tétel

Legyen $F_n\left(x\right)$ az empirikus eloszlásfüggvény, és $F\left(x\right)$ az általános minta elméleti eloszlásfüggvénye. Ekkor az egyenlőség érvényesül:

\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

Példák az empirikus eloszlásfüggvény megtalálásának problémáira

1. példa

Hagyja, hogy a mintavételi eloszlás a következő adatokat rögzítse táblázat segítségével:

1. kép

Keresse meg a minta méretét, hozzon létre egy empirikus eloszlásfüggvényt, és ábrázolja azt.

Mintanagyság: $n=5+10+15+20=50$.

Az 5. tulajdonság szerint $x\le 1$ $F_n\left(x\right)=0$ és $x>4$ esetén $F_n\left(x\right)=1$.

$x érték

$x érték

$x érték

Így kapjuk:

2. ábra.

3. ábra.

2. példa

Oroszország középső részének városai közül véletlenszerűen választottak ki 20 várost, amelyekre a tömegközlekedési díjakról a következő adatokat kaptuk: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13 , 13, 12, 12, 15, 14, 14.

Hozzon létre egy empirikus eloszlásfüggvényt ehhez a mintához, és ábrázolja azt.

Írjuk fel a mintaértékeket növekvő sorrendben, és számítsuk ki az egyes értékek gyakoriságát. A következő táblázatot kapjuk:

4. ábra.

Mintaméret: $n=20$.

Az 5. tulajdonság szerint a $x\le 12$ $F_n\left(x\right)=0$ és a $x>15$ esetén $F_n\left(x\right)=1$.

$x érték

$x érték

$x érték

Így kapjuk:

5. ábra.

Ábrázoljuk az empirikus eloszlást:

6. ábra.

Eredetiség: $92.12\%$.