Empirikus eloszlásfüggvény. Empirikus eloszlásfüggvény, tulajdonságok Empirikus eloszlásfüggvény példa

13. előadás A valószínűségi változók statisztikai becslésének fogalma

Legyen ismert egy X mennyiségi jellemző statisztikai gyakorisági eloszlása. Jelöljük azon megfigyelések számával, amelyekben a jellemző értéke kisebb, mint x, és n-el az összes megfigyelés számát. Nyilvánvalóan az X esemény relatív gyakorisága< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

Empirikus eloszlásfüggvény(mintavételi eloszlási függvény) egy olyan függvény, amely minden x értékhez meghatározza az X esemény relatív gyakoriságát< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

A minta empirikus eloszlásfüggvényével ellentétben a sokaságeloszlási függvényt ún elméleti eloszlásfüggvény. A különbség ezek között a függvények között az, hogy az elméleti függvény határozza meg valószínűség események X< x, тогда как эмпирическая – relatív gyakoriság ugyanaz az esemény.

Ahogy n növekszik, az X esemény relatív gyakorisága< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

Az empirikus eloszlásfüggvény tulajdonságai:

1) Az empirikus függvény értékei a szegmenshez tartoznak

2) - nem csökkenő funkció

3) Ha a legkisebb opció, akkor = 0 -ra, ha a legnagyobb, akkor = 1 -re.

A minta empirikus eloszlásfüggvénye a sokaság elméleti eloszlásfüggvényének becslésére szolgál.

Példa. Készítsünk egy empirikus függvényt a mintaeloszlás alapján:

Lehetőségek
Frekvenciák

Keressük meg a mintanagyságot: 12+18+30=60. A legkisebb opció a 2, tehát =0 x £ 2 esetén. Az x értéke<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Így a kívánt empirikus függvény alakja:

A statisztikai becslések legfontosabb tulajdonságai

Legyen szükséges az általános populáció néhány mennyiségi jellemzőjének tanulmányozása. Tételezzük fel, hogy elméleti megfontolások alapján ezt sikerült megállapítani melyiket pontosan az eloszlásnak van előjele, és meg kell becsülni azokat a paramétereket, amelyek alapján meghatározzák. Például, ha a vizsgált jellemző normálisan oszlik el a sokaságban, akkor meg kell becsülni a matematikai elvárást és a szórást; ha a karakterisztikának Poisson-eloszlása ​​van, akkor szükséges az l paraméter becslése.

Általában csak mintaadatok állnak rendelkezésre, például egy mennyiségi jellemző értékei, amelyeket n független megfigyelés eredményeként kaptunk. Független valószínűségi változóknak tekintve azt mondhatjuk egy elméleti eloszlás ismeretlen paraméterének statisztikai becslésének megtalálása azt jelenti, hogy megtaláljuk a megfigyelt valószínűségi változók függvényét, amely a becsült paraméter közelítő értékét adja meg. Például a normális eloszlás matematikai elvárásának becsléséhez a függvény szerepét a számtani átlag játssza.



Ahhoz, hogy a statisztikai becslések a becsült paraméterek helyes közelítését adják, bizonyos követelményeknek meg kell felelniük, amelyek közül a legfontosabbak a követelmények kitelepítetlen És fizetőképesség értékelések.

Legyen az elméleti eloszlás ismeretlen paraméterének statisztikai becslése. Legyen a becslés egy n méretű mintából. Ismételjük meg a kísérletet, i.e. vegyünk ki egy másik, azonos méretű mintát az általános sokaságból, és annak adatai alapján kapjunk eltérő becslést. A kísérletet sokszor megismételve különböző számokat kapunk. A pontszám felfogható egy valószínűségi változónak, a számok pedig annak lehetséges értékei.

Ha a becslés hozzávetőleges értéket ad bőségesen, azaz minden szám nagyobb, mint a valódi érték, és ennek következtében a valószínűségi változó matematikai elvárása (átlagértéke) nagyobb, mint:. Hasonlóképpen, ha becslést ad hátránnyal, Azt .

Így egy olyan statisztikai becslés alkalmazása, amelynek matematikai elvárása nem egyenlő a becsült paraméterrel, szisztematikus (azonos előjelű) hibákhoz vezetne. Ha éppen ellenkezőleg, akkor ez garantálja a szisztematikus hibákat.

Elfogulatlan statisztikai becslésnek nevezzük, amelynek matematikai elvárása megegyezik a becsült paraméterrel bármely mintaméret esetén.

Kitelepített becslésnek nevezzük, amely nem felel meg ennek a feltételnek.

A becslés torzítatlansága még nem garantálja a becsült paraméter jó közelítését, mivel a lehetséges értékek nagyon szétszórt átlagértéke körül, i.e. az eltérés szignifikáns lehet. Ebben az esetben például egy minta adataiból kapott becslés az átlagértéktől, tehát a becsült paramétertől lényegesen távolinak bizonyulhat.

Hatékony egy statisztikai becslés, amely adott n mintaméret esetén rendelkezik lehető legkisebb szórás .

Ha nagy mintákat veszünk figyelembe, statisztikai becslésekre van szükség fizetőképesség .

Gazdag statisztikai becslésnek nevezzük, amely, mivel n®¥ a becsült paraméterhez hajlik. Például, ha egy torzítatlan becslés szórása nullára hajlik n®¥-ként, akkor egy ilyen becslés konzisztensnek bizonyul.

Mint ismeretes, egy valószínűségi változó eloszlási törvénye többféleképpen megadható. Egy diszkrét valószínűségi változó megadható eloszlási sorozattal vagy integrálfüggvénnyel, a folytonos valószínűségi változó pedig integrállal vagy differenciálfüggvénnyel. Tekintsük e két függvény szelektív analógjait.

Legyen valamilyen véletlen térfogati változó értékeinek mintakészlete és ebből a halmazból minden opció a gyakoriságához van társítva. Engedd tovább egy valós szám, és – a valószínűségi változó mintaértékeinek száma
, kisebb .Akkor a szám a mintában megfigyelt mennyiségi értékek gyakorisága x, kisebb , azok. az esemény előfordulásának gyakorisága
. Amikor megváltozik xáltalános esetben az érték is megváltozik . Ez azt jelenti, hogy a relatív gyakoriság az argumentum függvénye . És mivel ezt a függvényt a kísérletek eredményeként kapott mintaadatokból találjuk meg, ezért szelektív ill empirikus.

Meghatározás 10.15. Empirikus eloszlásfüggvény(mintavételi eloszlási függvény) a függvény
, minden egyes értékhez meghatározva x az esemény relatív gyakorisága
.

(10.19)

Az empirikus mintavételi eloszlásfüggvénnyel ellentétben az eloszlásfüggvény F(x) nevezzük elméleti eloszlásfüggvény. A különbség köztük az, hogy az elméleti függvény F(x) meghatározza egy esemény valószínűségét
, az empirikus pedig ugyanazon esemény relatív gyakorisága. Bernoulli tételéből az következik

,
(10.20)

azok. szabadlábon valószínűség
és az esemény relatív gyakorisága
, azaz
alig különböznek egymástól. Ebből az következik, hogy célszerű a minta empirikus eloszlásfüggvényét használni az általános sokaság elméleti (integrális) eloszlásfüggvényének közelítésére.

Funkció
És
ugyanazokkal a tulajdonságokkal rendelkeznek. Ez a függvény definíciójából következik.

Tulajdonságok
:


10.4. példa. Készítsen empirikus függvényt a megadott mintaeloszlás alapján:

Lehetőségek

Frekvenciák

Megoldás: Keressük a minta méretét n= 12+18+30=60. A legkisebb lehetőség
, ennélfogva,
nál nél
. Jelentése
, nevezetesen
12 alkalommal figyelték meg, tehát:

=
nál nél
.

Jelentése x< 10, nevezetesen
És
12+18=30 alkalommal figyelték meg, ezért
=
nál nél
. Nál nél

.

A szükséges empirikus eloszlásfüggvény:

=

Menetrend
ábrán látható. 10.2

R
van. 10.2

Ellenőrző kérdések

1. Milyen főbb problémákat old meg a matematikai statisztika? 2. Általános és minta sokaság? 3. Határozza meg a minta méretét. 4. Milyen mintákat nevezünk reprezentatívnak? 5. Reprezentativitás hibái. 6. A mintavétel alapvető módszerei. 7. A gyakoriság, a relatív gyakoriság fogalmai. 8. A statisztikai sorozat fogalma. 9. Írd le a Sturges-képletet! 10. Fogalmazza meg a mintatartomány, medián és módus fogalmát! 11. Frekvenciapoligon, hisztogram. 12. A minta sokaság pontbecslésének fogalma. 13. Elfogult és elfogulatlan pontbecslés. 14. Fogalmazza meg a mintaátlag fogalmát! 15. Fogalmazza meg a minta variancia fogalmát! 16. Fogalmazza meg a minta szórásának fogalmát! 17. Fogalmazza meg a minta variációs együttható fogalmát! 18. Fogalmazza meg a minta geometriai átlag fogalmát!

Variációs sorozat. Sokszög és hisztogram.

Elosztási tartomány- a vizsgált sokaság egységeinek csoportokba rendezett eloszlását jelenti egy bizonyos változó jellemző szerint.

Az eloszlási sorozat kialakulásának hátterében álló jellemzőtől függően megkülönböztetjük őket attribúciós és variációs elosztási sorok:

§ Egy mennyiségi jellemző értékeinek növekvő vagy csökkenő sorrendjében összeállított eloszlási sorozatokat ún. variációs.

Az eloszlási variációs sorozat két oszlopból áll:

Az első oszlop a változó jellemző mennyiségi értékeit tartalmazza, amelyeket ún lehetőségekés ki vannak jelölve. Diszkrét opció – egész számként kifejezve. Az intervallum opció tól és -ig terjed. Az opciók típusától függően diszkrét vagy intervallumváltozat-sorozatot hozhat létre.
A második oszlop tartalmazza konkrét opciók száma, frekvenciákban vagy frekvenciákban kifejezve:

Frekvenciák- ezek abszolút számok, amelyek azt mutatják, hogy egy jellemző adott értéke hányszor fordul elő az aggregátumban, amely jelöl. Az összes gyakoriság összegének meg kell egyeznie a teljes sokaság egységeinek számával.

Frekvenciák() a gyakoriságok az összérték százalékában kifejezve. Az összes gyakoriság százalékban kifejezett összegének egyenlőnek kell lennie 100%-kal az egy törtrészében.

Eloszlási sorozatok grafikus ábrázolása

A disztribúciós sorozatok vizuálisan, grafikus képek segítségével kerülnek bemutatásra.

A terjesztési sorozatok a következők:

§ Sokszög

§ Hisztogramok

§ Halmozódik

Poligon

Sokszög felépítésénél a változó karakterisztika értékei a vízszintes tengelyen (x-tengely), a frekvenciák vagy frekvenciák a függőleges tengelyen (y-tengelyen) vannak ábrázolva.

1. Sokszög az ábrán. A 6.1 Oroszország lakosságának 1994-es mikrocenzusának adatain alapul.


oszlopdiagram



A hisztogram felépítéséhez az intervallumok határainak értékeit az abszcissza tengely mentén jelzik, és ezek alapján téglalapokat szerkesztenek, amelyek magassága arányos a frekvenciákkal (vagy frekvenciákkal).

ábrán. 6.2. hisztogramja mutatja az orosz lakosság 1997. évi korcsoportonkénti megoszlását.

1. ábra. Az orosz lakosság korcsoportok szerinti megoszlása

Empirikus eloszlásfüggvény, tulajdonságok.

Legyen ismert egy X mennyiségi jellemző statisztikai gyakorisági eloszlása. Jelöljük azon megfigyelések számával, amelyekben a jellemző értéke kisebb, mint x, és n-el az összes megfigyelés számát. Nyilvánvalóan az X esemény relatív gyakorisága

Az empirikus eloszlásfüggvény (mintavételi eloszlási függvény) egy olyan függvény, amely minden x értékhez meghatározza az X esemény relatív gyakoriságát.

A minta empirikus eloszlásfüggvényével ellentétben a sokaságeloszlási függvényt elméleti eloszlásfüggvénynek nevezzük. A különbség ezek között a függvények között az, hogy az elméleti függvény határozza meg az X esemény valószínűségét

Ahogy n növekszik, az X esemény relatív gyakorisága

Alaptulajdonságok

Rögzítsünk egy elemi eredményt. Ekkor a diszkrét eloszlás eloszlásfüggvényét a következő valószínűségi függvény adja meg:

hol, és - mintaelemek száma egyenlő . Különösen, ha a minta minden eleme eltérő, akkor .

Ennek az eloszlásnak a matematikai elvárása:

.

Így a mintaátlag a mintavételi eloszlás elméleti átlaga.

Hasonlóképpen, a minta variancia a mintavételi eloszlás elméleti varianciája.

A valószínűségi változó binomiális eloszlású:

A mintaeloszlási függvény az eloszlásfüggvény torzítatlan becslése:

.

A mintaeloszlási függvény varianciája a következőképpen alakul:

.

A nagy számok erős törvénye szerint a mintaeloszlásfüggvény szinte biztosan konvergál az elméleti eloszlásfüggvényhez:

szinte biztosan at .

A mintaeloszlásfüggvény az elméleti eloszlásfüggvény aszimptotikusan normális becslése. Ha akkor

címen történő elosztás szerint.

Az empirikus eloszlásfüggvény meghatározása

Legyen $X$ egy valószínűségi változó. $F(x)$ egy adott valószínűségi változó eloszlásfüggvénye. Egy adott valószínűségi változón $n$ kísérletet végzünk azonos feltételek mellett, egymástól függetlenül. Ebben az esetben egy $x_1,\ x_2\ $, ... ,$\ x_n$ értéksorozatot kapunk, amelyet mintának nevezünk.

1. definíció

Minden $x_i$ értéket ($i=1,2\ $, ... ,$ \ n$) változatnak nevezünk.

Az elméleti eloszlásfüggvény egyik becslése az empirikus eloszlásfüggvény.

3. definíció

A $F_n(x)$ tapasztalati eloszlásfüggvény egy olyan függvény, amely minden $x$ értékhez meghatározza a $X \ esemény relatív gyakoriságát

ahol $n_x$ a $x$-nál kisebb opciók száma, $n$ a minta mérete.

Az empirikus és az elméleti függvény között az a különbség, hogy az elméleti függvény határozza meg a $X esemény valószínűségét

Az empirikus eloszlásfüggvény tulajdonságai

Tekintsük most az eloszlásfüggvény néhány alapvető tulajdonságát.

    A $F_n\left(x\right)$ függvény tartománya a $$ szegmens.

    A $F_n\left(x\right)$ egy nem csökkenő függvény.

    A $F_n\left(x\right)$ egy bal oldali folytonos függvény.

    A $F_n\left(x\right)$ egy darabonkénti állandó függvény, és csak a $X$ valószínűségi változó értékeinek pontjain növekszik

    Legyen $X_1$ a legkisebb és $X_n$ a legnagyobb lehetőség. Ezután $F_n\left(x\right)=0$ $(x\le X)_1$ és $F_n\left(x\right)=1$ $x\ge X_n$ esetén.

Vezessünk be egy tételt, amely összeköti az elméleti és az empirikus függvényeket.

1. tétel

Legyen $F_n\left(x\right)$ az empirikus eloszlásfüggvény, és $F\left(x\right)$ az általános minta elméleti eloszlásfüggvénye. Ekkor az egyenlőség érvényesül:

\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

Példák az empirikus eloszlásfüggvény megtalálásának problémáira

1. példa

Hagyja, hogy a mintavételi eloszlás a következő adatokat rögzítse táblázat segítségével:

1. kép

Keresse meg a minta méretét, hozzon létre egy empirikus eloszlásfüggvényt, és ábrázolja azt.

Mintanagyság: $n=5+10+15+20=50$.

Az 5. tulajdonság szerint $x\le 1$ $F_n\left(x\right)=0$ és $x>4$ esetén $F_n\left(x\right)=1$.

$x érték

$x érték

$x érték

Így kapjuk:

2. ábra.

3. ábra.

2. példa

Oroszország középső részének városai közül véletlenszerűen választottak ki 20 várost, amelyekre a tömegközlekedési díjakról a következő adatokat kaptuk: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13 , 13, 12, 12, 15, 14, 14.

Hozzon létre egy empirikus eloszlásfüggvényt ehhez a mintához, és ábrázolja azt.

Írjuk fel a mintaértékeket növekvő sorrendben, és számítsuk ki az egyes értékek gyakoriságát. A következő táblázatot kapjuk:

4. ábra.

Mintaméret: $n=20$.

Az 5. tulajdonság szerint a $x\le 12$ $F_n\left(x\right)=0$ és a $x>15$ esetén $F_n\left(x\right)=1$.

$x érték

$x érték

$x érték

Így kapjuk:

5. ábra.

Ábrázoljuk az empirikus eloszlást:

6. ábra.

Eredetiség: $92.12\%$.

Tudja meg, mi az empirikus képlet. A kémiában az EP a legegyszerűbb módja egy vegyület leírásának – lényegében a vegyületet alkotó elemek listája, százalékos arányuk alapján. Meg kell jegyezni, hogy ez az egyszerű képlet nem írja le rendelés atomok egy vegyületben, egyszerűen jelzi, hogy milyen elemekből áll. Például:

  • 40,92% szenet tartalmazó vegyület; 4,58% hidrogén és 54,5% oxigén empirikus képlete lesz C 3 H 4 O 3 (a vegyület EF értékének meghatározására egy példát a második részben tárgyalunk).
  • Értse meg a "százalékos összetétel" kifejezést. A "százalékos összetétel" az egyes atomok százalékos arányát jelenti a teljes szóban forgó vegyületben. Egy vegyület empirikus képletének megtalálásához ismernie kell a vegyület százalékos összetételét. Ha empirikus képletet keres a házi feladathoz, akkor valószínűleg százalékokat ad meg.

    • Egy kémiai vegyület százalékos összetételének meghatározásához a laboratóriumban néhány fizikai kísérletnek, majd kvantitatív elemzésnek vetik alá. Hacsak nem laboratóriumban tartózkodik, nem kell elvégeznie ezeket a kísérleteket.
  • Ne feledje, hogy gramm atomokkal kell megküzdenie. A grammatom egy meghatározott mennyiségű anyag, amelynek tömege megegyezik az atomtömegével. A gramm atom meghatározásához a következő egyenletet kell használni: A vegyületben lévő elem százalékos arányát elosztjuk az elem atomtömegével.

    • Tegyük fel például, hogy van egy vegyületünk, amely 40,92% szenet tartalmaz. A szén atomtömege 12, így az egyenletünk 40,92 / 12 = 3,41 lenne.
  • Tudja, hogyan találja meg az atomarányokat. Ha egy vegyülettel dolgozik, akkor egy grammnál több atomot kap. Miután megtalálta a vegyület összes gramm atomját, nézze meg őket. Az atomarány meghatározásához ki kell választania a számított legkisebb gramm-atom értéket. Ezután fel kell osztania az összes gramm atomot a legkisebb gramm atomra. Például:

    • Tegyük fel, hogy egy három gramm atomot tartalmazó vegyülettel dolgozik: 1,5; 2. és 2.5. Ezen számok közül a legkisebb az 1,5. Ezért az atomok arányának meghatározásához az összes számot el kell osztani 1,5-tel, és egy arányjelet kell közéjük tenni : .
    • 1,5 / 1,5 = 1,2 / 1,5 = 1,33. 2,5 / 1,5 = 1,66. Ezért az atomok aránya az 1: 1,33: 1,66 .
  • Ismerje meg, hogyan alakíthatja át az atomarány értékeket egész számokká. Tapasztalati képlet írásakor egész számokat kell használni. Ez azt jelenti, hogy nem használhat olyan számokat, mint az 1,33. Miután megtalálta az atomok arányát, át kell alakítania a törteket (például 1,33) egész számokká (például 3). Ehhez meg kell találnia egy egész számot, megszorozva az atomarány minden számát, amellyel egész számokat kap. Például:

    • Próbálja meg a 2-t. Szorozzuk meg az atomarányszámokat (1, 1,33 és 1,66) 2-vel. 2, 2,66 és 3,32-t kapunk. Ezek nem egész számok, így a 2 nem megfelelő.
    • Próbáld ki a 3-at. Ha 1-et, 1,33-at és 1,66-ot megszorzol 3-mal, 3-at, 4-et és 5-öt kapsz. Ezért az egész számok atomarányának alakja van 3: 4: 5 .