Funksioni empirik i shpërndarjes. Funksioni empirik i shpërndarjes, vetitë Shembull i funksionit të shpërndarjes empirike

Leksioni 13. Koncepti i vlerësimeve statistikore të variablave të rastësishëm

Le të dihet shpërndarja statistikore e frekuencës së një karakteristike sasiore X Le të shënojmë me numrin e vëzhgimeve në të cilat vlera e karakteristikës është vërejtur të jetë më e vogël se x dhe me n numrin e përgjithshëm të vëzhgimeve. Natyrisht, frekuenca relative e ngjarjes X< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

Funksioni empirik i shpërndarjes(funksioni i shpërndarjes së mostrës) është një funksion që përcakton për secilën vlerë x frekuencën relative të ngjarjes X< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

Në ndryshim nga funksioni empirik i shpërndarjes së një kampioni, quhet funksioni i shpërndarjes së popullsisë funksioni teorik i shpërndarjes. Dallimi midis këtyre funksioneve është se funksioni teorik përcakton probabiliteti Ngjarjet X< x, тогда как эмпирическая – frekuencë relative të njëjtën ngjarje.

Ndërsa n rritet, frekuenca relative e ngjarjes X< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

Vetitë e funksionit të shpërndarjes empirike:

1) Vlerat e funksionit empirik i përkasin segmentit

2) - funksion jo-zvogëlues

3) Nëse është opsioni më i vogël, atëherë = 0 për , nëse është opsioni më i madh, atëherë = 1 për .

Funksioni empirik i shpërndarjes së kampionit shërben për të vlerësuar funksionin teorik të shpërndarjes së popullatës.

Shembull. Le të ndërtojmë një funksion empirik bazuar në shpërndarjen e mostrës:

Opsione
Frekuencat

Le të gjejmë madhësinë e mostrës: 12+18+30=60. Opsioni më i vogël është 2, pra =0 për x £ 2. Vlera e x<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Kështu, funksioni i dëshiruar empirik ka formën:

Vetitë më të rëndësishme të vlerësimeve statistikore

Le të jetë e nevojshme të studiojmë disa karakteristika sasiore të popullsisë së përgjithshme. Le të supozojmë se nga konsideratat teorike ka qenë e mundur të vërtetohet kjo cila saktësisht shpërndarja ka një shenjë dhe është e nevojshme të vlerësohen parametrat me të cilët përcaktohet. Për shembull, nëse karakteristika që studiohet shpërndahet normalisht në popullatë, atëherë është e nevojshme të vlerësohet pritshmëria matematikore dhe devijimi standard; nëse karakteristika ka një shpërndarje Poisson, atëherë është e nevojshme të vlerësohet parametri l.

Në mënyrë tipike, vetëm të dhënat e mostrës janë të disponueshme, për shembull, vlerat e një karakteristike sasiore të marra si rezultat i n vëzhgimeve të pavarura. Duke i konsideruar si variabla të rastësishëm të pavarur mund të themi se të gjesh një vlerësim statistikor të një parametri të panjohur të një shpërndarjeje teorike do të thotë të gjesh një funksion të ndryshoreve të rastësishme të vëzhguara që jep një vlerë të përafërt të parametrit të vlerësuar. Për shembull, për të vlerësuar pritshmërinë matematikore të një shpërndarjeje normale, roli i funksionit luhet nga mesatarja aritmetike



Në mënyrë që vlerësimet statistikore të ofrojnë përafrime të sakta të parametrave të vlerësuar, ato duhet të plotësojnë disa kërkesa, ndër të cilat më të rëndësishmet janë kërkesat i pazhvendosur Dhe aftësia paguese vlerësimet.

Le të jetë një vlerësim statistikor i parametrit të panjohur të shpërndarjes teorike. Le të gjendet vlerësimi nga një kampion i madhësisë n. Le të përsërisim eksperimentin, d.m.th. le të nxjerrim një kampion tjetër me të njëjtën madhësi nga popullata e përgjithshme dhe, bazuar në të dhënat e tij, të marrim një vlerësim të ndryshëm. Duke e përsëritur eksperimentin shumë herë, marrim numra të ndryshëm. Rezultati mund të konsiderohet si një ndryshore e rastësishme, dhe numrat si vlerat e tij të mundshme.

Nëse vlerësimi jep një vlerë të përafërt me bollëk, d.m.th. çdo numër është më i madh se vlera e vërtetë, dhe si pasojë, pritshmëria matematikore (vlera mesatare) e ndryshores së rastit është më e madhe se:. Po kështu, nëse jep një vlerësim me një disavantazh, Kjo .

Kështu, përdorimi i një vlerësimi statistikor, pritshmëria matematikore e të cilit nuk është e barabartë me parametrin e vlerësuar, do të çonte në gabime sistematike (të së njëjtës shenjë). Nëse, përkundrazi, atëherë kjo garanton kundër gabimeve sistematike.

I paanshëm quhet një vlerësim statistikor, pritshmëria matematikore e të cilit është e barabartë me parametrin e vlerësuar për çdo madhësi kampioni.

I zhvendosur quhet një vlerësim që nuk e plotëson këtë kusht.

Paanshmëria e vlerësimit nuk garanton ende një përafrim të mirë për parametrin e vlerësuar, pasi vlerat e mundshme mund të jenë shumë të shpërndara rreth vlerës mesatare të saj, d.m.th. varianca mund të jetë domethënëse. Në këtë rast, vlerësimi i gjetur nga të dhënat e një kampioni, për shembull, mund të rezultojë të jetë dukshëm i largët nga vlera mesatare, dhe për rrjedhojë nga parametri që vlerësohet.

Efektive është një vlerësim statistikor që, për një madhësi të caktuar kampioni n, ka varianca më e vogël e mundshme .

Kur merren parasysh mostra të mëdha, kërkohen vlerësime statistikore aftësia paguese .

I pasur quhet një vlerësim statistikor, i cili, pasi n®¥ tenton në probabilitet te parametri i vlerësuar. Për shembull, nëse varianca e një vlerësimi të paanshëm tenton në zero si n®¥, atëherë një vlerësim i tillë rezulton të jetë konsistent.

Siç dihet, ligji i shpërndarjes së një ndryshoreje të rastësishme mund të specifikohet në mënyra të ndryshme. Një ndryshore e rastësishme diskrete mund të specifikohet duke përdorur një seri shpërndarjeje ose një funksion integral, dhe një ndryshore e rastësishme e vazhdueshme mund të specifikohet duke përdorur një funksion integral ose diferencial. Le të shqyrtojmë analoge selektive të këtyre dy funksioneve.

Le të ketë një grup mostër vlerash të disa ndryshoreve të rastësishme të vëllimit dhe çdo opsion nga ky grup lidhet me frekuencën e tij. Le të më tej është një numër real, dhe – numri i vlerave të mostrës së ndryshores së rastësishme
, më i vogël .Pastaj numri është frekuenca e vlerave sasiore të vëzhguara në mostër X, më i vogël , ato. shpeshtësia e shfaqjes së ngjarjes
. Kur ndryshon x në rastin e përgjithshëm, vlera gjithashtu do të ndryshojë . Kjo do të thotë se frekuenca relative është funksion i argumentit . Dhe meqenëse ky funksion gjendet nga të dhënat e mostrës të marra si rezultat i eksperimenteve, ai quhet selektiv ose empirike.

Përkufizimi 10.15. Funksioni empirik i shpërndarjes(funksioni i shpërndarjes së mostrës) është funksioni
, duke përcaktuar për secilën vlerë x Frekuenca relative e ngjarjes
.

(10.19)

Në ndryshim nga funksioni empirik i shpërndarjes së mostrave, funksioni i shpërndarjes F(x) të popullatës së përgjithshme quhet funksioni teorik i shpërndarjes. Dallimi midis tyre është se funksioni teorik F(x) përcakton probabilitetin e një ngjarjeje
, dhe ajo empirike është frekuenca relative e së njëjtës ngjarje. Nga teorema e Bernulit rrjedh

,
(10.20)

ato. në liri probabiliteti
dhe shpeshtësinë relative të ngjarjes
, d.m.th.
ndryshojnë pak nga njëra-tjetra. Nga kjo rrjedh se është e këshillueshme që të përdoret funksioni empirik i shpërndarjes së kampionit për të përafruar funksionin teorik (integral) të shpërndarjes së popullatës së përgjithshme.

Funksioni
Dhe
kanë të njëjtat veti. Kjo rrjedh nga përkufizimi i funksionit.

Vetitë
:


Shembulli 10.4. Ndërtoni një funksion empirik bazuar në shpërndarjen e mostrës së dhënë:

Opsione

Frekuencat

Zgjidhja: Le të gjejmë madhësinë e mostrës n= 12+18+30=60. Opsioni më i vogël
, prandaj,

. Kuptimi
, domethënë
vëzhguar 12 herë, pra:

=

.

Kuptimi x< 10, domethënë
Dhe
janë vërejtur 12+18=30 herë, pra,
=

. Në

.

Funksioni i kërkuar i shpërndarjes empirike:

=

Orari
treguar në Fig. 10.2

R
është. 10.2

Pyetje kontrolli

1. Cilat probleme kryesore zgjidh statistika matematikore? 2. Popullata e përgjithshme dhe e mostrës? 3. Përcaktoni madhësinë e mostrës. 4. Cilat mostra quhen përfaqësuese? 5. Gabimet e përfaqësimit. 6. Metodat bazë të kampionimit. 7. Konceptet e frekuencës, frekuencës relative. 8. Koncepti i serive statistikore. 9. Shkruani formulën e Sturges. 10. Formuloni konceptet e gamës së mostrës, medianës dhe modalitetit. 11. Shumëkëndëshi i frekuencës, histogrami. 12. Koncepti i një vlerësimi pikësor të një popullate të mostrës. 13. Vlerësimi i pikëve i njëanshëm dhe i paanshëm. 14. Formuloni konceptin e mesatares së mostrës. 15. Formuloni konceptin e variancës së mostrës. 16. Formuloni konceptin e devijimit standard të mostrës. 17. Formuloni konceptin e koeficientit të variacionit të mostrës. 18. Formuloni konceptin e mesatares gjeometrike të mostrës.

Seritë e variacioneve. Shumëkëndëshi dhe histogrami.

Gama e shpërndarjes- përfaqëson një shpërndarje të renditur të njësive të popullsisë që studiohen në grupe sipas një karakteristike të caktuar të ndryshueshme.

Në varësi të karakteristikës që qëndron në themel të formimit të serisë së shpërndarjes, ato dallohen atributive dhe variacionale rreshtat e shpërndarjes:

§ Seritë e shpërndarjes të ndërtuara në rend rritës ose zbritës të vlerave të një karakteristike sasiore quhen variacionale.

Seria e variacionit të shpërndarjes përbëhet nga dy kolona:

Kolona e parë jep vlerat sasiore të karakteristikës së ndryshme, të cilat quhen opsione dhe janë caktuar. Opsioni diskret - i shprehur si një numër i plotë. Opsioni i intervalit varion nga dhe në. Në varësi të llojit të opsioneve, mund të ndërtoni një seri variacionesh diskrete ose intervale.
Kolona e dytë përmban numri i opsioneve specifike, e shprehur në terma të frekuencave ose frekuencave:

Frekuencat- këta janë numra absolutë, që tregojnë numrin e herëve që një vlerë e caktuar e një karakteristike ndodh në agregat, të cilët tregojnë. Shuma e të gjitha frekuencave duhet të jetë e barabartë me numrin e njësive në të gjithë popullsinë.

Frekuencat() janë frekuenca të shprehura si përqindje e totalit. Shuma e të gjitha frekuencave e shprehur në përqindje duhet të jetë e barabartë me 100% në fraksione të një.

Paraqitja grafike e serive të shpërndarjes

Seritë e shpërndarjes janë paraqitur vizualisht duke përdorur imazhe grafike.

Seritë e shpërndarjes përshkruhen si:

§ Shumëkëndëshi

§ Histogramet

§ Kumulon

Shumëkëndëshi

Kur ndërtohet një poligon, vlerat e karakteristikës së ndryshme vizatohen në boshtin horizontal (boshti x), dhe frekuencat ose frekuencat vizatohen në boshtin vertikal (boshti y).

1. Shumëkëndëshi në Fig. 6.1 bazohet në të dhënat nga mikroregjistrimi i popullsisë së Rusisë në 1994.


grafik me shtylla



Për të ndërtuar një histogram, vlerat e kufijve të intervaleve tregohen përgjatë boshtit të abshisës dhe, në bazë të tyre, ndërtohen drejtkëndësha, lartësia e të cilave është në përpjesëtim me frekuencat (ose frekuencat).

Në Fig. 6.2. tregon një histogram të shpërndarjes së popullsisë ruse në 1997 sipas grupmoshës.

Fig.1. Shpërndarja e popullsisë ruse sipas grupmoshave

Funksioni empirik i shpërndarjes, vetitë.

Le të dihet shpërndarja statistikore e frekuencës së një karakteristike sasiore X Le të shënojmë me numrin e vëzhgimeve në të cilat vlera e karakteristikës është vërejtur të jetë më e vogël se x dhe me n numrin e përgjithshëm të vëzhgimeve. Natyrisht, frekuenca relative e ngjarjes X

Një funksion i shpërndarjes empirike (funksioni i shpërndarjes së mostrës) është një funksion që përcakton për secilën vlerë x frekuencën relative të ngjarjes X

Në ndryshim nga funksioni empirik i shpërndarjes së një kampioni, funksioni i shpërndarjes së popullsisë quhet funksioni teorik i shpërndarjes. Dallimi midis këtyre funksioneve është se funksioni teorik përcakton probabilitetin e ngjarjes X

Ndërsa n rritet, frekuenca relative e ngjarjes X

Vetitë themelore

Le të rregullohet një rezultat elementar. Pastaj është funksioni i shpërndarjes së shpërndarjes diskrete i dhënë nga funksioni i mëposhtëm i probabilitetit:

ku, dhe - numri i elementeve të mostrës është i barabartë me . Në veçanti, nëse të gjithë elementët e mostrës janë të ndryshëm, atëherë .

Pritshmëria matematikore e kësaj shpërndarjeje është:

.

Kështu, mesatarja e kampionit është mesatarja teorike e shpërndarjes së mostrës.

Në mënyrë të ngjashme, varianca e mostrës është varianca teorike e një shpërndarjeje kampionimi.

Ndryshorja e rastësishme ka një shpërndarje binomiale:

Funksioni i shpërndarjes së mostrës është një vlerësim i paanshëm i funksionit të shpërndarjes:

.

Varianca e funksionit të shpërndarjes së mostrës ka formën:

.

Sipas ligjit të fortë të numrave të mëdhenj, funksioni i shpërndarjes së mostrës konvergon pothuajse me siguri me funksionin teorik të shpërndarjes:

pothuajse me siguri në .

Funksioni i shpërndarjes së kampionit është një vlerësim asimptotikisht normal i funksionit teorik të shpërndarjes. Nese atehere

Sipas shpërndarjes në.

Përcaktimi i funksionit të shpërndarjes empirike

Le të jetë $X$ një ndryshore e rastësishme. $F(x)$ është funksioni i shpërndarjes së një ndryshoreje të caktuar të rastësishme. Ne do të kryejmë $n$ eksperimente në një ndryshore të rastësishme të caktuar në të njëjtat kushte, të pavarura nga njëra-tjetra. Në këtë rast, marrim një sekuencë vlerash $x_1,\ x_2\ $, ... ,$\ x_n$, e cila quhet mostër.

Përkufizimi 1

Çdo vlerë $x_i$ ($i=1,2\ $, ... ,$ \ n$) quhet variant.

Një vlerësim i funksionit të shpërndarjes teorike është funksioni i shpërndarjes empirike.

Përkufizimi 3

Një funksion empirik i shpërndarjes $F_n(x)$ është një funksion që përcakton për secilën vlerë $x$ frekuencën relative të ngjarjes $X \

ku $n_x$ është numri i opsioneve më pak se $x$, $n$ është madhësia e mostrës.

Dallimi midis funksionit empirik dhe atij teorik është se funksioni teorik përcakton probabilitetin e ngjarjes $X

Vetitë e funksionit të shpërndarjes empirike

Le të shqyrtojmë tani disa veti themelore të funksionit të shpërndarjes.

    Gama e funksionit $F_n\left(x\right)$ është segmenti $$.

    $F_n\left(x\right)$ është një funksion që nuk zvogëlohet.

    $F_n\left(x\right)$ është një funksion majtas i vazhdueshëm.

    $F_n\left(x\right)$ është një funksion konstant pjesë-pjesë dhe rritet vetëm në pikat e vlerave të ndryshores së rastësishme $X$

    Le të jetë $X_1$ opsioni më i vogël dhe $X_n$ opsioni më i madh. Pastaj $F_n\left(x\right)=0$ për $(x\le X)_1$ dhe $F_n\left(x\right)=1$ për $x\ge X_n$.

Le të prezantojmë një teoremë që lidh funksionet teorike dhe empirike.

Teorema 1

Le të jetë $F_n\left(x\right)$ funksioni empirik i shpërndarjes dhe $F\left(x\right)$ funksioni teorik i shpërndarjes së kampionit të përgjithshëm. Atëherë barazia vlen:

\[(\mathop(lim)_(n\në \infty ) (|F)_n\left(x\djathtas)-F\left(x\djathtas)|=0\ )\]

Shembuj të problemeve për gjetjen e funksionit të shpërndarjes empirike

Shembulli 1

Lëreni që shpërndarja e kampionimit të ketë të dhënat e mëposhtme të regjistruara duke përdorur një tabelë:

Foto 1.

Gjeni madhësinë e kampionit, krijoni një funksion shpërndarjeje empirike dhe vizatoni atë.

Madhësia e kampionit: $n=5+10+15+20=50$.

Nga vetia 5, kemi atë për $x\le 1$ $F_n\left(x\right)=0$, dhe për $x>4$ $F_n\left(x\right)=1$.

vlerë x $

vlerë x $

vlerë x $

Kështu marrim:

Figura 2.

Figura 3.

Shembulli 2

20 qytete u zgjodhën rastësisht nga qytetet e pjesës qendrore të Rusisë, për të cilat u morën të dhënat e mëposhtme për tarifat e transportit publik: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13, 13, 12, 12, 15, 14, 14.

Krijoni një funksion shpërndarjeje empirike për këtë mostër dhe vizatoni atë.

Le të shkruajmë vlerat e mostrës në rend rritës dhe të llogarisim frekuencën e secilës vlerë. Ne marrim tabelën e mëposhtme:

Figura 4.

Madhësia e mostrës: $n=20$.

Nga vetia 5, kemi atë për $x\le 12$ $F_n\left(x\right)=0$, dhe për $x>15$ $F_n\left(x\right)=1$.

vlerë x $

vlerë x $

vlerë x $

Kështu marrim:

Figura 5.

Le të përshkruajmë shpërndarjen empirike:

Figura 6.

Origjinaliteti: $92,12\%$.

Zbuloni se cila është formula empirike. Në kimi, EP është mënyra më e thjeshtë për të përshkruar një përbërje - në thelb një listë e elementeve që përbëjnë një përbërje, bazuar në përqindjet e tyre. Duhet të theksohet se kjo formulë e thjeshtë nuk përshkruan urdhëroj atomet në një përbërje, ai thjesht tregon se nga cilat elementë përbëhet. Për shembull:

  • Një përbërje e përbërë nga 40,92% karbon; 4,58% hidrogjen dhe 54,5% oksigjen do të kenë formulën empirike C 3 H 4 O 3 (një shembull se si të gjendet EF e këtij përbërësi do të diskutohet në pjesën e dytë).
  • Kuptoni termin "përbërja e përqindjes"."Përbërja në përqindje" i referohet përqindjes së secilit atom individual në të gjithë përbërjen në fjalë. Për të gjetur formulën empirike të një përbërjeje, duhet të dini përbërjen në përqindje të përbërjes. Nëse po kërkoni një formulë empirike për detyrat e shtëpisë, atëherë me shumë mundësi do të jepen përqindjet.

    • Për të gjetur përbërjen në përqindje të një përbërjeje kimike në laborator, ai i nënshtrohet disa eksperimenteve fizike dhe më pas analizave sasiore. Nëse nuk jeni në laborator, nuk keni nevojë t'i bëni këto eksperimente.
  • Mbani në mend se do të duhet të merreni me atomet gram. Një atom gram është një sasi specifike e një lënde, masa e së cilës është e barabartë me masën e saj atomike. Për të gjetur atomin e gramit, duhet të përdorni ekuacionin e mëposhtëm: Përqindja e një elementi në një përbërje ndahet me masën atomike të elementit.

    • Le të themi, për shembull, se kemi një përbërje që përmban 40.92% karbon. Masa atomike e karbonit është 12, kështu që ekuacioni ynë do të ishte 40.92 / 12 = 3.41.
  • Të dinë si të gjejnë raportet atomike. Kur punoni me një përbërje, do të përfundoni me më shumë se një atom gram. Pasi të keni gjetur të gjithë atomet gram të përbërjes suaj, shikoni ato. Për të gjetur raportin atomik, do t'ju duhet të zgjidhni vlerën më të vogël gram-atom që keni llogaritur. Atëherë do t'ju duhet të ndani të gjitha atomet e gramit në atomin më të vogël të gramit. Për shembull:

    • Le të themi se po punoni me një përbërje që përmban tre atome gram: 1.5; 2 dhe 2.5. Më i vogli nga këta numra është 1.5. Prandaj, për të gjetur raportin e atomeve, duhet të ndani të gjithë numrat me 1.5 dhe të vendosni një shenjë raporti midis tyre. : .
    • 1,5 / 1,5 = 1. 2 / 1,5 = 1,33. 2,5 / 1,5 = 1,66. Prandaj, raporti i atomeve është 1: 1,33: 1,66 .
  • Kuptoni se si të konvertoni vlerat e raportit atomik në numra të plotë. Kur shkruani një formulë empirike, duhet të përdorni numra të plotë. Kjo do të thotë që nuk mund të përdorni numra si 1.33. Pasi të gjeni raportin e atomeve, duhet të konvertoni thyesat (si 1.33) në numra të plotë (si 3). Për ta bërë këtë, ju duhet të gjeni një numër të plotë, duke shumëzuar çdo numër të raportit atomik me të cilin do të merrni numra të plotë. Për shembull:

    • Provoni 2. Shumëzoni numrat e raportit atomik (1, 1.33 dhe 1.66) me 2. Ju merrni 2, 2.66 dhe 3.32. Këta nuk janë numra të plotë, kështu që 2 nuk është i përshtatshëm.
    • Provoni 3. Nëse shumëzoni 1, 1.33 dhe 1.66 me 3, merrni respektivisht 3, 4 dhe 5. Prandaj, raporti atomik i numrave të plotë ka formën 3: 4: 5 .