Sastavite funkciju distribucije slučajne varijable. Funkcija distribucije vjerojatnosti slučajne varijable i njezina svojstva

  • 6. Zbroj događaja i njegova svojstva. Primjeri.
  • 7. Teorem zbrajanja vjerojatnosti (s dokazom) i njegove posljedice. Primjeri. 8 Proizvodnja događaja i njezina svojstva.
  • 9. Uvjetna vjerojatnost. Zavisni i nezavisni događaji. Teorem množenja vjerojatnosti (s dokazom). Primjeri
  • 11. Slučajna varijabla (definicija). Diskretna slučajna varijabla i njezin zakon (niz) distribucije. Glavno svojstvo zakona raspodjele. Primjeri.
  • Određivanje neovisnosti slučajnih varijabli.
  • 13.* Matematičke operacije nad diskretnim slučajnim varijablama. Primjeri.
  • 14. Funkcija distribucije slučajne varijable, njezina definicija, svojstva i graf. Primjeri.
  • 15. Funkcija distribucije diskretne slučajne varijable. Primjeri.
  • 16. Teorem o postojanju slučajne varijable sa zadanom funkcijom razdiobe. Kontinuirana slučajna varijabla. Vjerojatnost jedne vrijednosti kontinuirane slučajne varijable. Primjeri.
  • 18. Matematičko očekivanje slučajne varijable i njezina svojstva. Primjeri
  • Svojstva matematičkog očekivanja
  • Dokaz:
  • 19. Disperzija slučajne varijable i njezina svojstva. Standardna devijacija slučajne varijable. Primjeri.
  • 1. Diskretna slučajna varijabla, zakon i funkcija distribucije
  • 2. Numeričke karakteristike diskretnih slučajnih varijabli
  • 20. Bernoullijev zakon raspodjele, njegova definicija, svojstva i primjeri.
  • 21. Binomni zakon distribucije, njegova definicija, svojstva i primjeri.
  • 22.Poissonov zakon distribucije, njegova definicija, svojstva i primjeri.
  • 25. Normalni (Gaussov) zakon raspodjele.
  • 26. Standardni normalni zakon raspodjele. Gaussova funkcija, njezina svojstva i graf. Teorem o povezanosti gustoće zakona normalne distribucije i Gaussove funkcije.
  • 27. Laplaceova funkcija, njena svojstva, graf i geometrijsko značenje. Teorem o povezanosti funkcije normalnog zakona distribucije i Laplaceove funkcije. Primjeri.
  • 28.* Svojstva slučajne varijable raspodijeljene prema normalnom zakonu. Pravilo tri sigme. Primjeri.
  • 29.* Eksponencijalni zakon raspodjele, njegova definicija, svojstva i primjeri.
  • 34. Čebiševljeva lema. Primjeri
  • 35. Čebiševljeva nejednakost. Primjeri
  • 36. Pojam dvodimenzionalne (n-dimenzionalne) slučajne varijable. Primjeri. Jednodimenzionalne raspodjele njegovih komponenti. Uvjetne raspodjele.
  • 37. Kovarijanca i koeficijent korelacije slučajnih varijabli. Povezanost nekorelacije i neovisnosti slučajnih varijabli
  • 14. Funkcija distribucije slučajne varijable, njezina definicija, svojstva i graf. Primjeri.

    Numerička vrijednost koja poprima određenu vrijednost kao rezultat nasumično provedenog testa naziva se slučajna varijabla.

    Ako je x diskretna slučajna varijabla koja ima vrijednosti x1< x2 < … < xi < … с вероятностями p1 < p2 < … < pi < …, то таблица вида

    x ja

    str ja

    nazvao .

    Svojstva funkcije distribucije.

    Dokaz: Ova tvrdnja proizlazi iz činjenice da je funkcija distribucije vjerojatnost, a kao što je poznato.

    2. Funkcija raspodjele slučajne varijable je neopadajuća funkcija na cijeloj numeričkoj osi.

    Dokaz: Neka je x 1 (3)

    Budući da je P(x 1 X

    4 . P(x 1 X (4)

    Dokaz: to izravno proizlazi iz formule (3).

    Primjer: Nađite vjerojatnost da će slučajna varijabla X poprimiti vrijednost u intervalu ".

    Mješovite funkcije distribucije pojavljuju se, posebice, kada promatranje prestane u nekoj točki. Na primjer, pri analizi statističkih podataka dobivenih korištenjem planova ispitivanja pouzdanosti koji predviđaju prekid testiranja nakon određenog razdoblja. Ili pri analizi podataka o tehničkim proizvodima koji su zahtijevali popravke u jamstvenom roku.

    Primjer 3. Neka je, na primjer, životni vijek električne žarulje slučajna varijabla s funkcijom raspodjele F(t), i ispitivanje se provodi dok žarulja ne prestane, ako se to dogodi za manje od 100 sati od početka ispitivanja, ili dok t 0= 100 sati. Neka G(t)– funkcija raspodjele vremena rada žarulje u dobrom stanju tijekom ovog ispitivanja. Zatim

    Funkcija G(t) ima skok u točki t 0, budući da odgovarajuća slučajna varijabla uzima vrijednost t 0 s vjerojatnošću 1- F(t 0)> 0.

    Obilježja slučajnih varijabli. U probabilističko-statističkim metodama odlučivanja koristi se niz karakteristika slučajnih varijabli izraženih kroz funkcije distribucije i gustoće vjerojatnosti.

    Kada se opisuje diferencijacija dohotka, kada se pronalaze granice pouzdanosti za parametre distribucije slučajnih varijabli, iu mnogim drugim slučajevima, koristi se koncept kao što je "kvantil reda". R", gdje je 0< str < 1 (обозначается x str). Kvantil reda R– vrijednost slučajne varijable za koju vrijednost uzima funkcija distribucije R ili postoji "skok" s vrijednosti manje R na veću vrijednost R(slika 2). Može se dogoditi da je ovaj uvjet zadovoljen za sve vrijednosti x koje pripadaju ovom intervalu (tj. funkcija raspodjele je konstantna na ovom intervalu i jednaka je R). Tada se svaka takva vrijednost naziva "kvantil reda" R" Za kontinuirane funkcije distribucije u pravilu postoji jedan kvantil x str narudžba R(Slika 2), i

    F(x p) = p. (2)

    sl.2. Definicija kvantila x str narudžba R.

    Primjer 4. Nađimo kvantil x str narudžba R za distribucijsku funkciju F(x) iz (1).

    U 0< str < 1 квантиль x str nalazi se iz jednadžbe

    oni. x str = a + p(b – a) = a( 1- p) +bp. Na str= 0 bilo koji x < a je kvantil reda str= 0. Kvantil reda str= 1 je bilo koji broj x > b.

    Za diskretne raspodjele u pravilu nema x str, zadovoljavajući jednadžbu (2). Točnije, ako je raspodjela slučajne varijable dana u tablici 1. gdje x 1< x 2 < … < x k , zatim jednakost (2), promatrana kao jednadžba s obzirom na x str, ima rješenja samo za k vrijednosti str, naime,

    p = p 1 ,

    p = p 1 + p 2 ,

    p = p 1 + p 2 + p 3 ,

    p = p 1 + p 2 + …+ p m, 3 < m < k,

    str = str 1 + str 2 + … + p k.

    Stol 1.

    Distribucija diskretne slučajne varijable

    Za navedene k vrijednosti vjerojatnosti str riješenje x str jednadžba (2) nije jedinstvena, naime,

    F(x) = p 1 + p 2 + … + p m

    za sve x takav da x m< x < x m+1. Oni. x p – bilo koji broj iz intervala (x m; x m+1]. Za sve ostale R iz intervala (0;1), koji nije uključen u popis (3), dolazi do "skoka" s vrijednosti manje R na veću vrijednost R. Naime, ako

    p 1 + p 2 + … + p m

    Da x p = x m+1.

    Razmotreno svojstvo diskretnih distribucija stvara značajne poteškoće pri tabeliranju i korištenju takvih distribucija, budući da je nemoguće točno održavati tipične numeričke vrijednosti karakteristika distribucije. Ovo posebno vrijedi za kritične vrijednosti i razine značajnosti neparametarskih statističkih testova (vidi dolje), budući da su distribucije statistike ovih testova diskretne.

    Redoslijed kvantila je od velike važnosti u statistici R= ½. Zove se medijan (slučajna varijabla x odnosno njegove distribucijske funkcije F(x)) i naznačen je Ja (X). U geometriji postoji koncept "medijana" - ravna crta koja prolazi kroz vrh trokuta i dijeli njegovu suprotnu stranu na pola. U matematičkoj statistici medijan ne dijeli stranicu trokuta na pola, već distribuciju slučajne varijable: jednakost F(x 0,5)= 0,5 znači da je vjerojatnost skretanja ulijevo x 0,5 i vjerojatnost da dođete udesno x 0,5(ili izravno na x 0,5) međusobno su jednaki i jednaki ½, tj.

    P(x < x 0,5) = P(x > x 0,5) = ½.

    Medijan označava "središte" distribucije. Sa stajališta jednog od modernih koncepata - teorije stabilnih statističkih postupaka - medijan je bolja karakteristika slučajne varijable od matematičkog očekivanja. Kod obrade rezultata mjerenja na ordinalnoj ljestvici (vidi poglavlje o teoriji mjerenja) može se koristiti medijan, ali ne i matematičko očekivanje.

    Karakteristika slučajne varijable kao što je mod ima jasno značenje - vrijednost (ili vrijednosti) slučajne varijable koja odgovara lokalnom maksimumu gustoće vjerojatnosti za kontinuiranu slučajnu varijablu ili lokalnom maksimumu vjerojatnosti za diskretnu slučajnu varijablu .

    Ako x 0– način slučajne varijable s gustoćom f(x), tada, kao što je poznato iz diferencijalnog računa, .

    Slučajna varijabla može imati mnogo načina. Dakle, za jednoliku raspodjelu (1) svaka točka x takav da a< x < b , je moda. Međutim, ovo je iznimka. Većina slučajnih varijabli koje se koriste u probabilističkim statističkim metodama odlučivanja i drugim primijenjenim istraživanjima imaju jedan način. Slučajne varijable, gustoće, distribucije koje imaju jedan mod nazivaju se unimodalne.

    O matematičkom očekivanju za diskretne slučajne varijable s konačnim brojem vrijednosti raspravlja se u poglavlju “Događaji i vjerojatnosti”. Za kontinuiranu slučajnu varijablu x očekivana vrijednost M(X) zadovoljava jednakost

    koja je analogna formuli (5) iz izjave 2 poglavlja “Događaji i vjerojatnosti”.

    Primjer 5. Očekivanje za jednoliko raspodijeljenu slučajnu varijablu x jednaki

    Za slučajne varijable koje se razmatraju u ovom poglavlju, sva ona svojstva matematičkih očekivanja i varijanci koja su ranije razmatrana za diskretne slučajne varijable s konačnim brojem vrijednosti su istinita. Međutim, ne dajemo dokaze o tim svojstvima, jer zahtijevaju produbljivanje u matematičke suptilnosti, što nije potrebno za razumijevanje i kvalificiranu primjenu probabilističko-statističkih metoda odlučivanja.

    Komentar. Ovaj udžbenik namjerno izbjegava matematičke suptilnosti povezane, posebice, s konceptima mjerljivih skupova i mjerljivih funkcija, algebre događaja itd. Oni koji žele svladati ove pojmove trebali bi se obratiti specijaliziranoj literaturi, posebice enciklopediji.

    Svaka od tri karakteristike - matematičko očekivanje, medijan, način - opisuje "središte" distribucije vjerojatnosti. Pojam "centra" može se definirati na različite načine - otud tri različite karakteristike. Međutim, za važnu klasu distribucija - simetrične unimodalne - sve tri karakteristike se podudaraju.

    Gustoća distribucije f(x)– gustoća simetrične distribucije, ako postoji broj x 0 takav da

    . (3)

    Jednakost (3) znači da graf funkcije y = f(x) simetrična u odnosu na okomitu crtu koja prolazi središtem simetrije x = x 0 . Iz (3) slijedi da funkcija simetrične distribucije zadovoljava relaciju

    (4)

    Za simetričnu distribuciju s jednim modom, matematičko očekivanje, medijan i mod podudaraju se i jednaki su x 0.

    Najvažniji slučaj je simetrija oko 0, tj. x 0= 0. Tada (3) i (4) postaju jednakosti

    (6)

    odnosno. Gornje relacije pokazuju da nema potrebe tabelarizirati simetrične distribucije za sve x, dovoljno je imati stolove x > x 0.

    Napomenimo još jedno svojstvo simetričnih distribucija, koje se stalno koristi u probabilističko-statističkim metodama odlučivanja i drugim primijenjenim istraživanjima. Za kontinuiranu funkciju raspodjele

    P(|X| < a) = P(-a < x < a) = F(a) – F(-a),

    Gdje F– funkcija distribucije slučajne varijable x. Ako funkcija distribucije F je simetričan oko 0, tj. onda za njega vrijedi formula (6).

    P(|X| < a) = 2F(a) – 1.

    Često se koristi i druga formulacija dotične tvrdnje: ako

    .

    Ako su i kvantili reda, odnosno (vidi (2)) funkcije distribucije simetrične oko 0, tada iz (6) slijedi da

    Od karakteristika pozicije – matematičko očekivanje, medijan, mod – prijeđimo na karakteristike širenja slučajne varijable x: varijanca, standardna devijacija i koeficijent varijacije v. O definiciji i svojstvima disperzije za diskretne slučajne varijable raspravljalo se u prethodnom poglavlju. Za kontinuirane slučajne varijable

    Standardna devijacija je nenegativna vrijednost kvadratnog korijena varijance:

    Koeficijent varijacije je omjer standardne devijacije i matematičkog očekivanja:

    Koeficijent varijacije se primjenjuje kada M(X)> 0. Mjeri širenje u relativnim jedinicama, dok je standardna devijacija u apsolutnim jedinicama.

    Primjer 6. Za jednoliko raspodijeljenu slučajnu varijablu x Nađimo disperziju, standardnu ​​devijaciju i koeficijent varijacije. Varijanca je:

    Promjena varijable omogućuje pisanje:

    Gdje c = (ba)/ 2. Prema tome, standardna devijacija je jednaka a koeficijent varijacije je:

    Za svaku slučajnu varijablu x odrediti još tri veličine – centrirano Y, normalizirano V i dano U. Centrirana slučajna varijabla Y je razlika između date slučajne varijable x i njegovo matematičko očekivanje M(X), oni. Y = X – M(X). Očekivanje centrirane slučajne varijable Y jednaka je 0, a varijanca je varijanca dane slučajne varijable: M(Y) = 0, D(Y) = D(x). Funkcija distribucije F Y(x) centrirana slučajna varijabla Y vezane uz funkciju distribucije F(x) originalna slučajna varijabla x omjer:

    F Y(x) = F(x + M(x)).

    Gustoće ovih slučajnih varijabli zadovoljavaju jednakost

    f Y(x) = f(x + M(x)).

    Normalizirana slučajna varijabla V je omjer zadane slučajne varijable x svojoj standardnoj devijaciji, tj. . Očekivanje i varijanca normalizirane slučajne varijable V izražen kroz karakteristike x Tako:

    ,

    Gdje v– koeficijent varijacije izvorne slučajne varijable x. Za distribucijsku funkciju F V(x) i gustoća f V(x) normalizirana slučajna varijabla V imamo:

    Gdje F(x) – funkcija distribucije izvorne slučajne varijable x, A f(x) – njegovu gustoću vjerojatnosti.

    Smanjena slučajna varijabla U je centrirana i normalizirana slučajna varijabla:

    .

    Za zadanu slučajnu varijablu

    Normalizirane, centrirane i reducirane slučajne varijable stalno se koriste kako u teorijskim studijama tako iu algoritmima, programskim proizvodima, regulatornoj, tehničkoj i instruktivnoj dokumentaciji. Konkretno, jer jednakosti omogućuju pojednostavljenje obrazloženja metoda, formulacije teorema i formula za izračun.

    Koriste se transformacije slučajnih varijabli i one općenitije. Dakle, ako Y = sjekira + b, Gdje a I b– onda neke brojke

    Primjer 7. Ako tada Y je reducirana slučajna varijabla, a formule (8) pretvaraju se u formule (7).

    Uz svaku slučajnu varijablu x možete pridružiti mnoge slučajne varijable Y, dano formulom Y = sjekira + b na različitim a> 0 i b. Ovaj skup se zove obitelj pomaka na ljestvici, koju generira slučajna varijabla x. Funkcije raspodjele F Y(x) čine familiju distribucija s pomakom na skali koju generira funkcija distribucije F(x). Umjesto Y = sjekira + bčesto koriste snimanje

    Broj S naziva se parametar posmaka, a broj d- parametar mjerila. Formula (9) to pokazuje x– rezultat mjerenja određene veličine – ulazi u U– rezultat mjerenja iste veličine ako se početak mjerenja pomakne na točku S, a zatim upotrijebite novu mjernu jedinicu, in d puta veći od starog.

    Za obitelj pomaka na skali (9), distribucija X naziva se standardna. U probabilističkim statističkim metodama odlučivanja i drugim primijenjenim istraživanjima koriste se standardna normalna distribucija, standardna Weibull-Gnedenko distribucija, standardna gama distribucija itd. (vidi dolje).

    Također se koriste i druge transformacije slučajnih varijabli. Na primjer, za pozitivnu slučajnu varijablu x razmatraju Y= log x, gdje je lg x– decimalni logaritam broja x. Lanac jednakosti

    F Y (x) = P( lg x< x) = P(X < 10x) = F( 10x)

    povezuje distribucijske funkcije x I Y.

    Pri obradi podataka koriste se sljedeće karakteristike slučajne varijable x kao momenti reda q, tj. matematička očekivanja slučajne varijable Xq, q= 1, 2, ... Dakle, samo matematičko očekivanje je trenutak reda 1. Za diskretnu slučajnu varijablu, trenutak reda q može se izračunati kao

    Za kontinuiranu slučajnu varijablu

    Trenuci reda q također se nazivaju početni trenuci reda q, za razliku od srodnih karakteristika – središnji momenti reda q, zadan formulom

    Dakle, disperzija je središnji moment reda 2.

    Normalna distribucija i središnji granični teorem. U probabilističko-statističkim metodama odlučivanja često se govori o normalnoj raspodjeli. Ponekad ga pokušavaju upotrijebiti za modeliranje distribucije početnih podataka (ti pokušaji nisu uvijek opravdani - vidi dolje). Što je još važnije, mnoge metode obrade podataka temelje se na činjenici da izračunate vrijednosti imaju raspodjele bliske normalnim.

    Neka x 1 , x 2 ,…, Xn M(X i) = m i odstupanja D(X i) = , ja = 1, 2,…, n,... Kao što slijedi iz rezultata prethodnog poglavlja,

    Razmotrimo smanjenu slučajnu varijablu U n za iznos , naime,

    Kao što slijedi iz formula (7), M(U n) = 0, D(U n) = 1.

    (za identično raspoređene pojmove). Neka x 1 , x 2 ,…, Xn, … – neovisne identično distribuirane slučajne varijable s matematičkim očekivanjima M(X i) = m i odstupanja D(X i) = , ja = 1, 2,…, n,... Tada za svaki x postoji granica

    Gdje F(x)– funkcija standardne normalne distribucije.

    Više o značajci F(x) – ispod (čitaj "fi od x", jer F- grčko veliko slovo "phi").

    Centralni granični teorem (CLT) dobio je svoje ime jer je središnji, najčešće korišteni matematički rezultat teorije vjerojatnosti i matematičke statistike. Povijest CLT-a traje oko 200 godina - od 1730. godine, kada je engleski matematičar A. Moivre (1667.-1754.) objavio prvi rezultat vezan uz CLT (vidi dolje o Moivre-Laplaceovom teoremu), do dvadesetih i tridesetih godina prošlog stoljeća. dvadesetog stoljeća, kada je Finn J.W. Lindeberg, Francuz Paul Levy (1886-1971), Jugoslaven V. Feller (1906-1970), Rus A.Ya. Khinchin (1894-1959) i drugi znanstvenici dobili su potrebne i dovoljne uvjete za valjanost klasičnog središnjeg graničnog teorema.

    Razvoj teme koja se razmatra nije tu stao - proučavali su slučajne varijable koje nemaju disperziju, tj. oni za koje

    (akademik B.V. Gnedenko i dr.), situacija kada se zbrajaju slučajne varijable (točnije, slučajni elementi) složenije prirode od brojeva (akademici Yu.V. Prohorov, A.A. Borovkov i njihovi suradnici), itd. .d.

    Funkcija distribucije F(x) je dana jednakošću

    ,

    gdje je gustoća standardne normalne distribucije, koja ima prilično složen izraz:

    .

    Ovdje =3,1415925… je broj poznat u geometriji, jednak omjeru opsega i promjera, e = 2,718281828... - baza prirodnih logaritama (kako biste zapamtili ovaj broj, imajte na umu da je 1828. godina rođenja pisca L.N. Tolstoja). Kao što je poznato iz matematičke analize,

    Pri obradi rezultata promatranja funkcija normalne distribucije ne izračunava se prema zadanim formulama, već se nalazi pomoću posebnih tablica ili računalnih programa. Najbolje "Tablice matematičke statistike" na ruskom jeziku sastavili su dopisni članovi Akademije znanosti SSSR-a L.N. Bolšev i N.V. Smirnov.

    Oblik gustoće standardne normalne distribucije slijedi iz matematičke teorije, koju ovdje ne možemo razmatrati, kao ni dokaz CLT-a.

    Za ilustraciju donosimo male tablice funkcije distribucije F(x)(tablica 2) i njegove kvantile (tablica 3). Funkcija F(x) simetrično oko 0, što se odražava u tablici 2-3.

    Tablica 2.

    Standardna funkcija normalne distribucije.

    Ako je slučajna varijabla x ima distribucijsku funkciju F(x), Da M(X) = 0, D(x) = 1. Ova tvrdnja je dokazana u teoriji vjerojatnosti na temelju tipa gustoće vjerojatnosti. To je u skladu sa sličnom tvrdnjom za karakteristike reducirane slučajne varijable U n, što je sasvim prirodno, budući da CLT kaže da s neograničenim povećanjem broja članova funkcija distribucije U n teži standardnoj normalnoj funkciji distribucije F(x), i za bilo koje x.

    Tablica 3.

    Kvantili standardne normalne distribucije.

    Kvantil reda R

    Kvantil reda R

    Uvedimo pojam obitelji normalnih distribucija. Po definiciji, normalna distribucija je distribucija slučajne varijable x, za koju je distribucija reducirane slučajne varijable F(x). Kao što slijedi iz općih svojstava obitelji distribucija s pomakom na skali (vidi gore), normalna distribucija je distribucija slučajne varijable

    Gdje x– slučajna varijabla s distribucijom F(X), i m = M(Y), = D(Y). Normalna razdioba s parametrima pomaka m a mjerilo je obično naznačeno N(m, ) (ponekad se koristi oznaka N(m, ) ).

    Kao što slijedi iz (8), gustoća vjerojatnosti normalne distribucije N(m, ) Tamo je

    Normalne distribucije tvore obitelj pomaka na skali. U ovom slučaju, parametar razmjera je d= 1/ , i parametar posmaka c = - m/ .

    Za središnje momente trećeg i četvrtog reda normalne distribucije vrijede sljedeće jednakosti:

    Ove jednakosti čine osnovu klasičnih metoda za provjeru slijede li opažanja normalnu distribuciju. Danas se obično preporučuje testiranje normalnosti pomoću kriterija W Shapiro - Wilka. Problem testiranja normalnosti raspravlja se u nastavku.

    Ako slučajne varijable X 1 I X 2 imaju distribucijske funkcije N(m 1 , 1) I N(m 2 , 2) prema tome, dakle X 1+ X 2 ima distribuciju Prema tome, ako slučajne varijable x 1 , x 2 ,…, Xn N(m, ) , zatim njihova aritmetička sredina

    ima distribuciju N(m, ) . Ova svojstva normalne razdiobe stalno se koriste u različitim probabilističkim i statističkim metodama odlučivanja, posebice u statističkoj regulaciji tehnoloških procesa iu statističkoj kontroli prihvatljivosti na temelju kvantitativnih kriterija.

    Pomoću normalne distribucije definirane su tri distribucije koje se danas često koriste u statističkoj obradi podataka.

    Distribucija (chi - kvadrat) – distribucija slučajne varijable

    gdje su slučajne varijable x 1 , x 2 ,…, Xn nezavisni i imaju istu distribuciju N(0,1). U ovom slučaju broj termina, tj. n, naziva se "broj stupnjeva slobode" distribucije hi-kvadrat.

    Distribucija t Studentov t je distribucija slučajne varijable

    gdje su slučajne varijable U I x neovisan, U ima standardnu ​​normalnu distribuciju N(0,1), i x– chi raspodjela – kvadrat c n stupnjevi slobode. pri čemu n naziva se “broj stupnjeva slobode” Studentove distribucije. Ovu raspodjelu uveo je 1908. engleski statističar W. Gosset, koji je radio u tvornici piva. Za donošenje ekonomskih i tehničkih odluka u ovoj tvornici korištene su probabilističke i statističke metode, pa je njezino vodstvo zabranilo V. Gossetu objavljivanje znanstvenih članaka pod svojim imenom. Na taj su način zaštićene poslovne tajne i “know-how” u obliku probabilističkih i statističkih metoda koje je razvio V. Gosset. No, imao je priliku objavljivati ​​pod pseudonimom “Student”. Povijest Gosset-Studenta pokazuje da su još stotinu godina menadžeri u Velikoj Britaniji bili svjesni veće ekonomske učinkovitosti probabilističko-statističkih metoda odlučivanja.

    Fisherova distribucija je distribucija slučajne varijable

    gdje su slučajne varijable X 1 I X 2 neovisni su i imaju hi-kvadrat distribuciju s brojem stupnjeva slobode k 1 I k 2 odnosno. U isto vrijeme, par (k 1 , k 2 ) – par “stupnjeva slobode” Fisherove distribucije, naime, k 1 je broj stupnjeva slobode brojnika, i k 2 – broj stupnjeva slobode nazivnika. Distribucija slučajne varijable F nazvana je po velikom engleskom statističaru R. Fisheru (1890.-1962.), koji ju je aktivno koristio u svojim radovima.

    Izrazi za hi-kvadrat, Studentove i Fisherove distribucijske funkcije, njihove gustoće i karakteristike, kao i tablice mogu se naći u stručnoj literaturi (vidi, na primjer,).

    Kao što je već navedeno, normalne distribucije sada se često koriste u probabilističkim modelima u raznim primijenjenim područjima. Koji je razlog zašto je ova obitelj distribucija s dva parametra toliko raširena? Pojašnjava ga sljedeći teorem.

    Centralni granični teorem(za različito raspoređene pojmove). Neka x 1 , x 2 ,…, Xn,… - nezavisne slučajne varijable s matematičkim očekivanjima M(x 1 ), M(x 2 ),…, M(x n), ... i odstupanja D(x 1 ), D(x 2 ),…, D(x n), ... redom. Neka

    Zatim, ako su istiniti određeni uvjeti koji osiguravaju mali doprinos bilo kojeg od izraza u U n,

    za bilo koga x.

    Ovdje nećemo formulirati uvjete o kojima je riječ. Mogu se naći u stručnoj literaturi (vidi, na primjer,). "Pojašnjenje uvjeta pod kojima CPT djeluje zasluga je izvanrednih ruskih znanstvenika A.A. Markova (1857.-1922.) i, posebno, A.M. Lyapunova (1857.-1918.)."

    Središnji granični teorem pokazuje da u slučaju kada rezultat mjerenja (promatranja) nastaje pod utjecajem mnogih uzroka, svaki od njih daje samo mali doprinos, a ukupni rezultat je određen aditivno, tj. zbrajanjem, tada je distribucija rezultata mjerenja (opažanja) bliska normalnoj.

    Ponekad se vjeruje da je za normalnu distribuciju dovoljno da rezultat mjerenja (opažanja) x se formira pod utjecajem mnogih razloga, od kojih svaki ima mali utjecaj. To je pogrešno. Važno je kako ti uzroci djeluju. Ako je aditiv, onda x ima približno normalnu distribuciju. Ako višestruko(t. j. djelovanja pojedinih uzroka množe se a ne zbrajaju), zatim raspodjela x blizu ne normalnog, nego tzv. logaritamski normalan, tj. Ne x, a log X ima približno normalnu distribuciju. Ako nema razloga vjerovati da je na djelu jedan od ova dva mehanizma za formiranje konačnog rezultata (ili neki drugi dobro definirani mehanizam), onda o distribuciji x ne može se ništa određeno reći.

    Iz navedenog proizlazi da se u konkretnom primijenjenom problemu normalnost rezultata mjerenja (opažanja) u pravilu ne može utvrditi iz općih razmatranja, već je treba provjeriti pomoću statističkih kriterija. Ili koristiti neparametarske statističke metode koje se ne temelje na pretpostavkama o pripadnosti funkcija distribucije rezultata mjerenja (opažanja) jednoj ili drugoj parametarskoj obitelji.

    Kontinuirane distribucije koje se koriste u probabilističkim i statističkim metodama odlučivanja. Uz familiju normalnih distribucija s pomakom na skali, naširoko se koriste brojne druge obitelji distribucija - lognormalna, eksponencijalna, Weibull-Gnedenko, gama distribucija. Pogledajmo ove obitelji.

    Slučajna vrijednost x ima lognormalnu distribuciju ako je slučajna varijabla Y= log x ima normalnu distribuciju. Zatim Z= log x = 2,3026…Y također ima normalnu distribuciju N(a 1 ,σ 1), gdje je ln x- prirodni logaritam x. Gustoća lognormalne distribucije je:

    Iz središnjeg graničnog teorema slijedi da je umnožak x = x 1 x 2 Xn nezavisne pozitivne slučajne varijable X i, ja = 1, 2,…, n, u cjelini n može se aproksimirati lognormalnom distribucijom. Konkretno, multiplikativni model formiranja plaća ili dohotka dovodi do preporuke da se raspodjele plaća i dohotka aproksimiraju logaritamski normalnim zakonima. Za Rusiju se ova preporuka pokazala opravdanom - to potvrđuju statistički podaci.

    Postoje i drugi probabilistički modeli koji vode do lognormalnog zakona. Klasičan primjer takvog modela dao je A. N. Kolmogorov, koji je iz fizički utemeljenog sustava postulata došao do zaključka da veličine čestica pri drobljenju komada rude, ugljena itd. u mlinovima s kuglicama imaju lognormalnu raspodjelu.

    Prijeđimo na drugu obitelj distribucija, široko korištenu u raznim probabilističko-statističkim metodama odlučivanja i drugim primijenjenim istraživanjima - obitelj eksponencijalnih distribucija. Počnimo s probabilističkim modelom koji dovodi do takvih distribucija. Da biste to učinili, razmotrite "tijek događaja", tj. slijed događaja koji se događaju jedan za drugim u određenim vremenskim točkama. Primjeri uključuju: protok poziva u telefonskoj centrali; tijek kvarova opreme u tehnološkom lancu; tijek kvarova proizvoda tijekom ispitivanja proizvoda; tijek zahtjeva klijenata do poslovnice banke; tok kupaca koji se prijavljuju za robu i usluge itd. U teoriji tokova događaja vrijedi teorem sličan središnjem graničnom teoremu, ali se ne radi o zbrajanju slučajnih varijabli, već o zbrajanju tokova događaja. Promatramo ukupni tok sastavljen od velikog broja neovisnih tokova od kojih niti jedan nema dominantan utjecaj na ukupni tok. Na primjer, tijek poziva koji ulazi u telefonsku centralu sastoji se od velikog broja neovisnih tokova poziva koji potječu od pojedinačnih pretplatnika. Dokazano je da se u slučaju kada karakteristike strujanja ne ovise o vremenu, ukupan protok u potpunosti opisuje jednim brojem - intenzitetom strujanja. Za ukupni protok, razmotrite slučajnu varijablu x- duljina vremenskog intervala između uzastopnih događaja. Njegova distribucijska funkcija ima oblik

    (10)

    Ova se distribucija naziva eksponencijalna distribucija jer formula (10) uključuje eksponencijalnu funkciju ex. Vrijednost 1/λ je parametar skale. Ponekad se uvodi i parametar pomaka S, distribucija slučajne varijable naziva se eksponencijalna X + s, gdje je distribucija x dana je formulom (10).

    Eksponencijalne distribucije poseban su slučaj tzv. Weibull - Gnedenko distribucije. Nazvane su po imenima inženjera V. Weibulla, koji je ove distribucije uveo u praksu analize rezultata ispitivanja zamora, i matematičara B. V. Gnedenka (1912.-1995.), koji je takve distribucije dobio kao granice pri proučavanju maksimuma rezultate testa. Neka x- slučajna varijabla koja karakterizira trajanje rada proizvoda, složenog sustava, elementa (tj. resursa, vremena rada do graničnog stanja itd.), trajanje rada poduzeća ili života živog bića itd. Intenzitet kvara igra važnu ulogu

    (11)

    Gdje F(x) I f(x) - funkcija distribucije i gustoća slučajne varijable x.

    Opišimo tipično ponašanje stope neuspjeha. Cijeli vremenski interval može se podijeliti u tri razdoblja. Na prvom od njih funkcija λ(x) ima visoke vrijednosti i jasnu tendenciju pada (najčešće se monotono smanjuje). To se može objasniti prisutnošću u seriji predmetnih jedinica proizvoda s očitim i skrivenim nedostacima, koji dovode do relativno brzog kvara tih jedinica proizvoda. Prvo razdoblje naziva se "razdoblje provale" (ili "provala"). To je ono što obično pokriva jamstveni rok.

    Zatim dolazi razdoblje normalnog rada, karakterizirano približno konstantnom i relativno niskom stopom kvarova. Priroda kvarova tijekom tog razdoblja je iznenadna (nesreće, pogreške operativnog osoblja itd.) i ne ovisi o trajanju rada jedinice proizvoda.

    Konačno, posljednje razdoblje rada je razdoblje starenja i trošenja. Priroda kvarova tijekom ovog razdoblja je u nepovratnim fizičkim, mehaničkim i kemijskim promjenama u materijalima, što dovodi do progresivnog pogoršanja kvalitete jedinice proizvoda i njenog konačnog kvara.

    Svako razdoblje ima svoju vrstu funkcije λ(x). Razmotrimo klasu ovisnosti o snazi

    λ(x) = λ 0bx b -1 , (12)

    Gdje λ 0 > 0 i b> 0 - neki numerički parametri. Vrijednosti b < 1, b= 0 i b> 1 odgovaraju vrsti stope kvarova tijekom razdoblja uhodavanja, normalnog rada i starenja.

    Odnos (11) pri danoj stopi neuspjeha λ(x)- diferencijalna jednadžba za funkciju F(x). Iz teorije diferencijalnih jednadžbi proizlazi da

    (13)

    Zamjenom (12) u (13) dobivamo to

    (14)

    Distribucija dana formulom (14) naziva se Weibull-Gnedenkova distribucija. Jer

    onda iz formule (14) proizlazi da je količina A, dan formulom (15), je parametar mjerila. Ponekad se uvodi i parametar pomaka, tj. Funkcije distribucije Weibull-Gnedenko nazivaju se F(x - c), Gdje F(x) dana je formulom (14) za neki λ 0 i b.

    Weibull-Gnedenko gustoća distribucije ima oblik

    (16)

    Gdje a> 0 - parametar skale, b> 0 - parametar obrasca, S- parametar pomaka. U ovom slučaju, parametar A iz formule (16) pridružuje se parametru λ 0 iz formule (14) odnosom navedenim u formuli (15).

    Eksponencijalna razdioba vrlo je poseban slučaj Weibull-Gnedenkove razdiobe, koja odgovara vrijednosti parametra oblika b = 1.

    Weibull-Gnedenko distribucija također se koristi u konstrukciji probabilističkih modela situacija u kojima je ponašanje objekta određeno "najslabijom karikom". Postoji analogija s lancem, čija je sigurnost određena karikom koja ima najmanju snagu. Drugim riječima, neka x 1 , x 2 ,…, Xn- neovisne identično distribuirane slučajne varijable,

    X(1)=min( X 1, X 2,…, X n), X(n)=max( X 1, X 2,…, X n).

    U nizu primijenjenih problema igraju važnu ulogu x(1) I x(n) , posebno kada se proučavaju najveće moguće vrijednosti ("zapisi") određenih vrijednosti, na primjer, plaćanja osiguranja ili gubici zbog komercijalnih rizika, kada se proučavaju granice elastičnosti i izdržljivosti čelika, niz karakteristika pouzdanosti itd. . Pokazuje se da za velike n raspodjele x(1) I x(n) , u pravilu, dobro opisuju Weibull-Gnedenko distribucije. Temeljni doprinos proučavanju distribucija x(1) I x(n) pridonio sovjetski matematičar B.V. Gnedenko. Korištenju dobivenih rezultata u ekonomiji, menadžmentu, tehnologiji i drugim područjima posvećeni su radovi V. Weibulla, E. Gumbela, V.B. Nevzorova, E.M. Kudlaev i mnogi drugi stručnjaci.

    Prijeđimo na obitelj gama distribucija. Imaju široku primjenu u ekonomiji i menadžmentu, teoriji i praksi pouzdanosti i ispitivanja, u raznim područjima tehnologije, meteorologije itd. Konkretno, u mnogim situacijama, gama distribucija podliježe takvim veličinama kao što su ukupni životni vijek proizvoda, duljina lanca vodljivih čestica prašine, vrijeme kada proizvod dosegne granično stanje tijekom korozije, vrijeme rada do k-th odbijanje, k= 1, 2, … itd. Očekivano trajanje života bolesnika s kroničnim bolestima i vrijeme za postizanje određenog učinka tijekom liječenja u nekim slučajevima imaju gama distribuciju. Ova distribucija je najprikladnija za opisivanje potražnje u ekonomskim i matematičkim modelima upravljanja zalihama (logistike).

    Gustoća gama distribucije ima oblik

    (17)

    Gustoću vjerojatnosti u formuli (17) određuju tri parametra a, b, c, Gdje a>0, b>0. pri čemu a je parametar obrasca, b- parametar mjerila i S- parametar pomaka. Faktor 1/Γ(a) se normalizira, uvedeno je

    Ovdje Γ(a)- jedna od posebnih funkcija koja se koristi u matematici, tzv. "gama funkcija", po kojoj je nazvana distribucija dana formulom (17),

    Na fiksnom A formula (17) specificira obitelj distribucija s pomakom na skali generiranu distribucijom s gustoćom

    (18)

    Distribucija oblika (18) naziva se standardna gama distribucija. Dobiva se iz formule (17) na b= 1 i S= 0.

    Poseban slučaj gama distribucije za A= 1 su eksponencijalne distribucije (s λ = 1/b). S prirodnim A I S=0 gama distribucije nazivaju se Erlangove distribucije. Iz radova danskog znanstvenika K.A.Erlanga (1878.-1929.), zaposlenika Kopenhagenske telefonske kompanije, koji je studirao 1908.-1922. funkcioniranjem telefonskih mreža započeo je razvoj teorije čekanja u redu. Ova teorija bavi se probabilističkim i statističkim modeliranjem sustava u kojima se servisira tijek zahtjeva u svrhu donošenja optimalnih odluka. Erlangove distribucije koriste se u istim područjima primjene u kojima se koriste eksponencijalne distribucije. Ovo se temelji na sljedećoj matematičkoj činjenici: zbroj k nezavisnih slučajnih varijabli eksponencijalno distribuiranih s istim parametrima λ i S, ima gama distribuciju s parametrom oblika a =k, parametar mjerila b= 1/λ i parametar pomaka kc. Na S= 0 dobivamo Erlangovu distribuciju.

    Ako je slučajna varijabla x ima gama distribuciju s parametrom oblika A takav da d = 2 a- cijeli broj, b= 1 i S= 0, zatim 2 x ima hi-kvadrat distribuciju sa d stupnjevi slobode.

    Slučajna vrijednost x s gvmma distribucijom ima sljedeće karakteristike:

    Očekivana vrijednost M(X) =ab + c,

    Varijanca D(x) = σ 2 = ab 2 ,

    Koeficijent varijacije

    Asimetrija

    Višak

    Normalna distribucija je ekstremni slučaj gama distribucije. Preciznije, neka je Z slučajna varijabla koja ima standardnu ​​gama distribuciju danu formulom (18). Zatim

    za bilo koji realni broj x, Gdje F(x)- standardna funkcija normalne distribucije N(0,1).

    U primijenjenim istraživanjima koriste se i druge parametarske obitelji distribucija, od kojih su najpoznatiji sustav Pearsonovih krivulja, Edgeworthov i Charlierov niz. Oni se ovdje ne razmatraju.

    Diskretna distribucije koje se koriste u probabilističkim i statističkim metodama odlučivanja. Najčešće se koriste tri obitelji diskretnih distribucija - binomna, hipergeometrijska i Poissonova, kao i neke druge obitelji - geometrijska, negativna binomna, multinomna, negativna hipergeometrijska itd.

    Kao što je već spomenuto, binomna distribucija pojavljuje se u neovisnim pokusima, u svakom od njih s vjerojatnošću R pojavljuje se događaj A. Ako ukupan broj pokušaja n dano, zatim broj testova Y, u kojem se pojavio događaj A, ima binomnu distribuciju. Za binomnu distribuciju, vjerojatnost da bude prihvaćena kao slučajna varijabla je Y vrijednosti g određuje se formulom

    Broj kombinacija od n elementi po g, poznato iz kombinatorike. Za sve g, osim 0, 1, 2, …, n, imamo P(Y= g)= 0. Binomna distribucija s fiksnom veličinom uzorka n određen je parametrom str, tj. binomne distribucije čine jednoparametarsku obitelj. Koriste se u analizi podataka iz studija uzoraka, posebice u proučavanju preferencija potrošača, selektivnoj kontroli kvalitete proizvoda prema planovima jednostupanjske kontrole, pri ispitivanju populacije pojedinaca u demografiji, sociologiji, medicini, biologiji itd. .

    Ako Y 1 I Y 2 - nezavisne binomne slučajne varijable s istim parametrom str 0 , određeno iz uzoraka s volumenima n 1 I n 2 prema tome, dakle Y 1 + Y 2 - binomna slučajna varijabla s distribucijom (19). R = str 0 I n = n 1 + n 2 . Ova opaska proširuje primjenjivost binomne distribucije dopuštajući kombiniranje rezultata nekoliko skupina testova kada postoji razlog za vjerovanje da isti parametar odgovara svim tim skupinama.

    Ranije su izračunate karakteristike binomne distribucije:

    M(Y) = n.p., D(Y) = n.p.( 1- str).

    U odjeljku "Događaji i vjerojatnosti" zakon velikih brojeva dokazan je za binomnu slučajnu varijablu:

    za bilo koga . Koristeći teorem o središnjoj granici, zakon velikih brojeva može se precizirati navođenjem koliko Y/ n razlikuje se od R.

    De Moivre-Laplaceov teorem. Za bilo koje brojeve a i b, a< b, imamo

    Gdje F(x) je funkcija standardne normalne distribucije s matematičkim očekivanjem 0 i varijancom 1.

    Da bismo to dokazali, dovoljno je upotrijebiti prikaz Y u obliku zbroja neovisnih slučajnih varijabli koje odgovaraju ishodima pojedinačnih testova, formule za M(Y) I D(Y) i središnji granični teorem.

    Ovaj teorem je za slučaj R= ½ dokazao je engleski matematičar A. Moivre (1667.-1754.) 1730. U gornjoj formulaciji to je 1810. dokazao francuski matematičar Pierre Simon Laplace (1749. - 1827.).

    Hipergeometrijska distribucija se događa tijekom selektivne kontrole konačnog skupa objekata volumena N prema alternativnom kriteriju. Svaki kontrolirani objekt klasificiran je kao da ima atribut A, ili kao da nema ovu karakteristiku. Hipergeometrijska distribucija ima slučajnu varijablu Y, jednak broju objekata koji imaju atribut A u slučajnom uzorku volumena n, Gdje n< N. Na primjer, broj Y neispravne jedinice proizvoda u slučajnom uzorku volumena n iz volumena serije N ima hipergeometrijsku raspodjelu ako n< N. Drugi primjer je lutrija. Neka znak A ulaznica je znak "biti dobitnik". Neka ukupan broj ulaznica N, a neka osoba stekla n od njih. Tada broj dobitnih listića za tu osobu ima hipergeometrijsku distribuciju.

    Za hipergeometrijsku distribuciju, vjerojatnost da slučajna varijabla Y prihvati vrijednost y ima oblik

    (20)

    Gdje D– broj objekata koji imaju atribut A, u razmatranom skupu volumena N. pri čemu g uzima vrijednosti od max(0, n - (N - D)) do min( n, D), druge stvari g vjerojatnost u formuli (20) jednaka je 0. Dakle, hipergeometrijsku razdiobu određuju tri parametra - volumen populacije N, broj objekata D u njemu, posjedujući karakteristiku o kojoj je riječ A i veličina uzorka n.

    Jednostavno slučajno uzorkovanje volumena n od ukupnog volumena N je uzorak dobiven kao rezultat slučajnog odabira u kojem bilo koji od skupova n objekti imaju istu vjerojatnost da budu odabrani. Metode slučajnog odabira uzoraka ispitanika (ispitanika) ili jedinica komadne robe razmatraju se u uputama, metodološkim i regulatornim dokumentima. Jedna od metoda odabira je sljedeća: objekti se biraju jedan iz drugog, au svakom koraku svaki od preostalih objekata u skupu ima istu šansu da bude odabran. U literaturi se za vrste uzoraka koji se razmatraju također koriste izrazi "slučajni uzorak" i "slučajni uzorak bez povrata".

    Budući da su količine populacije (serija) N i uzorci n obično poznati, tada je parametar hipergeometrijske distribucije koji treba procijeniti D. U statističkim metodama upravljanja kvalitetom proizvoda D– obično broj neispravnih jedinica u seriji. Karakteristika distribucije također je zanimljiva D/ N– razina nedostataka.

    Za hipergeometrijsku raspodjelu

    Posljednji faktor u izrazu za varijancu je blizu 1 if N>10 n. Ako izvršite zamjenu str = D/ N, tada će se izrazi za matematičko očekivanje i varijancu hipergeometrijske distribucije pretvoriti u izraze za matematičko očekivanje i varijancu binomne distribucije. Ovo nije slučajnost. Može se pokazati da

    na N>10 n, Gdje str = D/ N. Vrijedi granični omjer

    a ovaj ograničavajući odnos se može koristiti kada N>10 n.

    Treća široko korištena diskretna distribucija je Poissonova distribucija. Slučajna varijabla Y ima Poissonovu distribuciju ako

    ,

    gdje je λ parametar Poissonove distribucije, i P(Y= g)= 0 za sve ostale g(za y=0 označava se 0! =1). Za Poissonovu distribuciju

    M(Y) = λ, D(Y) = λ.

    Ova je distribucija nazvana po francuskom matematičaru S. D. Poissonu (1781-1840), koji ju je prvi dobio 1837. Poissonova distribucija je granični slučaj binomne distribucije, kada je vjerojatnost R provedba događaja je mala, ali broj testova n super, i n.p.= λ. Točnije, vrijedi granična relacija

    Stoga se Poissonova distribucija (u staroj terminologiji “zakon distribucije”) često naziva i “zakon rijetkih događaja”.

    Poissonova distribucija potječe iz teorije toka događaja (vidi gore). Dokazano je da za najjednostavniji tok konstantnog intenziteta Λ broj događaja (poziva) koji su se dogodili tijekom vremena t, ima Poissonovu distribuciju s parametrom λ = Λ t. Stoga je vjerojatnost da tijekom vremena t nijedan događaj se neće dogoditi, jednako e - Λ t, tj. funkcija raspodjele duljine intervala između događaja je eksponencijalna.

    Poissonova distribucija koristi se u analizi rezultata uzorka marketinških istraživanja potrošača, izračunavanju operativnih karakteristika statističkih planova kontrole prihvatljivosti u slučaju malih vrijednosti razine prihvatljivosti nedostataka, za opisivanje broja kvarova statistički kontroliranog tehnološki proces po jedinici vremena, broj "zahtjeva za uslugu" primljenih po jedinici vremena u sustavu čekanja, statistički obrasci nezgoda i rijetkih bolesti itd.

    U literaturi se razmatraju opisi drugih parametarskih obitelji diskretnih distribucija i mogućnosti njihove praktične uporabe.


    U nekim slučajevima, na primjer, kada se proučavaju cijene, obujmi proizvodnje ili ukupno vrijeme između kvarova u problemima pouzdanosti, funkcije distribucije su konstantne u određenim intervalima u koje vrijednosti proučavanih slučajnih varijabli ne mogu pasti.

    Prethodno

    U prethodnom br. uveli smo niz distribucije kao iscrpnu karakteristiku (zakon distribucije) diskontinuirane slučajne varijable. Međutim, ova karakteristika nije univerzalna; postoji samo za diskontinuirane slučajne varijable. Lako je vidjeti da se takva karakteristika ne može konstruirati za kontinuiranu slučajnu varijablu. Doista, kontinuirana slučajna varijabla ima beskonačan broj mogućih vrijednosti, potpuno ispunjavajući određeni interval (tzv. "prebrojivi skup"). Nemoguće je stvoriti tablicu s popisom svih mogućih vrijednosti takve slučajne varijable. Štoviše, kao što ćemo kasnije vidjeti, svaka pojedinačna vrijednost kontinuirane slučajne varijable obično nema nikakvu vjerojatnost različitu od nule. Posljedično, za kontinuiranu slučajnu varijablu ne postoji niz distribucije u smislu u kojem postoji za diskontinuiranu varijablu. Međutim, različita područja mogućih vrijednosti slučajne varijable još uvijek nisu jednako vjerojatna, a za kontinuiranu varijablu postoji “distribucija vjerojatnosti”, iako ne u istom smislu kao za diskontinuiranu.

    Za kvantitativno karakteriziranje ove distribucije vjerojatnosti, prikladno je koristiti ne vjerojatnost događaja, već vjerojatnost događaja, gdje je neka trenutna varijabla. Vjerojatnost ovog događaja očito ovisi o tome postoji li neka funkcija . Ova funkcija se naziva funkcija distribucije slučajne varijable i označava se sa:

    . (5.2.1)

    Funkcija distribucije ponekad se naziva i kumulativna funkcija distribucije ili kumulativni zakon distribucije.

    Funkcija distribucije je najuniverzalnija karakteristika slučajne varijable. Postoji za sve slučajne varijable: i diskontinuirane i kontinuirane. Funkcija distribucije u potpunosti karakterizira slučajnu varijablu s vjerojatnosnog gledišta, tj. je jedan od oblika zakona raspodjele.

    Formulirajmo neka opća svojstva funkcije distribucije.

    1. Funkcija distribucije je neopadajuća funkcija svog argumenta, tj. u .

    2. U minus beskonačnosti funkcija raspodjele jednaka je nuli:.

    3. Na plus beskonačno, funkcija distribucije je jednaka jedan: .

    Bez davanja rigoroznog dokaza ovih svojstava, mi ćemo ih ilustrirati pomoću vizualne geometrijske interpretacije. Da bismo to učinili, razmotrit ćemo slučajnu varijablu kao slučajnu točku na osi Ox (slika 5.2.1), koja kao rezultat eksperimenta može zauzeti jedan ili drugi položaj. Tada je funkcija distribucije vjerojatnost da će slučajna točka kao rezultat eksperimenta pasti lijevo od točke.

    Povećat ćemo, odnosno pomaknuti točku udesno uz apscisnu os. Očito, u ovom slučaju, vjerojatnost da će slučajna točka pasti ulijevo ne može se smanjiti; stoga funkcija distribucije ne može opadati s porastom.

    Kako bismo bili sigurni da je , pomicat ćemo točku ulijevo po apscisi neograničeno dugo. U ovom slučaju, pogoditi slučajnu točku s lijeve strane ograničenja postaje nemoguć događaj; Prirodno je vjerovati da vjerojatnost tog događaja teži nuli, tj. .

    Na sličan način, pomičući točku udesno bez ograničenja, osiguravamo da , budući da događaj postaje pouzdan u limitu.

    Graf funkcije distribucije u općem slučaju je graf neopadajuće funkcije (sl. 5.2.2), čije vrijednosti počinju od 0 i dosežu 1, au određenim točkama funkcija može imati skokove ( diskontinuiteti).

    Poznavajući niz distribucije diskontinuirane slučajne varijable, lako se može konstruirati funkcija distribucije te varijable. Stvarno,

    ,

    pri čemu nejednakost pod znakom zbroja označava da se zbrajanje odnosi na sve one vrijednosti koje su manje od .

    Kada trenutna varijabla prođe kroz bilo koju od mogućih vrijednosti diskontinuirane vrijednosti, funkcija distribucije se naglo mijenja, a veličina skoka jednaka je vjerojatnosti te vrijednosti.

    Primjer 1. Izvodi se jedan pokus u kojem se događaj može ili ne mora pojaviti. Vjerojatnost događaja je 0,3. Slučajna varijabla – broj pojavljivanja događaja u eksperimentu (karakteristična slučajna varijabla događaja). Konstruirajte njegovu funkciju distribucije.

    Riješenje. Niz distribucije vrijednosti ima oblik:

    Konstruirajmo funkciju distribucije vrijednosti:

    Grafik funkcije distribucije prikazan je na sl. 5.2.3. U točkama diskontinuiteta funkcija poprima vrijednosti označene točkama na crtežu (funkcija je kontinuirana lijevo).

    Primjer 2. U uvjetima iz prethodnog primjera izvedena su 4 neovisna pokusa. Konstruirajte funkciju distribucije za broj pojavljivanja događaja.

    Riješenje. Označimo broj pojavljivanja događaja u četiri eksperimenta. Ova količina ima niz distribucije

    Konstruirajmo funkciju distribucije slučajne varijable:

    3) na ;

    U praksi je obično funkcija distribucije kontinuirane slučajne varijable funkcija koja je kontinuirana u svim točkama, kao što je prikazano na slici. 5.2.6. Međutim, moguće je konstruirati primjere slučajnih varijabli, čije moguće vrijednosti kontinuirano ispunjavaju određeni interval, ali za koje funkcija distribucije nije svugdje kontinuirana, već trpi diskontinuitet u određenim točkama (slika 5.2.7) .

    Takve slučajne varijable nazivamo mješovitim. Primjer mješovite vrijednosti je područje uništenja uzrokovano meti bombom, čiji je radijus razornog djelovanja jednak R (slika 5.2.8).

    Vrijednosti ove slučajne varijable kontinuirano ispunjavaju interval od 0 do , koje se javljaju na položajima bombi tipa I i II, imaju određenu konačnu vjerojatnost, a te vrijednosti odgovaraju skokovima u funkciji distribucije, dok u srednjim vrijednostima ​(položaj tipa III) funkcija distribucije je kontinuirana. Drugi primjer mješovite slučajne varijable je vrijeme rada bez greške T uređaja testiranog na vrijeme t. Funkcija distribucije ove slučajne varijable kontinuirana je posvuda osim u točki t.