Karakteristike raspršivanja. Karakteristike raspršenja Disperzija i njena svojstva Čebiševljeva nejednakost Karakteristike položaja i raspršenja

Bez obzira koliko su prosječne karakteristike važne, jednako važna karakteristika niza numeričkih podataka je ponašanje preostalih članova niza u odnosu na prosjek, koliko se razlikuju od prosjeka, koliko se članova niza razlikuje značajno od prosjeka. Tokom treninga gađanja govore o tačnosti rezultata u statistici proučavaju karakteristike disperzije (širenja).

Razlika između bilo koje vrijednosti x i prosječne vrijednosti x naziva se odstupanje a izračunava se kao razlika x, - x. U ovom slučaju, odstupanje može imati i pozitivne vrijednosti ako je broj veći od prosjeka, i negativne vrijednosti ako je broj manji od prosjeka. Međutim, u statistici je često važno da se može raditi sa jednim brojem koji karakteriše „tačnost“ svih numeričkih elemenata niza podataka. Svako zbrajanje svih odstupanja članova niza će dovesti do nule, jer će pozitivna i negativna odstupanja jedno drugo poništiti. Da bi se izbjeglo nuliranje, kvadratne razlike, tačnije, aritmetička sredina kvadrata odstupanja, koriste se za karakterizaciju raspršenja. Ova karakteristika raspršenja se naziva varijansa uzorka.

Što je varijansa veća, veće je raspršenje vrijednosti slučajne varijable. Za izračunavanje disperzije, koristi se približna vrijednost uzorka srednje vrijednosti x sa marginom od jedne cifre u odnosu na sve članove niza podataka. U suprotnom, kada se zbroji veliki broj približnih vrijednosti, akumuliraće se značajna greška. U vezi s dimenzionalnošću numeričkih vrijednosti, treba napomenuti jedan nedostatak takvog indikatora disperzije kao što je disperzija uzorka: jedinica mjere disperzije D je kvadrat jedinice mjerenja vrijednosti X, čija je karakteristika disperzija. Da bi se riješili ovog nedostatka, statistika je uvela takvu karakteristiku raspršenja kao što je uzorak standardne devijacije , što je označeno simbolom A (čitaj “sigma”) i izračunava se pomoću formule

Obično se više od polovine članova niza podataka razlikuje od prosjeka za manje od standardne devijacije, tj. pripadaju segmentu [X - A; x + a]. Inače kažu: prosjek, uzimajući u obzir širenje podataka, jednak je x ± a.

Uvođenje još jedne karakteristike raspršenja je povezano s dimenzijom članova niza podataka. Sve numeričke karakteristike u statistiku su uvedene u svrhu poređenja rezultata proučavanja različitih numeričkih nizova koji karakterišu različite slučajne varijable. Međutim, poređenje standardnih odstupanja od različitih prosječnih vrijednosti različitih skupova podataka nije indikativno, pogotovo ako su dimenzije ovih veličina također različite. Na primjer, ako se uporede dužina i težina bilo kojeg predmeta ili rasipanje u proizvodnji mikro- i makro proizvoda. U vezi s gore navedenim razmatranjima, uvodi se relativna karakteristika raspršenja koja se naziva koeficijent varijacije a izračunava se po formuli

Za izračunavanje numeričkih karakteristika raspršivanja vrijednosti slučajnih varijabli pogodno je koristiti tabelu (Tablica 6.9).

Tabela 6.9

Proračun numeričkih karakteristika raspršenja vrijednosti slučajnih varijabli

Xj- X

(Xj-X)2/

Srednja vrijednost uzorka je u procesu popunjavanja ove tabele. X, koji će se u budućnosti koristiti u dva oblika. Kao konačna prosječna karakteristika (na primjer, u trećoj koloni tabele) prosjek uzorka X mora biti zaokružen na cifru koja odgovara najmanjoj cifri bilo kojeg člana niza numeričkih podataka x g Međutim, ovaj indikator se koristi u tabeli za dalje proračune, a u ovoj situaciji, naime, kada se računa u četvrtoj koloni tabele, prosječna vrijednost uzorka X mora biti zaokružen s marginom od jedne cifre u odnosu na najmanju cifru bilo kojeg člana niza numeričkih podataka X ( .

Rezultat proračuna korištenjem tabele poput tabele. 6.9 će se dobiti vrijednost disperzije uzorka, a za evidentiranje odgovora potrebno je, na osnovu vrijednosti disperzije uzorka, izračunati vrijednost standardne devijacije a.

Odgovor pokazuje: a) prosječan rezultat uzimajući u obzir širenje podataka u obrascu x±o; b) karakteristika stabilnosti podataka V. Odgovor bi trebao ocijeniti kvalitetu koeficijenta varijacije: dobar ili loš.

Prihvatljivim koeficijentom varijacije kao pokazateljem homogenosti ili stabilnosti rezultata u sportskim istraživanjima smatra se 10-15%. Koeficijent varijacije V= 20% u bilo kom istraživanju smatra se veoma velikom cifrom. Ako je veličina uzorka P> 25, onda V> 32% je veoma loš pokazatelj.

Na primjer, za diskretnu varijaciju serije 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 stola 6.9 će se popuniti na sljedeći način (Tabela 6.10).

Tabela 6.10

Primjer izračunavanja numeričkih karakteristika raspršivanja vrijednosti

*1

fi

1

L P 25 = 2,92 = 2,9

D_S_47.6_ P 25

Odgovori: a) prosječna karakteristika, uzimajući u obzir širenje podataka, jednaka je X± a = = 3 ± 1,4; b) stabilnost dobijenih mjerenja je na niskom nivou, budući da je koeficijent varijacije V = 48% > 32%.

Analog stola 6.9 se takođe može koristiti za izračunavanje karakteristika rasejanja serije intervalne varijacije. Istovremeno, opcije x g bit će zamijenjeni predstavnicima praznina x v ja opcija apsolutnih frekvencija f(- na apsolutne frekvencije intervala fv

Na osnovu navedenog može se uraditi sljedeće: zaključci.

Zaključci matematičke statistike su uvjerljivi ako se obrađuju informacije o masovnim pojavama.

Obično se uzorak proučava iz opće populacije objekata, koja mora biti reprezentativna.

Eksperimentalni podaci dobijeni kao rezultat proučavanja bilo kojeg svojstva uzoraka objekata predstavljaju vrijednost slučajne varijable, budući da istraživač ne može unaprijed predvidjeti koji će broj odgovarati određenom objektu.

Za odabir jednog ili drugog algoritma za opisivanje i početnu obradu eksperimentalnih podataka, važno je moći odrediti tip slučajne varijable: diskretna, kontinuirana ili mješovita.

Diskretne slučajne varijable opisuju se diskretnim nizom varijacija i njegovim grafičkim oblikom - frekvencijskim poligonom.

Mješovite i kontinuirane slučajne varijable opisuju se nizom intervalnih varijacija i njegovim grafičkim oblikom - histogramom.

Prilikom poređenja više uzoraka prema generiranom nivou određene osobine koriste se prosječne numeričke karakteristike i numeričke karakteristike raspršenja slučajne varijable u odnosu na prosjek.

Prilikom izračunavanja prosječne karakteristike važno je pravilno odabrati vrstu prosječne karakteristike koja je adekvatna njegovom području primjene. Strukturne prosječne vrijednosti, mod i medijan, karakteriziraju strukturu lokacije varijante u uređenom nizu eksperimentalnih podataka. Kvantitativni prosjek omogućava procjenu prosječne veličine opcije (prosjek uzorka).

Za izračunavanje numeričkih karakteristika rasejanja – varijanse uzorka, standardne devijacije i koeficijenta varijacije – efikasna je tabela.

Karakteristike položaja opisuju centar distribucije. Istovremeno, značenja opcije mogu se grupirati oko nje u širokom i uskom opsegu. Stoga je za opisivanje distribucije potrebno okarakterizirati raspon promjena vrijednosti karakteristike. Karakteristike raspršivanja se koriste za opisivanje raspona varijacije karakteristike. Najšire korišteni su raspon varijacije, disperzija, standardna devijacija i koeficijent varijacije.

Raspon varijacija definira se kao razlika između maksimalne i minimalne vrijednosti karakteristike u populaciji koja se proučava:

R=x max - x min.

Očigledna prednost indikatora koji se razmatra je jednostavnost izračunavanja. Međutim, budući da opseg varijacije ovisi o vrijednostima samo ekstremnih vrijednosti karakteristike, opseg njegove primjene je ograničen na prilično homogene distribucije. U drugim slučajevima, informativni sadržaj ovog indikatora je vrlo mali, jer postoji mnogo distribucija koje su vrlo različite po obliku, ali imaju isti raspon. U praktičnim studijama, raspon varijacija se ponekad koristi s malim (ne više od 10) veličinama uzoraka. Na primjer, iz raspona varijacija lako je procijeniti koliko su najbolji i najgori rezultati različiti u grupi sportista.

U ovom primjeru:

R=16,36 – 13,04=3,32 (m).

Druga karakteristika raspršivanja je disperzija. Disperzija je prosječni kvadrat odstupanja slučajne varijable od srednje vrijednosti. Disperzija je karakteristika raspršenja, širenja vrijednosti veličine oko njene prosječne vrijednosti. Sama riječ "disperzija" znači "raspršivanje".

Prilikom provođenja uzoraka studija potrebno je utvrditi procjenu varijanse. Varijanca izračunata iz podataka uzorka naziva se varijansa uzorka i označava se S 2 .

Na prvi pogled, najprirodnija procjena varijanse je statistička varijansa, izračunata na osnovu definicije pomoću formule:

U ovoj formuli - zbir kvadrata odstupanja vrijednosti atributa x i iz aritmetičke sredine . Da bi se dobila srednja kvadratna devijacija, ovaj zbir se dijeli s veličinom uzorka P.

Međutim, takva procjena nije nepristrasna. Može se pokazati da je zbroj kvadrata odstupanja vrijednosti atributa za uzorak aritmetičke sredine manji od zbira kvadrata odstupanja od bilo koje druge vrijednosti, uključujući i pravu sredinu (matematičko očekivanje). Stoga će rezultat dobiven iz gornje formule sadržavati sistematsku grešku, a procijenjena vrijednost varijanse će biti potcijenjena. Da bi se eliminisala pristrasnost, dovoljno je uvesti faktor korekcije. Rezultat je sljedeći odnos za procijenjenu varijansu:

Za velike vrijednosti n Naravno, obje procjene - pristrasna i nepristrasna - će se vrlo malo razlikovati i uvođenje faktora korekcije postaje besmisleno. U pravilu, formulu za procjenu varijanse treba precizirati kada n<30.

U slučaju grupiranih podataka, posljednja formula se može svesti na sljedeći oblik radi pojednostavljenja proračuna:

Gdje k- broj intervala grupisanja;

n i- frekvencija intervala sa brojem i;

x i- srednja vrijednost intervala sa brojem i.

Kao primjer, izračunajmo varijansu za grupisane podatke primjera koji analiziramo (vidi tabelu 4.):

S 2 =/ 28=0,5473 (m2).

Varijanca slučajne varijable ima dimenziju kvadrata dimenzije slučajne varijable, što otežava interpretaciju i čini je nejasnom. Za vizualniji opis raspršenja, pogodnije je koristiti karakteristiku čija se dimenzija poklapa s dimenzijom karakteristike koja se proučava. U tu svrhu uvodi se koncept standardna devijacija(ili standardna devijacija).

Standardna devijacija naziva se pozitivnim kvadratnim korijenom varijanse:

U našem primjeru, standardna devijacija je jednaka

Standardna devijacija ima iste mjerne jedinice kao i rezultati mjerenja karakteristike koja se proučava i samim tim karakteriše stepen odstupanja karakteristike od aritmetičke sredine. Drugim riječima, pokazuje kako se glavni dio opcije nalazi u odnosu na aritmetičku sredinu.

Standardna devijacija i varijansa su najčešće korištene mjere varijacije. To je zbog činjenice da su uključeni u značajan dio teorema teorije vjerovatnoće, koja služi kao temelj matematičke statistike. Osim toga, varijansa se može razložiti na sastavne elemente, koji omogućavaju procjenu utjecaja različitih faktora na varijaciju osobine koja se proučava.

Pored apsolutnih pokazatelja varijacije, a to su disperzija i standardna devijacija, u statistiku se uvode i relativni. Najčešće se koristi koeficijent varijacije. Koeficijent varijacije jednak omjeru standardne devijacije i aritmetičke sredine, izražen u postocima:

Iz definicije je jasno da je, u svom značenju, koeficijent varijacije relativna mjera disperzije neke karakteristike.

Za dotični primjer:

Koeficijent varijacije se široko koristi u statističkim istraživanjima. Budući da je relativna vrijednost, omogućava vam da uporedite varijabilnost obje karakteristike koje imaju različite mjerne jedinice, kao i istu karakteristiku u nekoliko različitih populacija s različitim vrijednostima aritmetičke sredine.

Koeficijent varijacije se koristi za karakterizaciju homogenosti dobijenih eksperimentalnih podataka. U praksi fizičke kulture i sporta, širenje rezultata mjerenja u zavisnosti od vrijednosti koeficijenta varijacije smatra se malim (V<10%), средним (11-20%) и большим (V> 20%).

Ograničenja upotrebe koeficijenta varijacije povezana su sa njegovom relativnom prirodom – definicija sadrži normalizaciju na aritmetičku sredinu. S tim u vezi, pri malim apsolutnim vrijednostima aritmetičke sredine, koeficijent varijacije može izgubiti svoj informativni sadržaj. Što je aritmetička sredina bliža nuli, ovaj indikator postaje manje informativan. U graničnom slučaju, aritmetička sredina ide na nulu (na primjer, temperatura), a koeficijent varijacije ide u beskonačnost, bez obzira na širenje karakteristike. Po analogiji sa slučajem greške, može se formulisati sljedeće pravilo. Ako je vrijednost aritmetičke sredine u uzorku veća od jedan, tada je upotreba koeficijenta varijacije legalna, u suprotnom treba koristiti disperziju i standardnu ​​devijaciju za opisivanje širenja eksperimentalnih podataka.

U zaključku ovog dijela razmotrit ćemo procjenu varijacija u vrijednostima ocjenjivačkih karakteristika. Kao što je već napomenuto, vrijednosti karakteristika distribucije izračunate iz eksperimentalnih podataka ne poklapaju se s njihovim pravim vrijednostima za opću populaciju. Ovo posljednje nije moguće precizno utvrditi, jer je po pravilu nemoguće ispitati cjelokupnu populaciju. Ako koristimo rezultate različitih uzoraka iz iste populacije za procjenu parametara distribucije, ispada da se ove procjene za različite uzorke razlikuju jedna od druge. Procijenjene vrijednosti fluktuiraju oko svojih pravih vrijednosti.

Odstupanja procjena općih parametara od pravih vrijednosti ovih parametara nazivaju se statističkim greškama. Razlog za njihovu pojavu je ograničena veličina uzorka – nisu svi objekti u općoj populaciji uključeni u njega. Za procjenu veličine statističkih grešaka koristi se standardna devijacija karakteristika uzorka.

Kao primjer, razmotrite najvažniju karakteristiku pozicije - aritmetičku sredinu. Može se pokazati da je standardna devijacija aritmetičke sredine određena relacijom:

Gdje σ - standardna devijacija za populaciju.

Pošto prava vrijednost standardne devijacije nije poznata, veličina se zove standardna greška aritmetičke sredine i jednako:

Vrijednost karakteriše grešku koja je u prosjeku dozvoljena kada se opći prosjek zamjenjuje njegovom procjenom uzorka. Prema formuli, povećanje veličine uzorka tokom studije dovodi do smanjenja standardne greške proporcionalno kvadratnom korijenu veličine uzorka.

Za primjer koji se razmatra, standardna greška aritmetičke sredine je jednaka . U našem slučaju se pokazalo 5,4 puta manje od standardne devijacije.

    EFEKTIVNA POVRŠINA RASPENJA (POVRŠINA)- karakteristika refleksivnosti mete, izražena odnosom električne snage. mag. energija koju reflektuje cilj u pravcu prijemnika do gustine fluksa površinske energije koja pada na metu. Zavisi od… … Enciklopedija strateških raketnih snaga

    Kvantna mehanika ... Wikipedia

    - (EPR) karakteristika reflektivnosti mete ozračene elektromagnetnim talasima. EPR vrijednost je definirana kao omjer protoka (snage) elektromagnetne energije koju reflektira cilj u smjeru radio-elektronske opreme (RES) prema... ... Pomorski rječnik

    pojas raspršivanja- Statističke karakteristike eksperimentalnih podataka, koje odražavaju njihovo odstupanje od prosječne vrijednosti. Teme: metalurgija općenito EN očajnički bend... Vodič za tehnički prevodilac

    - (funkcija prijenosa modulacije), funkcija, uz pomoć reza se procjenjuju svojstva “oštrine” slikovnih optičkih sočiva. sistema i ods. elemenata takvih sistema. Ch.k.x. je takozvana Fourierova transformacija. funkcija raspršenja linija koja opisuje prirodu "širenja" ... ... Fizička enciklopedija

    Funkcija prijenosa modulacije, funkcija koja procjenjuje svojstva “oštrine” optičkih sistema za snimanje i pojedinačnih elemenata takvih sistema (vidi, na primjer, Oštrinu fotografske slike). Ch.k.x. tu je Furije.....

    pojas raspršivanja- statistička karakteristika eksperimentalnih podataka, koja odražava njihovo odstupanje od prosječne vrijednosti. Pogledajte također: Klizna traka Reljefna traka Traka za otvrdnjavanje... Enciklopedijski rečnik metalurgije

    SCATTERING BAND- statistička karakteristika eksperimentalnih podataka, koja odražava njihovo odstupanje od prosječne vrijednosti... Metalurški rječnik

    Karakteristike raspršivanja vrijednosti slučajnih varijabli. M. t h je povezan sa kvadratnom devijacijom (vidi kvadratno odstupanje) σ formulom Ova metoda mjerenja raspršenja se objašnjava činjenicom da u slučaju normalnog ... ... Velika sovjetska enciklopedija

    STATISTIKA VARIJACIJA- VARIJACIJSKA STATISTIKA, termin koji objedinjuje grupu tehnika statističke analize koje se prvenstveno koriste u prirodnim naukama. U drugoj polovini 19. veka. Quetelet, „Anthro pometrie ou mesure des differentes facultes de 1...... Velika medicinska enciklopedija

    Očekivana vrijednost- (srednja populacija) Matematičko očekivanje je distribucija vjerovatnoće slučajne varijable, definicija, matematičko očekivanje diskretnih i kontinuiranih slučajnih varijabli, uzorak, uslovno očekivanje, proračun,... ... Investor Encyclopedia

Jedan od razloga za sprovođenje statističke analize je potreba da se uzme u obzir uticaj slučajnih faktora (poremećaja) na indikator koji se proučava, koji dovode do raspršivanja (rasipanja) podataka. Rješavanje problema u kojima postoje raštrkani podaci povezano je s rizikom, jer čak i ako koristite sve dostupne informacije, ne možete upravo predvidjeti šta će se dogoditi u budućnosti. Za adekvatno rješavanje takvih situacija, preporučljivo je razumjeti prirodu rizika i biti u stanju odrediti stepen disperzije skupa podataka. Postoje tri numeričke karakteristike koje opisuju mjeru disperzije: standardna devijacija, raspon i koeficijent varijacije (varijabilnost). Za razliku od tipičnih indikatora (srednja vrijednost, medijan, mod) koji karakteriziraju centar, karakteristike raspršenja pokazuju koliko blizu Pojedinačne vrijednosti skupa podataka nalaze se prema ovom centru
Definicija standardne devijacije Standardna devijacija(standardna devijacija) je mjera nasumičnih odstupanja vrijednosti podataka od srednje vrijednosti. U stvarnom životu većinu podataka karakteriše rasipanje, tj. pojedinačne vrijednosti nalaze se na određenoj udaljenosti od prosjeka.
Nemoguće je koristiti standardnu ​​devijaciju kao opću karakteristiku raspršenja jednostavnim usrednjavanjem devijacija podataka, jer će dio odstupanja biti pozitivan, a drugi dio negativan, i, kao rezultat toga, rezultat usrednjavanja može biti jednak nula. Da biste se riješili negativnog predznaka, koristite standardnu ​​tehniku: prvo izračunajte disperzija kao zbir kvadrata odstupanja podijeljen sa ( n–1), a zatim se iz rezultirajuće vrijednosti uzima kvadratni korijen. Formula za izračunavanje standardne devijacije je sljedeća: Napomena 1: Varijanca ne prenosi nikakve dodatne informacije u odnosu na standardnu ​​devijaciju, ali ju je teže interpretirati jer se izražava u „jedinicama na kvadrat“, dok se standardna devijacija izražava u jedinicama koje su nam poznate (na primjer, dolari). Napomena 2: Gornja formula služi za izračunavanje standardne devijacije uzorka i preciznije se zove uzorak standardne devijacije. Prilikom izračunavanja standardne devijacije stanovništva(označeno simbolom s) podijeli sa n. Vrijednost standardne devijacije uzorka je nešto veća (pošto je podijeljena sa n–1), što daje korekciju za slučajnost samog uzorka. Kada je skup podataka normalno raspoređen, standardna devijacija poprima posebno značenje. Na donjoj slici, oznake su napravljene na obje strane srednje vrijednosti na udaljenostima od jedne, dvije i tri standardne devijacije, respektivno. Slika pokazuje da otprilike 66,7% (dvije trećine) svih vrijednosti spada u jednu standardnu ​​devijaciju s obje strane srednje vrijednosti, 95% vrijednosti spada u dvije standardne devijacije srednje vrijednosti, a gotovo svi podaci (99,7%) će biti unutar tri standardne devijacije od srednje vrijednosti.
66,7%


Ovo svojstvo standardne devijacije za normalno raspoređene podatke naziva se "pravilo dvije trećine".

U nekim situacijama, kao što je analiza kontrole kvaliteta proizvoda, granice se često postavljaju tako da se ona zapažanja (0,3%) koja su više od tri standardna odstupanja od srednje vrednosti smatraju vrednim problemom.

Nažalost, ako podaci ne prate normalnu distribuciju, gore opisano pravilo se ne može primijeniti.

Trenutno postoji ograničenje koje se zove Čebiševo pravilo koje se može primijeniti na asimetrične (iskrivljene) distribucije.

Generiranje početnih podataka Skup SV

U tabeli 1 prikazana je dinamika promjena dnevnih dobiti na berzi, zabilježenih radnim danima za period od 31. jula do 9. oktobra 1987. godine.

Tabela 1. Dinamika promjena dnevne dobiti na berzi

datum Dnevni profit datum Dnevni profit datum Dnevni profit
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Pokrenite Excel
Kreirajte fajl Kliknite na dugme Sačuvaj na standardnoj traci sa alatkama. Otvorite fasciklu Statistics u dijaloškom okviru koji se pojavi i nazovite datoteku Scattering Characteristics.xls.
Set label 6. Na Sheet1, u ćeliji A1, postavite oznaku Dnevni profit, 7. i u rasponu A2:A49 unesite podatke iz Tabele 1.
Postavite funkciju PROSJEČNA VRIJEDNOST 8. U ćeliju D1 unesite oznaku Prosjek. U ćeliji D2 izračunajte prosjek koristeći statističku funkciju PROSJEK.
Podesite STANDARDEV funkciju U ćeliju D4 unesite oznaku Standardna devijacija. U ćeliji D5 izračunajte standardnu ​​devijaciju koristeći statističku funkciju STDEV
Smanjite bitnu veličinu rezultata na četvrtu decimalu.
Interpretacija rezultata Odbij Prosječna dnevna dobit iznosila je 0,04% (prosječna dnevna dobit -0,0004). To znači da je prosječna dnevna dobit za posmatrani period bila približno nula, tj. tržište je zadržalo prosječnu stopu. Ispostavilo se da je standardna devijacija 0,0118. To znači da se jedan dolar (1$) uložen na berzi mijenjao u prosjeku za 0,0118$ dnevno, tj. njegova investicija bi mogla rezultirati dobitkom ili gubitkom od $0,0118.
Provjerimo da li vrijednosti dnevne dobiti date u tabeli 1 odgovaraju pravilima normalne distribucije 1. Izračunajte interval koji odgovara jednoj standardnoj devijaciji na obje strane srednje vrijednosti. 2. U ćelijama D7, D8 i F8 postavite oznake respektivno: Jedna standardna devijacija, Donja granica, Gornja granica. 3. U ćeliju D9 unesite formulu = -0,0004 – 0,0118, au ćeliju F9 unesite formulu = -0,0004 + 0,0118. 4. Dobijte rezultat tačan do četvrte decimale.

5. Odredite broj vrijednosti dnevne dobiti koje su unutar jedne standardne devijacije. Prvo filtrirajte podatke, ostavljajući dnevne vrijednosti profita u rasponu [-0,0121, 0,0114]. Da biste to učinili, odaberite bilo koju ćeliju u koloni A sa dnevnim vrijednostima profita i pokrenite naredbu:

Data®Filter®AutoFilter

Otvorite meni klikom na strelicu u zaglavlju Dnevni profit i izaberite (Stanje...). U dijaloškom okviru Prilagođeni automatski filtar postavite opcije kao što je prikazano u nastavku. Kliknite OK.

Da biste izbrojali broj filtriranih podataka, odaberite raspon vrijednosti dnevnog profita, kliknite desnim gumbom miša na prazan prostor u statusnoj traci i odaberite Broj vrijednosti iz kontekstnog izbornika. Pročitajte rezultat. Sada prikažite sve originalne podatke pokretanjem naredbe: Data®Filter®Display All i isključite autofilter koristeći naredbu: Data®Filter®AutoFilter.

6. Izračunajte postotak vrijednosti dnevnog profita koji je jedno standardno odstupanje udaljen od srednje vrijednosti. Da biste to učinili, stavite naljepnicu u ćeliju H8 Procenat, a u ćeliji H9 programirajte formulu za izračunavanje procenta i dobijete rezultat tačan na jednu decimalu.

7. Izračunajte raspon vrijednosti dnevnog profita unutar dvije standardne devijacije od srednje vrijednosti. U ćelijama D11, D12 i F12 postavite oznake u skladu s tim: Dvije standardne devijacije, Zaključak, Gornja granica. Unesite formule za izračunavanje u ćelije D13 i F13 i dobijte rezultat s tačnim do četvrtog decimalnog mjesta.

8. Odredite broj vrijednosti dnevnog profita koje su unutar dvije standardne devijacije tako što ćete prvo filtrirati podatke.

9. Izračunajte procenat vrednosti dnevnog profita koji su dve standardne devijacije udaljene od srednje vrednosti. Da biste to učinili, stavite naljepnicu u ćeliju H12 Procenat, a u ćeliji H13 programirajte formulu za izračunavanje procenta i dobijete rezultat tačan na jednu decimalu.

10. Izračunajte raspon vrijednosti dnevnog profita unutar tri standardne devijacije od srednje vrijednosti. U ćelijama D15, D16 i F16 postavite oznake u skladu s tim: Tri standardne devijacije, Zaključak, Gornja granica. Unesite formule za izračunavanje u ćelije D17 i F17 i dobijete rezultat s tačnim do četvrtog decimalnog mjesta.

11. Odredite broj vrijednosti dnevnog profita koje su unutar tri standardne devijacije tako što ćete prvo filtrirati podatke. Izračunajte postotak vrijednosti dnevnog profita. Da biste to učinili, stavite naljepnicu u ćeliju H16 Procenat, a u ćeliji H17 programirajte formulu za izračunavanje procenta i dobijete rezultat s tačnim do jedne decimale.

13. Konstruirajte histogram dnevnih prinosa akcija na berzi i postavite ga zajedno sa tabelom raspodjele frekvencija u područje J1:S20. Prikažite na histogramu približnu srednju vrijednost i intervale koji odgovaraju jednoj, dvije i tri standardne devijacije od srednje vrijednosti, respektivno.

Karakteristike raspršivanja

Mjere disperzije uzorkovanja.

Minimum i maksimum uzorka su, respektivno, najmanja i najveća vrijednost varijable koja se proučava. Razlika između maksimuma i minimuma se naziva obim uzorci. Svi podaci uzorka nalaze se između minimuma i maksimuma. Čini se da ovi indikatori ocrtavaju granice uzorka.

R№1= 15,6-10=5,6

R №2 =0,85-0,6=0,25

Varijanca uzorka(engleski) varijansa) I standardna devijacija uzorci (engleski) standardna devijacija) su mjera varijabilnosti varijable i karakteriziraju stepen rasipanja podataka oko centra. U ovom slučaju, standardna devijacija je prikladniji indikator zbog činjenice da ima istu dimenziju kao i stvarni podaci koji se proučavaju. Stoga se indikator standardne devijacije koristi zajedno sa aritmetičkom sredinom uzorka da bi se ukratko opisali rezultati analize podataka.

Prikladnije je izračunati varijansu uzorka pomoću formule:

Standardna devijacija se izračunava pomoću formule:

Koeficijent varijacije je relativna mjera disperzije osobine.

Koeficijent varijacije se takođe koristi kao indikator homogenosti posmatranja uzorka. Vjeruje se da ako koeficijent varijacije ne prelazi 10%, onda se uzorak može smatrati homogenim, odnosno dobivenim iz jedne opće populacije.

Pošto je koeficijent varijacije u oba uzorka, oni su homogeni.

Uzorak se može analitički prikazati u obliku funkcije distribucije, kao i u obliku tablice frekvencija koja se sastoji od dvije linije. U gornjem redu su elementi za odabir (opcije), poređani uzlaznim redoslijedom; Frekvencije opcije su upisane u donjem redu.

Učestalost varijante je broj jednak broju ponavljanja date varijante u uzorku.

Uzorak br. 1 “Majke”

Vrsta krivulje distribucije

Asimetrija ili koeficijent asimetrije (termin koji je prvi skovao Pearson, 1895) je mjera asimetrije distribucije. Ako se asimetrija jasno razlikuje od 0, raspodjela je asimetrična, gustina normalne distribucije je simetrična u odnosu na srednju vrijednost.

Indeks asimetrija(engleski) iskrivljenost) se koristi za karakterizaciju stepena simetrije distribucije podataka oko centra. Asimetrija može imati i negativne i pozitivne vrijednosti. Pozitivna vrijednost za ovaj parametar označava da su podaci pomaknuti lijevo od centra, a negativna vrijednost označava da su podaci pomaknuti udesno. Dakle, predznak indeksa skewnessa ukazuje na smjer pristranosti podataka, dok veličina ukazuje na stepen ove pristranosti. Kosina jednaka nuli ukazuje da su podaci simetrično koncentrisani oko centra.

Jer asimetrija je pozitivna, stoga se vrh krive pomiče lijevo od centra.

Kurtosis koeficijent(engleski) kurtosis) je karakteristika koliko je blisko većina podataka grupirana oko centra.

Sa pozitivnim kurtosisom, kriva se izoštrava, sa negativnim ekscesom se izglađuje.

Kriva je spljoštena;

Krivulja se izoštrava.