Caracteristici de împrăștiere. Caracteristicile împrăștierii Dispersia și proprietățile sale Inegalitatea lui Chebyshev Caracteristicile poziției și împrăștierea

Indiferent cât de importante sunt caracteristicile medii, o caracteristică la fel de importantă a unei matrice de date numerice este comportamentul membrilor rămași ai matricei în raport cu media, cât de mult diferă de medie, cât de mulți membri ai matricei diferă semnificativ de la medie. În timpul antrenamentului de fotografiere, ei vorbesc despre acuratețea rezultatelor; în statistică studiază caracteristicile dispersiei (împrăștierii).

Se numește diferența dintre orice valoare a lui x și valoarea medie a lui x deviere și calculată ca diferență x, - x. În acest caz, abaterea poate lua atât valori pozitive dacă numărul este mai mare decât media, cât și valori negative dacă numărul este mai mic decât media. Cu toate acestea, în statistică este adesea important să poți opera cu un număr care caracterizează „acuratețea” tuturor elementelor numerice ale unei matrice de date. Orice însumare a tuturor abaterilor membrilor matricei va duce la zero, deoarece abaterile pozitive și negative se vor anula reciproc. Pentru a evita punerea la zero, diferențele pătrate, sau mai precis, media aritmetică a abaterilor pătrate, sunt folosite pentru a caracteriza împrăștierea. Această caracteristică de împrăștiere se numește varianța eșantionului.

Cu cât varianța este mai mare, cu atât este mai mare împrăștierea valorilor variabilelor aleatoare. Pentru a calcula dispersia, se utilizează o valoare aproximativă a mediei eșantionului x cu o marjă de o cifră în raport cu toți membrii matricei de date. În caz contrar, la însumarea unui număr mare de valori aproximative, se va acumula o eroare semnificativă. În legătură cu dimensionalitatea valorilor numerice, trebuie remarcat un dezavantaj al unui astfel de indicator de dispersie precum dispersia eșantionului: unitatea de măsură a dispersiei D este pătratul unității de măsură a valorilor X, a căror caracteristică este dispersia. Pentru a scăpa de acest dezavantaj, statisticile au introdus o astfel de caracteristică de împrăștiere precum abaterea standard a probei , care este notat cu simbolul A (a se citi „sigma”) și se calculează folosind formula

În mod normal, mai mult de jumătate dintre membrii matricei de date diferă de medie cu mai puțin decât abaterea standard, adică aparțin segmentului [X - A; x + a]. Altfel se spune: media, ținând cont de răspândirea datelor, este egală cu x ± a.

Introducerea unei alte caracteristici de împrăștiere este asociată cu dimensiunea membrilor matricei de date. Toate caracteristicile numerice din statistică sunt introduse în scopul comparării rezultatelor studierii diferitelor matrice numerice care caracterizează diferite variabile aleatoare. Cu toate acestea, compararea abaterilor standard de la diferite valori medii ale diferitelor seturi de date nu este orientativă, mai ales dacă dimensiunile acestor cantități sunt și ele diferite. De exemplu, dacă se compară lungimea și greutatea oricăror obiecte sau împrăștierea în fabricarea de micro și macroproduse. În legătură cu considerațiile de mai sus, se introduce o caracteristică de împrăștiere relativă, care se numește coeficient de variațieși se calculează prin formula

Pentru a calcula caracteristicile numerice ale împrăștierii valorilor variabile aleatoare, este convenabil să folosiți un tabel (Tabelul 6.9).

Tabelul 6.9

Calculul caracteristicilor numerice ale împrăștierii valorilor variabile aleatoare

Xj- X

(Xj-X)2/

Media eșantionului este în curs de completare a acestui tabel. X, care va fi folosit în două forme în viitor. Ca o caracteristică medie finală (de exemplu, în a treia coloană a tabelului) media eșantionului X trebuie rotunjit la cifra corespunzătoare celei mai mici cifre a oricărui membru al matricei de date numerice x g Cu toate acestea, acest indicator este utilizat în tabel pentru calcule ulterioare, iar în această situație, și anume la calcularea în coloana a patra a tabelului, media eșantionului X trebuie rotunjit cu o marjă de o cifră în raport cu cea mai mică cifră a oricărui membru al matricei de date numerice X ( .

Rezultatul calculelor folosind un tabel ca un tabel. 6.9 se va obține valoarea dispersiei eșantionului, iar pentru înregistrarea răspunsului este necesar, pe baza valorii dispersiei eșantionului, să se calculeze valoarea abaterii standard a.

Răspunsul indică: a) rezultatul mediu ținând cont de răspândirea datelor în formular x±o; b) caracteristica de stabilitate a datelor V. Răspunsul ar trebui să evalueze calitatea coeficientului de variație: bun sau rău.

Coeficientul de variație acceptabil ca indicator al omogenității sau stabilității rezultatelor în cercetarea sportivă este considerat a fi de 10-15%. Coeficientul de variație V= 20% în orice cercetare este considerată o cifră foarte mare. Dacă dimensiunea eșantionului P> 25, atunci V> 32% este un indicator foarte prost.

De exemplu, pentru o serie de variații discrete 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 mese 6.9 va fi completat după cum urmează (Tabelul 6.10).

Tabelul 6.10

Un exemplu de calcul al caracteristicilor numerice ale împrăștierii valorilor

*1

fi

1

L P 25 = 2,92 = 2,9

D_S_47.6_ P 25

Răspuns: a) caracteristica medie, luând în considerare răspândirea datelor, este egală cu X± a = = 3 ± 1,4; b) stabilitatea măsurătorilor obţinute este la un nivel scăzut, din moment ce coeficientul de variaţie V = 48% > 32%.

Analog al mesei 6.9 poate fi folosit și pentru a calcula caracteristicile de împrăștiere ale unei serii de variații de interval. În același timp, opțiunile x g vor fi înlocuite cu reprezentanți ai golurilor xv ja opțiunea de frecvențe absolute f(- la frecvenţele absolute ale intervalelor fv

Pe baza celor de mai sus, se pot face următoarele: concluzii.

Concluziile statisticii matematice sunt plauzibile dacă sunt procesate informații despre fenomenele de masă.

De obicei, un eșantion este studiat din populația generală de obiecte, care trebuie să fie reprezentativă.

Datele experimentale obținute ca urmare a studierii oricărei proprietăți a obiectelor eșantionului reprezintă valoarea unei variabile aleatorii, deoarece cercetătorul nu poate prezice dinainte ce număr va corespunde unui anumit obiect.

Pentru a selecta unul sau altul algoritm pentru descrierea și prelucrarea inițială a datelor experimentale, este important să se poată determina tipul de variabilă aleatoare: discretă, continuă sau mixtă.

Variabilele aleatoare discrete sunt descrise printr-o serie de variații discrete și forma sa grafică - un poligon de frecvență.

Variabilele aleatoare mixte și continue sunt descrise printr-o serie de variații de interval și forma sa grafică - o histogramă.

La compararea mai multor eșantioane în funcție de nivelul generat al unei anumite proprietăți, se folosesc caracteristicile numerice medii și caracteristicile numerice ale împrăștierii unei variabile aleatoare în raport cu media.

Atunci când se calculează caracteristica medie, este important să se selecteze corect tipul de caracteristică medie care este adecvat domeniului său de aplicare. Valorile medii structurale, mod și mediană, caracterizează structura locației variantei într-o matrice ordonată de date experimentale. Media cantitativă face posibilă aprecierea mărimii medii a opțiunii (media eșantionului).

Pentru a calcula caracteristicile numerice ale împrăștierii - varianța eșantionului, abaterea standard și coeficientul de variație - metoda tabelară este eficientă.

Caracteristicile de poziție descriu centrul distribuției. În același timp, semnificațiile opțiunii pot fi grupate în jurul acesteia atât într-o bandă largă, cât și îngustă. Prin urmare, pentru a descrie distribuția, este necesar să se caracterizeze intervalul de modificări ale valorilor caracteristicii. Caracteristicile de împrăștiere sunt folosite pentru a descrie intervalul de variație al unei caracteristici. Cele mai utilizate sunt intervalul de variație, dispersia, abaterea standard și coeficientul de variație.

Gama de variație este definită ca diferența dintre valoarea maximă și minimă a unei caracteristici din populația studiată:

R=X max - X min.

Avantajul evident al indicatorului luat în considerare este simplitatea calculului. Cu toate acestea, deoarece domeniul de variație depinde de valorile doar ale valorilor extreme ale caracteristicii, domeniul de aplicare a acesteia este limitat la distribuții destul de omogene. În alte cazuri, conținutul de informații al acestui indicator este foarte mic, deoarece există multe distribuții care sunt foarte diferite ca formă, dar au același interval. În studiile practice, intervalul de variație este uneori utilizat cu dimensiuni mici (nu mai mult de 10) eșantion. De exemplu, din gama de variații este ușor de evaluat cât de diferite sunt cele mai bune și cele mai proaste rezultate la un grup de sportivi.

În acest exemplu:

R=16,36 – 13,04=3,32 (m).

A doua caracteristică a împrăștierii este dispersie. Dispersia este pătratul mediu al abaterii unei variabile aleatoare de la media ei. Dispersia este o caracteristică a împrăștierii, răspândirea valorilor unei cantități în jurul valorii sale medii. Cuvântul „dispersie” în sine înseamnă „împrăștiere”.

Atunci când se efectuează studii prin eșantion, este necesar să se stabilească o estimare a varianței. Varianța calculată din datele eșantionului se numește varianță eșantionului și se notează S 2 .

La prima vedere, cea mai naturală estimare a varianței este varianța statistică, calculată pe baza definiției folosind formula:

În această formulă - suma abaterilor pătrate ale valorilor atributelor x i din media aritmetică . Pentru a obține deviația pătrată medie, această sumă este împărțită la dimensiunea eșantionului P.

Cu toate acestea, o astfel de estimare nu este imparțială. Se poate demonstra că suma abaterilor pătrate ale valorilor atributelor pentru o medie aritmetică eșantion este mai mică decât suma abaterilor pătrate de la orice altă valoare, inclusiv de la media adevărată (așteptările matematice). Prin urmare, rezultatul obținut din formula de mai sus va conține o eroare sistematică, iar valoarea estimată a varianței va fi subestimată. Pentru a elimina părtinirea, este suficient să introduceți un factor de corecție. Rezultatul este următoarea relație pentru varianța estimată:

Pentru valori mari n Desigur, ambele estimări - părtinitoare și nepărtinitoare - vor diferi foarte puțin și introducerea unui factor de corecție devine lipsită de sens. De regulă, formula pentru estimarea varianței ar trebui să fie rafinată când n<30.

În cazul datelor grupate, ultima formulă poate fi redusă la următoarea formă pentru a simplifica calculele:

Unde k- numărul de intervale de grupare;

n i- frecvența intervalului cu număr i;

x i- valoarea mediană a intervalului cu număr i.

De exemplu, să calculăm varianța pentru datele grupate ale exemplului pe care îl analizăm (a se vedea tabelul 4.):

S 2 =/ 28=0,5473 (m2).

Varianta unei variabile aleatoare are dimensiunea pătratului dimensiunii variabilei aleatoare, ceea ce face dificilă interpretarea și nu o face foarte clară. Pentru o descriere mai vizuală a împrăștierii, este mai convenabil să folosiți o caracteristică a cărei dimensiune coincide cu dimensiunea caracteristicii studiate. În acest scop, este introdus conceptul deviație standard(sau deviație standard).

Deviație standard se numește rădăcina pătrată pozitivă a varianței:

În exemplul nostru, abaterea standard este egală cu

Abaterea standard are aceleasi unitati de masura ca si rezultatele masurarii caracteristicii studiate si, astfel, caracterizeaza gradul de abatere a caracteristicii fata de media aritmetica. Cu alte cuvinte, arată cum se află partea principală a opțiunii în raport cu media aritmetică.

Abaterea standard și varianța sunt cele mai utilizate măsuri de variație. Acest lucru se datorează faptului că sunt incluse într-o parte semnificativă a teoremelor teoriei probabilităților, care servește drept fundament al statisticii matematice. În plus, varianța poate fi descompusă în elementele sale componente, ceea ce face posibilă evaluarea influenței diferiților factori asupra variației trăsăturii studiate.

Pe lângă indicatorii absoluti de variație, care sunt dispersia și abaterea standard, în statistică sunt introduși și cei relativi. Cel mai des este folosit coeficientul de variație. Coeficientul de variație egal cu raportul dintre abaterea standard și media aritmetică, exprimat ca procent:

Din definiție reiese clar că, în sensul său, coeficientul de variație este o măsură relativă a dispersiei unei caracteristici.

Pentru exemplul în cauză:

Coeficientul de variație este utilizat pe scară largă în cercetarea statistică. Fiind o valoare relativă, vă permite să comparați variabilitatea ambelor caracteristici care au unități de măsură diferite, precum și aceeași caracteristică în mai multe populații diferite cu valori diferite ale mediei aritmetice.

Coeficientul de variație este utilizat pentru a caracteriza omogenitatea datelor experimentale obținute. În practica culturii fizice și sportului, răspândirea rezultatelor măsurătorilor în funcție de valoarea coeficientului de variație este considerată a fi mică (V<10%), средним (11-20%) и большим (V> 20%).

Restricțiile privind utilizarea coeficientului de variație sunt asociate cu natura sa relativă - definiția conține normalizarea la media aritmetică. În acest sens, la valori absolute mici ale mediei aritmetice, coeficientul de variație își poate pierde conținutul informațional. Cu cât media aritmetică este mai aproape de zero, cu atât acest indicator devine mai puțin informativ. În cazul limitativ, media aritmetică merge la zero (de exemplu, temperatura), iar coeficientul de variație merge la infinit, indiferent de răspândirea caracteristicii. Prin analogie cu cazul erorii, se poate formula următoarea regulă. Dacă valoarea mediei aritmetice din eșantion este mai mare de unu, atunci utilizarea coeficientului de variație este legală; în caz contrar, dispersia și abaterea standard ar trebui utilizate pentru a descrie răspândirea datelor experimentale.

În încheierea acestei părți, vom lua în considerare evaluarea variațiilor în valorile caracteristicilor de evaluare. După cum sa menționat deja, valorile caracteristicilor de distribuție calculate din datele experimentale nu coincid cu valorile lor adevărate pentru populația generală. Nu este posibil să se stabilească cu exactitate pe acesta din urmă, deoarece, de regulă, este imposibil să se studieze întreaga populație. Dacă folosim rezultatele diferitelor eșantioane din aceeași populație pentru a estima parametrii de distribuție, se dovedește că aceste estimări pentru diferite eșantioane diferă unele de altele. Valorile estimate fluctuează în jurul valorii lor adevărate.

Abaterile estimărilor parametrilor generali de la valorile adevărate ale acestor parametri se numesc erori statistice. Motivul apariției lor este dimensiunea limitată a eșantionului - nu toate obiectele din populația generală sunt incluse în acesta. Pentru a estima amploarea erorilor statistice, se utilizează abaterea standard a caracteristicilor eșantionului.

Ca exemplu, luați în considerare cea mai importantă caracteristică a poziției - media aritmetică. Se poate demonstra că abaterea standard a mediei aritmetice este determinată de relația:

Unde σ - abaterea standard pentru populatie.

Deoarece valoarea adevărată a abaterii standard nu este cunoscută, o cantitate numită eroarea standard a mediei aritmetice si egal:

Valoarea caracterizează eroarea care, în medie, este permisă la înlocuirea mediei generale cu estimarea eșantionului acesteia. Conform formulei, creșterea dimensiunii eșantionului în timpul unui studiu duce la o scădere a erorii standard proporțional cu rădăcina pătrată a dimensiunii eșantionului.

Pentru exemplul luat în considerare, eroarea standard a mediei aritmetice este egală cu . În cazul nostru, sa dovedit a fi de 5,4 ori mai mică decât abaterea standard.

    SUPRAFAȚA (AREA) EFICIENTĂ DE împrăștiere- caracteristică reflectivității țintei, exprimată prin raportul puterii electrice. mag. energia reflectată de țintă în direcția receptorului către densitatea fluxului de energie de suprafață incidentă pe țintă. Depinde de… … Enciclopedia forțelor strategice de rachete

    Mecanica cuantică... Wikipedia

    - (EPR) caracteristică reflectivității unei ținte iradiate de unde electromagnetice. Valoarea EPR este definită ca raportul dintre debitul (puterea) energiei electromagnetice reflectată de țintă în direcția echipamentului radio-electronic (RES) față de... ... Dicționar marin

    bandă de împrăștiere- Caracteristicile statistice ale datelor experimentale, reflectând abaterea acestora de la valoarea medie. Subiecte: metalurgie în general EN bandă disperată... Ghidul tehnic al traducătorului

    - (funcție de transfer de modulare), funcție, cu ajutorul tăieturii se evaluează proprietățile de „sharpness” ale lentilelor optice de imagistică. sisteme și dept. elemente ale unor astfel de sisteme. Ch.k.x. este așa-numita transformată Fourier. funcția de împrăștiere a liniilor care descrie natura „împrăștierii”... ... Enciclopedie fizică

    Funcția de transfer de modulare, o funcție care evaluează proprietățile de „claritate” ale sistemelor optice de imagistică și ale elementelor individuale ale unor astfel de sisteme (a se vedea, de exemplu, Claritatea unei imagini fotografice). Ch.k.x. exista Fourier......

    bandă de împrăștiere- caracteristica statistică a datelor experimentale, reflectând abaterea acestora de la valoarea medie. Vezi și: dungă de alunecare, dungă de scurgere, dungă de întărire... Dicţionar enciclopedic de metalurgie

    BANDA DE împrăștiere- caracteristica statistică a datelor experimentale, care reflectă abaterea acestora de la valoarea medie... Dictionar metalurgic

    Caracteristicile împrăștierii valorilor variabilelor aleatoare. M. t. h este legată de abaterea pătrată (vezi Abaterea pătrată) σ prin formula Această metodă de măsurare a împrăștierii se explică prin faptul că în cazul normalului ... ... Marea Enciclopedie Sovietică

    STATISTICA VARIAȚIILOR- STATISTICA VARIAȚIUNILOR, termen care unește un grup de tehnici de analiză statistică utilizate în principal în științele naturii. În a doua jumătate a secolului al XIX-lea. Quetelet, „Anthro pometrie ou mesure des differentes facultes de 1... ... Marea Enciclopedie Medicală

    Valorea estimata- (Media populației) Așteptarea matematică este distribuția probabilității unei variabile aleatoare.Așteptări matematice, definiție, așteptări matematice ale variabilelor aleatoare discrete și continue, eșantion, așteptare condiționată, calcul,... ... Enciclopedia investitorilor

Unul dintre motivele efectuării analizei statistice este necesitatea de a lua în considerare influența factorilor aleatori (perturbații) asupra indicatorului studiat, care duc la împrăștierea (împrăștierea) datelor. Rezolvarea problemelor în care există date împrăștiate este asociată cu risc, deoarece chiar dacă utilizați toate informațiile disponibile, nu puteți exact prezice ce se va întâmpla în viitor. Pentru a face față în mod adecvat unor astfel de situații, este recomandabil să înțelegeți natura riscului și să puteți determina gradul de dispersie a unui set de date. Există trei caracteristici numerice care descriu măsura dispersiei: abaterea standard, intervalul și coeficientul de variație (variabilitate). Spre deosebire de indicatorii tipici (medie, mediană, mod) care caracterizează centrul, se arată caracteristicile de împrăștiere cat de aproape Valorile individuale ale setului de date sunt situate spre acest centru
Definiţia standard deviation Deviație standard(abaterea standard) este o măsură a abaterilor aleatorii ale valorilor datelor de la medie. În viața reală, majoritatea datelor sunt caracterizate prin împrăștiere, adică valorile individuale sunt situate la o oarecare distanță de medie.
Este imposibil să se utilizeze abaterea standard ca o caracteristică generală a împrăștierii prin simpla medie a abaterilor datelor, deoarece o parte a abaterilor va fi pozitivă, iar cealaltă parte va fi negativă și, ca urmare, rezultatul medierii poate fi egal cu zero. Pentru a scăpa de semnul negativ, folosește tehnica standard: mai întâi calculează dispersie ca suma abaterilor pătrate împărțită la ( n–1), iar apoi rădăcina pătrată este luată din valoarea rezultată. Formula de calcul a abaterii standard este următoarea: Nota 1: Varianta nu transmite nicio informație suplimentară față de abaterea standard, dar este mai dificil de interpretat deoarece este exprimată în „unități la pătrat”, în timp ce abaterea standard este exprimată în unități cunoscute nouă (de exemplu, dolari). Nota 2: Formula de mai sus este pentru calcularea abaterii standard a unui eșantion și este numită mai precis abaterea standard a probei. La calcularea abaterii standard populatie(notat cu simbolul s) împărțire cu n. Valoarea deviației standard a eșantionului este puțin mai mare (deoarece este împărțită la n–1), care oferă o corecție pentru caracterul aleatoriu al eșantionului în sine. Când setul de date este distribuit în mod normal, abaterea standard capătă o semnificație specială. În figura de mai jos, marcajele sunt făcute de fiecare parte a mediei la distanțe de una, două și, respectiv, trei abateri standard. Figura arată că aproximativ 66,7% (două treimi) din toate valorile se încadrează într-o abatere standard de fiecare parte a mediei, 95% dintre valori se încadrează în două abateri standard ale mediei și aproape toate datele (99,7%) se vor situa în trei abateri standard de la medie.
66,7%


Această proprietate a abaterii standard pentru datele distribuite normal se numește „regula celor două treimi”.

În unele situații, cum ar fi analiza controlului calității produselor, limitele sunt adesea stabilite astfel încât acele observații (0,3%) care sunt mai mult de trei abateri standard de la medie sunt considerate o problemă demnă.

Din păcate, dacă datele nu urmează o distribuție normală, atunci regula descrisă mai sus nu poate fi aplicată.

Există în prezent o constrângere numită regula lui Chebyshev care poate fi aplicată distribuțiilor asimetrice (asimetrice).

Generați set de date inițiale de SV

În tabelul 1 este prezentată dinamica modificărilor profitului zilnic la bursă, înregistrate în zile lucrătoare pentru perioada 31 iulie - 9 octombrie 1987.

Tabelul 1. Dinamica modificărilor profitului zilnic la bursă

Data Profit zilnic Data Profit zilnic Data Profit zilnic
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Lansați Excel
Creați fișier Faceți clic pe butonul Salvare din bara de instrumente Standard. Deschideți folderul Statistics în caseta de dialog care apare și denumiți fișierul Scattering Characteristics.xls.
Setați eticheta 6. Pe Sheet1, în celula A1, setați eticheta Daily Profit, 7. iar în intervalul A2:A49, introduceți datele din Tabelul 1.
Setați funcția VALOARE MEDIE 8. În celula D1, introduceți eticheta Media. În celula D2, calculați media folosind funcția statistică MEDIE.
Setați funcția STANDARDEV În celula D4, introduceți eticheta Abatere standard. În celula D5, calculați abaterea standard utilizând funcția statistică STDEV
Reduceți dimensiunea biților a rezultatului la a patra zecimală.
Interpretarea rezultatelor Declin Profitul mediu zilnic a fost de 0,04% (profitul mediu zilnic a fost -0,0004). Aceasta înseamnă că profitul zilnic mediu pentru perioada în cauză a fost de aproximativ zero, adică. piața a menținut o rată medie. Abaterea standard s-a dovedit a fi 0,0118. Aceasta înseamnă că un dolar (1 USD) investit în piața de valori s-a modificat în medie cu 0,0118 USD pe zi, adică investiția sa ar putea avea ca rezultat un câștig sau o pierdere de 0,0118 USD.
Să verificăm dacă valorile profitului zilnic prezentate în tabelul 1 corespund regulilor de distribuție normală 1. Calculați intervalul corespunzător unei abateri standard de fiecare parte a mediei. 2. În celulele D7, D8 și F8, setați etichetele, respectiv: O abatere standard, Limită inferioară, Limită superioară. 3. În celula D9, introduceți formula = -0,0004 – 0,0118, iar în celula F9, introduceți formula = -0,0004 + 0,0118. 4. Obțineți rezultatul cu precizie până la a patra zecimală.

5. Determinați numărul de valori zilnice a profitului care se află într-o abatere standard. Mai întâi, filtrați datele, lăsând valorile profitului zilnic în intervalul [-0,0121, 0,0114]. Pentru a face acest lucru, selectați orice celulă din coloana A cu valorile profitului zilnic și rulați comanda:

Data®Filter®AutoFilter

Deschideți meniul făcând clic pe săgeata din antet Profit zilnic, și selectați (Condiție...). În caseta de dialog Custom AutoFilter, setați opțiunile așa cum se arată mai jos. Faceți clic pe OK.

Pentru a număra numărul de date filtrate, selectați intervalul de valori zilnice a profitului, faceți clic dreapta pe un spațiu gol din bara de stare și selectați Număr de valori din meniul contextual. Citiți rezultatul. Acum afișați toate datele originale rulând comanda: Data®Filter®Display All și dezactivați autofiltrul folosind comanda: Data®Filter®AutoFilter.

6. Calculați procentul valorilor profitului zilnic care sunt la o abatere standard de la medie. Pentru a face acest lucru, puneți eticheta în celula H8 La sută, iar în celula H9 programați formula pentru calcularea procentului și obțineți rezultatul precis cu o zecimală.

7. Calculați intervalul de valori zilnice a profitului cu două abateri standard de la medie. În celulele D11, D12 și F12, setați etichetele în consecință: Două abateri standard, Concluzie, Limita superioară. Introduceți formulele de calcul în celulele D13 și F13 și obțineți rezultatul precis până la a patra zecimală.

8. Determinați numărul de valori zilnice a profitului care se află în două abateri standard prin filtrarea mai întâi a datelor.

9. Calculați procentul valorilor profitului zilnic care sunt la două abateri standard de la medie. Pentru a face acest lucru, puneți eticheta în celula H12 La sută, iar în celula H13 programați formula de calcul procentual și obțineți rezultatul precis cu o zecimală.

10. Calculați intervalul de valori zilnice a profitului în cadrul a trei abateri standard de la medie. În celulele D15, D16 și F16, setați etichetele în consecință: Trei abateri standard, Concluzie, Limita superioară. Introduceți formulele de calcul în celulele D17 și F17 și obțineți rezultatul precis până la a patra zecimală.

11. Determinați numărul de valori zilnice a profitului care se află în trei abateri standard prin filtrarea mai întâi a datelor. Calculați procentul valorilor profitului zilnic. Pentru a face acest lucru, puneți eticheta în celula H16 La sută, iar în celula H17 programați formula pentru calcularea procentului și obțineți rezultatul precis cu o zecimală.

13. Construiți o histogramă a randamentelor zilnice ale acțiunilor la bursă și plasați-o împreună cu tabelul de distribuție a frecvenței în zona J1:S20. Arată pe histogramă media aproximativă și intervalele corespunzătoare la una, două și, respectiv, trei abateri standard de la medie.

Caracteristici de împrăștiere

Măsuri de dispersie a probelor.

Minimul și maximul eșantionului sunt, respectiv, cele mai mici și cele mai mari valori ale variabilei studiate. Se numește diferența dintre maxim și minim domeniul de aplicare mostre. Toate datele eșantionului sunt situate între minim și maxim. Acești indicatori par să contureze limitele eșantionului.

R№1= 15,6-10=5,6

R nr. 2 = 0,85-0,6 = 0,25

Varianta eșantionului(Engleză) varianţă) Și deviație standard mostre (engleză) deviație standard) sunt o măsură a variabilității unei variabile și caracterizează gradul de împrăștiere a datelor în jurul centrului. În acest caz, abaterea standard este un indicator mai convenabil datorită faptului că are aceeași dimensiune cu datele efective studiate. Prin urmare, indicatorul abaterii standard este utilizat împreună cu media aritmetică a eșantionului pentru a descrie pe scurt rezultatele analizei datelor.

Este mai convenabil să se calculeze varianța eșantionului folosind formula:

Abaterea standard se calculează folosind formula:

Coeficientul de variație este o măsură relativă a dispersiei unei trăsături.

Coeficientul de variație este folosit și ca indicator al omogenității observațiilor eșantionului. Se crede că, dacă coeficientul de variație nu depășește 10%, atunci eșantionul poate fi considerat omogen, adică obținut dintr-o populație generală.

Deoarece coeficientul de variație este în ambele probe, acestea sunt omogene.

Eșantionul poate fi prezentat analitic sub forma unei funcții de distribuție, precum și sub forma unui tabel de frecvență format din două linii. În linia de sus se află elementele de selecție (opțiuni), dispuse în ordine crescătoare; Frecvențele opțiunii sunt scrise în linia de jos.

Frecvența variantei este un număr egal cu numărul de repetări ale unei anumite variante din eșantion.

Eșantionul nr. 1 „Mame”

Tipul curbei de distribuție

Asimetrie sau coeficientul de asimetrie (un termen creat pentru prima dată de Pearson, 1895) este o măsură a asimetriei unei distribuții. Dacă asimetria este clar diferită de 0, distribuția este asimetrică, densitatea distribuției normale este simetrică față de medie.

Index asimetrie(Engleză) asimetrie) este folosit pentru a caracteriza gradul de simetrie a distribuției datelor în jurul centrului. Asimetria poate lua atât valori negative, cât și pozitive. O valoare pozitivă pentru acest parametru indică faptul că datele sunt deplasate la stânga centrului, iar o valoare negativă indică faptul că datele sunt deplasate la dreapta. Astfel, semnul indicelui de asimetrie indică direcția părtinirii datelor, în timp ce mărimea indică gradul acestei părtiniri. O asimetrie egală cu zero indică faptul că datele sunt concentrate simetric în jurul centrului.

Deoarece asimetria este pozitivă, prin urmare, vârful curbei se deplasează la stânga centrului.

Coeficientul de kurtoză(Engleză) curtoză) este o caracteristică a cât de aproape este grupată cea mai mare parte a datelor în jurul centrului.

Cu o curtoză pozitivă, curba se ascuți, cu o kurtoză negativă, se netezește.

Curba este aplatizată;

Curba se accentuează.