Karakteristikat e shpërndarjes. Karakteristikat e shpërndarjes Dispersioni dhe vetitë e tij Pabarazia e Chebyshev Karakteristikat e pozicionit dhe shpërndarjes

Pavarësisht se sa të rëndësishme janë karakteristikat mesatare, një karakteristikë po aq e rëndësishme e një grupi të dhënash numerike është sjellja e anëtarëve të mbetur të grupit në lidhje me mesataren, sa ndryshojnë nga mesatarja, sa anëtarë të grupit ndryshojnë. dukshëm nga mesatarja. Gjatë stërvitjes së gjuajtjes ata flasin për saktësinë e rezultateve në statistikë ata studiojnë karakteristikat e dispersionit (përhapjes).

Diferenca ndërmjet çdo vlere të x dhe vlerës mesatare të x quhet devijimi dhe llogaritet si diferencë x, - x. Në këtë rast, devijimi mund të marrë të dyja vlerat pozitive nëse numri është më i madh se mesatarja, dhe vlerat negative nëse numri është më i vogël se mesatarja. Megjithatë, në statistika shpesh është e rëndësishme të jesh në gjendje të operosh me një numër që karakterizon "saktësinë" e të gjithë elementëve numerikë të një grupi të dhënash. Çdo përmbledhje e të gjitha devijimeve të anëtarëve të grupit do të çojë në zero, pasi devijimet pozitive dhe negative do të anulojnë njëra-tjetrën. Për të shmangur zeroizimin, diferencat në katror, ​​ose më saktë, mesatarja aritmetike e devijimeve në katror, ​​përdoren për të karakterizuar shpërndarjen. Kjo karakteristikë e shpërndarjes quhet varianca e mostrës.

Sa më i madh të jetë varianca, aq më i madh është shpërndarja e vlerave të ndryshores së rastit. Për të llogaritur shpërndarjen, përdoret një vlerë e përafërt e mesatares së mostrës x me një diferencë prej një shifre në lidhje me të gjithë anëtarët e grupit të të dhënave. Përndryshe, kur mblidhni një numër të madh vlerash të përafërta, do të grumbullohet një gabim i rëndësishëm. Në lidhje me dimensionalitetin e vlerave numerike, duhet të theksohet një pengesë e një treguesi të tillë dispersioni si shpërndarja e mostrës: njësia e matjes së shpërndarjes D është katrori i njësisë matëse të vlerave X, karakteristikë e të cilit është dispersioni. Për të hequr qafe këtë pengesë, statistikat prezantuan një karakteristikë të tillë shpërndarjeje si devijimi standard i mostrës , e cila shënohet me simbolin A (lexo "sigma") dhe llogaritet duke përdorur formulën

Normalisht, më shumë se gjysma e anëtarëve të grupit të të dhënave ndryshojnë nga mesatarja me më pak se devijimi standard, d.m.th. i përkasin segmentit [X - A; x + a]. Përndryshe thonë: mesatarja, duke marrë parasysh përhapjen e të dhënave, është e barabartë me x ± a.

Futja e një karakteristike tjetër të shpërndarjes shoqërohet me dimensionin e anëtarëve të grupit të të dhënave. Të gjitha karakteristikat numerike në statistika janë paraqitur me qëllim të krahasimit të rezultateve të studimit të vargjeve të ndryshme numerike që karakterizojnë variabla të ndryshëm të rastësishëm. Sidoqoftë, krahasimi i devijimeve standarde nga vlera mesatare të ndryshme të grupeve të ndryshme të të dhënave nuk është tregues, veçanërisht nëse dimensionet e këtyre sasive janë gjithashtu të ndryshme. Për shembull, nëse krahasohen gjatësia dhe pesha e ndonjë objekti ose shpërndarja në prodhimin e mikro- dhe makro-produkteve. Në lidhje me konsideratat e mësipërme, futet një karakteristikë relative e shpërndarjes, e cila quhet koeficienti i variacionit dhe llogaritet me formulë

Për të llogaritur karakteristikat numerike të shpërndarjes së vlerave të ndryshoreve të rastësishme, është e përshtatshme të përdoret një tabelë (Tabela 6.9).

Tabela 6.9

Llogaritja e karakteristikave numerike të shpërndarjes së vlerave të ndryshoreve të rastësishme

Xj- X

(Xj-X)2/

Mesatarja e mostrës është në proces të plotësimit të kësaj tabele. X, i cili do të përdoret në dy forma në të ardhmen. Si një karakteristikë mesatare përfundimtare (për shembull, në kolonën e tretë të tabelës) mostra mesatare X duhet të rrumbullakoset në shifrën që korrespondon me shifrën më të vogël të çdo anëtari të grupit të të dhënave numerike x g Sidoqoftë, ky tregues përdoret në tabelë për llogaritjet e mëtejshme, dhe në këtë situatë, përkatësisht kur llogaritet në kolonën e katërt të tabelës, mesatarja e mostrës X duhet të rrumbullakoset me një diferencë prej një shifre në lidhje me shifrën më të vogël të çdo anëtari të grupit të të dhënave numerike X (.

Rezultati i llogaritjeve duke përdorur një tabelë si tabelë. 6.9 do të marrë vlerën e dispersionit të mostrës dhe për të regjistruar përgjigjen është e nevojshme, bazuar në vlerën e dispersionit të mostrës, të llogaritet vlera e devijimit standard a.

Përgjigja tregon: a) rezultatin mesatar duke marrë parasysh përhapjen e të dhënave në formular x±o; b) karakteristikë e stabilitetit të të dhënave V. Përgjigja duhet të vlerësojë cilësinë e koeficientit të variacionit: i mirë apo i keq.

Koeficienti i pranueshëm i variacionit si tregues i homogjenitetit ose qëndrueshmërisë së rezultateve në kërkimet sportive konsiderohet të jetë 10-15%. Koeficienti i variacionit V= 20% në çdo hulumtim konsiderohet një shifër shumë e madhe. Nëse madhësia e kampionit P> 25, atëherë V> 32% është një tregues shumë i keq.

Për shembull, për një seri variacion diskrete 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 tavolina 6.9 do të plotësohet si më poshtë (Tabela 6.10).

Tabela 6.10

Një shembull i llogaritjes së karakteristikave numerike të shpërndarjes së vlerave

*1

fi

1

L P 25 = 2,92 = 2,9

D_S_47.6_ P 25

Përgjigju: a) karakteristika mesatare, duke marrë parasysh përhapjen e të dhënave, është e barabartë me X± a = = 3 ± 1,4; b) qëndrueshmëria e matjeve të marra është në nivel të ulët, që nga koeficienti i variacionit V = 48% > 32%.

Analog i tabelës 6.9 mund të përdoret gjithashtu për të llogaritur karakteristikat e shpërndarjes së një serie variacionesh intervali. Në të njëjtën kohë, opsionet x g do të zëvendësohen nga përfaqësuesit e boshllëqeve x v ja opsioni i frekuencave absolute f(- në frekuenca absolute të intervaleve fv

Bazuar në sa më sipër, mund të bëhet sa vijon: konkluzionet.

Përfundimet e statistikave matematikore janë të besueshme nëse përpunohet informacioni për fenomenet masive.

Në mënyrë tipike, një mostër studiohet nga popullata e përgjithshme e objekteve, e cila duhet të jetë përfaqësuese.

Të dhënat eksperimentale të marra si rezultat i studimit të ndonjë vetie të objekteve të mostrës përfaqësojnë vlerën e një ndryshoreje të rastësishme, pasi studiuesi nuk mund të parashikojë paraprakisht se cili numër do të korrespondojë me një objekt të caktuar.

Për të zgjedhur një ose një algoritëm tjetër për përshkrimin dhe fillimin e përpunimit të të dhënave eksperimentale, është e rëndësishme të jeni në gjendje të përcaktoni llojin e ndryshores së rastësishme: diskrete, e vazhdueshme ose e përzier.

Variablat diskrete të rastësishme përshkruhen nga një seri variacionesh diskrete dhe forma e saj grafike - një poligon i frekuencës.

Ndryshoret e rastësishme të përziera dhe të vazhdueshme përshkruhen nga një seri variacionesh intervali dhe forma e saj grafike - një histogram.

Kur krahasohen disa mostra sipas nivelit të gjeneruar të një vetie të caktuar, përdoren karakteristikat mesatare numerike dhe karakteristikat numerike të shpërndarjes së një ndryshoreje të rastësishme në raport me mesataren.

Kur llogaritni karakteristikën mesatare, është e rëndësishme të zgjidhni saktë llojin e karakteristikës mesatare që është adekuate për zonën e saj të aplikimit. Vlerat mesatare strukturore, mënyra dhe mediana, karakterizojnë strukturën e vendndodhjes së variantit në një grup të renditur të dhënash eksperimentale. Mesatarja sasiore bën të mundur gjykimin e madhësisë mesatare të opsionit (mesatarja e mostrës).

Për të llogaritur karakteristikat numerike të shpërndarjes - varianca e mostrës, devijimi standard dhe koeficienti i variacionit - metoda tabelare është efektive.

Karakteristikat e pozicionit përshkruajnë qendrën e shpërndarjes. Në të njëjtën kohë, kuptimet e opsionit mund të grupohen rreth tij në një brez të gjerë dhe të ngushtë. Prandaj, për të përshkruar shpërndarjen, është e nevojshme të karakterizohet diapazoni i ndryshimeve në vlerat e karakteristikës. Karakteristikat e shpërndarjes përdoren për të përshkruar gamën e variacionit të një karakteristike. Më të përdorurat janë diapazoni i variacionit, dispersioni, devijimi standard dhe koeficienti i variacionit.

Gama e variacionit përkufizohet si diferenca midis vlerës maksimale dhe minimale të një karakteristike në popullatën që studiohet:

R=x max - x min.

Avantazhi i dukshëm i treguesit në shqyrtim është thjeshtësia e llogaritjes. Sidoqoftë, meqenëse shtrirja e ndryshimit varet nga vlerat e vetëm vlerave ekstreme të karakteristikës, fusha e zbatimit të saj është e kufizuar në shpërndarje mjaft homogjene. Në raste të tjera, përmbajtja e informacionit të këtij treguesi është shumë e vogël, pasi ka shumë shpërndarje që janë shumë të ndryshme në formë, por kanë të njëjtin gamë. Në studimet praktike, diapazoni i variacionit përdoret ndonjëherë me madhësi të vogla (jo më shumë se 10) mostra. Për shembull, nga diapazoni i variacioneve është e lehtë të vlerësohet se sa të ndryshme janë rezultatet më të mira dhe më të këqija në një grup atletësh.

Në këtë shembull:

R=16,36 – 13,04=3,32 (m).

Karakteristika e dytë e shpërndarjes është dispersion. Dispersioni është katrori mesatar i devijimit të një ndryshoreje të rastësishme nga mesatarja e saj. Dispersioni është një karakteristikë e shpërndarjes, përhapjes së vlerave të një sasie rreth vlerës mesatare të saj. Vetë fjala "dispersion" do të thotë "shpërndarje".

Gjatë kryerjes së studimeve të mostrës, është e nevojshme të përcaktohet një vlerësim për variancën. Varianca e llogaritur nga të dhënat e mostrës quhet variancë e mostrës dhe shënohet S 2 .

Në pamje të parë, vlerësimi më i natyrshëm për variancën është varianca statistikore, e llogaritur në bazë të përkufizimit duke përdorur formulën:

Në këtë formulë - shuma e devijimeve në katror të vlerave të atributeve x i nga mesatarja aritmetike . Për të marrë devijimin mesatar katror, ​​kjo shumë pjesëtohet me madhësinë e kampionit P.

Megjithatë, një vlerësim i tillë nuk është i paanshëm. Mund të tregohet se shuma e devijimeve në katror të vlerave të atributeve për një mesatare aritmetike të mostrës është më e vogël se shuma e devijimeve në katror nga çdo vlerë tjetër, përfshirë nga mesatarja e vërtetë (pritshmëria matematikore). Prandaj, rezultati i marrë nga formula e mësipërme do të përmbajë një gabim sistematik, dhe vlera e vlerësuar e variancës do të nënvlerësohet. Për të eliminuar paragjykimin, mjafton të futni një faktor korrigjimi. Rezultati është marrëdhënia e mëposhtme për variancën e vlerësuar:

Për vlera të mëdha n Natyrisht, të dy vlerësimet - të njëanshme dhe të paanshme - do të ndryshojnë shumë pak dhe futja e një faktori korrigjues bëhet i pakuptimtë. Si rregull, formula për vlerësimin e variancës duhet të rafinohet kur n<30.

Në rastin e të dhënave të grupuara, formula e fundit mund të reduktohet në formën e mëposhtme për të thjeshtuar llogaritjet:

Ku k- numri i intervaleve të grupimit;

n i- frekuenca e intervalit me numër i;

x i- vlera mesatare e intervalit me numër i.

Si shembull, le të llogarisim variancën për të dhënat e grupuara të shembullit që po analizojmë (shih Tabelën 4.):

S 2 =/ 28=0,5473 (m2).

Varianca e një ndryshoreje të rastësishme ka dimensionin e katrorit të dimensionit të ndryshores së rastësishme, gjë që e bën të vështirë interpretimin dhe e bën atë jo shumë të qartë. Për një përshkrim më vizual të shpërndarjes, është më i përshtatshëm të përdoret një karakteristikë, dimensioni i së cilës përkon me dimensionin e karakteristikës që studiohet. Për këtë qëllim është paraqitur koncepti devijimi standard(ose devijimi standard).

Devijimi standard quhet rrënja katrore pozitive e variancës:

Në shembullin tonë, devijimi standard është i barabartë me

Devijimi standard ka të njëjtat njësi matëse si rezultatet e matjes së karakteristikës në studim dhe, në këtë mënyrë, karakterizon shkallën e devijimit të karakteristikës nga mesatarja aritmetike. Me fjalë të tjera, tregon se si ndodhet pjesa kryesore e opsionit në lidhje me mesataren aritmetike.

Devijimi standard dhe varianca janë masat më të përdorura të variacionit. Kjo për faktin se ato përfshihen në një pjesë të konsiderueshme të teoremave të teorisë së probabilitetit, e cila shërben si bazë e statistikave matematikore. Për më tepër, varianca mund të zbërthehet në elementët përbërës të tij, të cilët bëjnë të mundur vlerësimin e ndikimit të faktorëve të ndryshëm në variacionin e tiparit në studim.

Përveç treguesve absolutë të variacionit, të cilët janë dispersioni dhe devijimi standard, në statistika futen edhe ata relativë. Koeficienti i variacionit përdoret më shpesh. Koeficienti i variacionit e barabartë me raportin e devijimit standard me mesataren aritmetike, të shprehur në përqindje:

Nga përkufizimi është e qartë se, në kuptimin e tij, koeficienti i variacionit është një masë relative e shpërndarjes së një karakteristike.

Për shembullin në fjalë:

Koeficienti i variacionit përdoret gjerësisht në kërkimet statistikore. Duke qenë një vlerë relative, ju lejon të krahasoni ndryshueshmërinë e të dy karakteristikave që kanë njësi të ndryshme matëse, si dhe të njëjtën karakteristikë në disa popullata të ndryshme me vlera të ndryshme të mesatares aritmetike.

Koeficienti i variacionit përdoret për të karakterizuar homogjenitetin e të dhënave të marra eksperimentale. Në praktikën e kulturës fizike dhe sporteve, përhapja e rezultateve të matjes në varësi të vlerës së koeficientit të variacionit konsiderohet të jetë e vogël (V<10%), средним (11-20%) и большим (V> 20%).

Kufizimet në përdorimin e koeficientit të variacionit shoqërohen me natyrën e tij relative - përkufizimi përmban normalizim ndaj mesatares aritmetike. Në këtë drejtim, në vlera të vogla absolute të mesatares aritmetike, koeficienti i variacionit mund të humbasë përmbajtjen e tij të informacionit. Sa më afër zeros të jetë mesatarja aritmetike, aq më pak informativ bëhet ky tregues. Në rastin kufizues, mesatarja aritmetike shkon në zero (për shembull, temperatura) dhe koeficienti i variacionit shkon në pafundësi, pavarësisht nga përhapja e karakteristikës. Në analogji me rastin e gabimit, mund të formulohet rregulli i mëposhtëm. Nëse vlera e mesatares aritmetike në kampion është më e madhe se një, atëherë përdorimi i koeficientit të variacionit është i ligjshëm, përndryshe, dispersioni dhe devijimi standard duhet të përdoren për të përshkruar përhapjen e të dhënave eksperimentale.

Në përfundim të kësaj pjese, ne do të shqyrtojmë vlerësimin e variacioneve në vlerat e karakteristikave të vlerësimit. Siç është vërejtur tashmë, vlerat e karakteristikave të shpërndarjes të llogaritura nga të dhënat eksperimentale nuk përkojnë me vlerat e tyre të vërteta për popullatën e përgjithshme. Nuk është e mundur të përcaktohet me saktësi kjo e fundit, pasi, si rregull, është e pamundur të anketohet e gjithë popullata. Nëse përdorim rezultatet e mostrave të ndryshme nga e njëjta popullatë për të vlerësuar parametrat e shpërndarjes, rezulton se këto vlerësime për mostra të ndryshme ndryshojnë nga njëra-tjetra. Vlerat e vlerësuara luhaten rreth vlerave të tyre të vërteta.

Devijimet e vlerësimeve të parametrave të përgjithshëm nga vlerat e vërteta të këtyre parametrave quhen gabime statistikore. Arsyeja e shfaqjes së tyre është madhësia e kufizuar e mostrës - jo të gjitha objektet në popullatën e përgjithshme janë të përfshira në të. Për të vlerësuar madhësinë e gabimeve statistikore, përdoret devijimi standard i karakteristikave të mostrës.

Si shembull, merrni parasysh karakteristikën më të rëndësishme të pozicionit - mesataren aritmetike. Mund të tregohet se devijimi standard i mesatares aritmetike përcaktohet nga relacioni:

Ku σ - devijimi standard për popullsinë.

Meqenëse vlera e vërtetë e devijimit standard nuk dihet, një sasi quhet gabim standard i mesatares aritmetike dhe e barabartë:

Vlera karakterizon gabimin që, mesatarisht, lejohet kur zëvendësohet mesatarja e përgjithshme me vlerësimin e tij të mostrës. Sipas formulës, rritja e madhësisë së kampionit gjatë një studimi çon në një ulje të gabimit standard në raport me rrënjën katrore të madhësisë së kampionit.

Për shembullin në shqyrtim, gabimi standard i mesatares aritmetike është i barabartë me . Në rastin tonë, doli të ishte 5.4 herë më pak se devijimi standard.

    SIPËRFAQJA EFEKTIVE E SHPERNDARJES (ZONA)- karakteristikë e reflektimit të objektivit, e shprehur me raportin e fuqisë elektrike. mag. energjia e reflektuar nga objektivi në drejtim të marrësit në sipërfaqen e densitetit të fluksit të energjisë që bie në objektiv. Varet nga… … Enciklopedia e Forcave të Raketave Strategjike

    Mekanika kuantike ... Wikipedia

    - (EPR) karakteristikë e reflektimit të një objektivi të rrezatuar nga valët elektromagnetike. Vlera EPR përcaktohet si raporti i rrjedhës (fuqisë) së energjisë elektromagnetike të reflektuar nga objektivi në drejtim të pajisjes radio-elektronike (RES) me... ... Marine Dictionary

    brez shpërndarës- Karakteristikat statistikore të të dhënave eksperimentale, që pasqyrojnë devijimin e tyre nga vlera mesatare. Temat: metalurgjia në përgjithësi EN banda e dëshpëruar ... Udhëzues teknik i përkthyesit

    - (funksioni i transferimit të modulimit), funksioni, me ndihmën e prerjes vlerësohen vetitë e "mprehtësisë" së lenteve optike imazherike. sistemeve dhe deg. elementet e sistemeve të tilla. Ch.k.x. është i ashtuquajturi transformim Furier. Funksioni i shpërndarjes së vijës që përshkruan natyrën e "përhapjes"... ... Enciklopedi fizike

    Funksioni i transferimit të modulimit, një funksion që vlerëson vetitë e "mprehtësisë" së sistemeve optike të imazhit dhe elementeve individuale të sistemeve të tilla (shih, për shembull, mprehtësinë e një imazhi fotografik). Ch.k.x. aty eshte Furieri... ...

    brez shpërndarës- karakteristikë statistikore e të dhënave eksperimentale, që pasqyron devijimin e tyre nga vlera mesatare. Shihni gjithashtu: Shirit rrëshqitës Rrip lehtësim Shirit fortueshmërie... Fjalor Enciklopedik i Metalurgjisë

    BAND SHPERNDARJES- Karakteristika statistikore e të dhënave eksperimentale, që pasqyron devijimin e tyre nga vlera mesatare... Fjalori metalurgjik

    Karakteristikat e shpërndarjes së vlerave të ndryshoreve të rastësishme. M. h lidhet me devijimin katror (Shih devijimin katror) σ nga formula Kjo metodë e matjes së shpërndarjes shpjegohet me faktin se në rastin e normales ... ... Enciklopedia e Madhe Sovjetike

    STATISTIKAT E VARIACIONIT- STATISTIKA E VARIACIONIT, term që bashkon një grup teknikash të analizës statistikore të përdorura kryesisht në shkencat natyrore. Në gjysmën e dytë të shekullit të 19-të. Quetelet, “Anthro pometie ou mesure des differentes facultes de 1... ... Enciklopedia e Madhe Mjekësore

    Vlera e pritshme- (Mesatarja e popullsisë) Pritshmëria matematikore është shpërndarja e probabilitetit të një ndryshoreje të rastësishme Pritshmëria matematikore, përkufizimi, pritshmëria matematikore e ndryshoreve të rastësishme diskrete dhe të vazhdueshme, mostra, pritshmëria e kushtëzuar, llogaritja,... ... Enciklopedia e Investitorëve

Një nga arsyet e kryerjes së analizave statistikore është nevoja për të marrë parasysh ndikimin e faktorëve të rastësishëm (shqetësimeve) në treguesin në studim, të cilët çojnë në shpërndarje (shpërndarje) të të dhënave. Zgjidhja e problemeve në të cilat ka të dhëna të shpërndara shoqërohet me rrezik, pasi edhe nëse përdorni të gjithë informacionin në dispozicion, nuk mund të pikërisht parashikoni se çfarë do të ndodhë në të ardhmen. Për të trajtuar në mënyrë adekuate situata të tilla, këshillohet të kuptoni natyrën e rrezikut dhe të jeni në gjendje të përcaktoni shkallën e shpërndarjes së një grupi të dhënash. Ekzistojnë tre karakteristika numerike që përshkruajnë masën e dispersionit: devijimi standard, diapazoni dhe koeficienti i variacionit (ndryshueshmëria). Ndryshe nga treguesit tipikë (mesatarja, mesatarja, mënyra) që karakterizojnë qendrën, shfaqen karakteristikat e shpërndarjes sa afër Vlerat individuale të grupit të të dhënave janë të vendosura drejt kësaj qendre
Përkufizimi i devijimit standard Devijimi standard(devijimi standard) është një masë e devijimeve të rastësishme të vlerave të të dhënave nga mesatarja. Në jetën reale, shumica e të dhënave karakterizohen nga shpërndarja, d.m.th. vlerat individuale ndodhen në një distancë nga mesatarja.
Është e pamundur të përdoret devijimi standard si një karakteristikë e përgjithshme e shpërndarjes thjesht duke mesatarizuar devijimet e të dhënave, sepse një pjesë e devijimeve do të jetë pozitive, dhe pjesa tjetër do të jetë negative dhe, si rezultat, rezultati i mesatares mund të jetë i barabartë me zero. Për të hequr qafe shenjën negative, përdorni teknikën standarde: së pari llogaritni dispersion si shuma e devijimeve në katror të pjesëtuar me ( n–1), dhe më pas rrënja katrore merret nga vlera që rezulton. Formula për llogaritjen e devijimit standard është si më poshtë: Shënim 1: Varianca nuk përcjell asnjë informacion shtesë në krahasim me devijimin standard, por është më e vështirë të interpretohet sepse shprehet në "njësi në katror", ndërsa devijimi standard shprehet. në njësi të njohura për ne (për shembull, dollarë). Shënim 2: Formula e mësipërme është për llogaritjen e devijimit standard të një kampioni dhe quhet më saktë devijimi standard i mostrës. Gjatë llogaritjes së devijimit standard popullatë(shënohet me simbolin s) pjesëto me n. Vlera e devijimit standard të mostrës është pak më e madhe (pasi ndahet me n–1), i cili siguron një korrigjim për rastësinë e vetë kampionit. Kur grupi i të dhënave shpërndahet normalisht, devijimi standard merr një kuptim të veçantë. Në figurën më poshtë, shenjat janë bërë në të dyja anët e mesatares në distanca prej një, dy dhe tre devijime standarde, respektivisht. Shifra tregon se afërsisht 66.7% (dy të tretat) e të gjitha vlerave bien brenda një devijimi standard në të dyja anët e mesatares, 95% e vlerave bien brenda dy devijimeve standarde të mesatares dhe pothuajse të gjitha të dhënat. (99.7%) do të jetë brenda tre devijimeve standarde nga mesatarja.
66,7%


Kjo veti e devijimit standard për të dhënat e shpërndara normalisht quhet "rregulli i dy të tretave".

Në disa situata, të tilla si analiza e kontrollit të cilësisë së produktit, kufijtë shpesh vendosen të tillë që ato vëzhgime (0.3%) që janë më shumë se tre devijime standarde nga mesatarja konsiderohen një problem i vlefshëm.

Fatkeqësisht, nëse të dhënat nuk ndjekin një shpërndarje normale, atëherë rregulli i përshkruar më sipër nuk mund të zbatohet.

Aktualisht ekziston një kufizim i quajtur rregulli i Chebyshev që mund të zbatohet për shpërndarjet asimetrike (të shtrembëruara).

Gjeneroni të dhëna fillestare Set SV

Tabela 1 tregon dinamikën e ndryshimeve në fitimet ditore në bursë, të regjistruara në ditë pune për periudhën nga 31 korriku deri më 9 tetor 1987.

Tabela 1. Dinamika e ndryshimeve të fitimit ditor në bursë

datë Fitimi ditor datë Fitimi ditor datë Fitimi ditor
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Nis Excel
Krijo skedar Klikoni butonin Ruaj në shiritin e veglave Standard. Hapni dosjen Statistics në kutinë e dialogut që shfaqet dhe emërtoni skedarin Scattering Characteristics.xls.
Vendos etiketën 6. Në Fletën1, në qelizën A1, vendosni etiketën Fitimi ditor, 7. dhe në diapazonin A2:A49, vendosni të dhënat nga Tabela 1.
Cakto funksionin AVERAGE VALUE 8. Në qelizën D1, vendosni etiketën Mesatare. Në qelizën D2, llogaritni mesataren duke përdorur funksionin statistikor AVERAGE.
Vendosni funksionin STANDARDEV Në qelizën D4, vendosni etiketën Devijimi standard. Në qelizën D5, llogaritni devijimin standard duke përdorur funksionin statistikor STDEV
Zvogëloni madhësinë e bitit të rezultatit në numrin e katërt dhjetor.
Interpretimi i rezultateve Rënia Fitimi mesatar ditor ishte 0.04% (fitimi mesatar ditor ishte -0.0004). Kjo do të thotë se fitimi mesatar ditor për periudhën në shqyrtim ishte afërsisht zero, d.m.th. tregu ka ruajtur një normë mesatare. Devijimi standard doli të ishte 0.0118. Kjo do të thotë se një dollar (1$) i investuar në bursë ka ndryshuar mesatarisht me 0,0118$ në ditë, d.m.th. investimi i tij mund të rezultojë në një fitim ose humbje prej $0,0118.
Le të kontrollojmë nëse vlerat ditore të fitimit të dhëna në Tabelën 1 korrespondojnë me rregullat e shpërndarjes normale 1. Llogaritni intervalin që korrespondon me një devijim standard në të dyja anët e mesatares. 2. Në qelizat D7, D8 dhe F8, vendosni përkatësisht etiketat: Një devijim standard, kufi i poshtëm, kufi i sipërm. 3. Në qelizën D9, shkruani formulën = -0.0004 – 0.0118 dhe në qelizën F9 shkruani formulën = -0.0004 + 0.0118. 4. Merrni rezultatin të saktë në shifrën e katërt dhjetore.

5. Përcaktoni numrin e vlerave të fitimit ditor që janë brenda një devijimi standard. Fillimisht, filtroni të dhënat, duke lënë vlerat e fitimit ditor në intervalin [-0.0121, 0.0114]. Për ta bërë këtë, zgjidhni çdo qelizë në kolonën A me vlerat e fitimit ditor dhe ekzekutoni komandën:

Data®Filter®AutoFilter

Hapni menunë duke klikuar shigjetën në kokë Fitimi ditor, dhe zgjidhni (Kushti...). Në kutinë e dialogut Custom AutoFilter, vendosni opsionet siç tregohet më poshtë. Klikoni OK.

Për të numëruar numrin e të dhënave të filtruara, zgjidhni gamën e vlerave të fitimit ditor, kliko me të djathtën në një hapësirë ​​boshe në shiritin e statusit dhe zgjidhni Numri i vlerave nga menyja e kontekstit. Lexoni rezultatin. Tani shfaqni të gjitha të dhënat origjinale duke ekzekutuar komandën: Data®Filter®Display All dhe fikni filtrin automatik duke përdorur komandën: Data®Filter®AutoFilter.

6. Llogaritni përqindjen e vlerave të fitimit ditor që janë një devijim standard larg mesatares. Për ta bërë këtë, vendosni etiketën në qelizën H8 Përqindje, dhe në qelizën H9 programoni formulën për llogaritjen e përqindjes dhe merrni rezultatin të saktë në një shifër dhjetore.

7. Llogaritni diapazonin e vlerave të fitimit ditor brenda dy devijimeve standarde nga mesatarja. Në qelizat D11, D12 dhe F12, vendosni etiketat në përputhje me rrethanat: Dy devijime standarde, Fundi, Kufiri i sipërm. Futni formulat e llogaritjes në qelizat D13 dhe F13 dhe merrni rezultatin të saktë në numrin e katërt dhjetor.

8. Përcaktoni numrin e vlerave të fitimit ditor që janë brenda dy devijimeve standarde duke filtruar fillimisht të dhënat.

9. Llogaritni përqindjen e vlerave të fitimit ditor që janë dy devijime standarde larg mesatares. Për ta bërë këtë, vendosni etiketën në qelizën H12 Përqindje, dhe në qelizën H13 programoni formulën e llogaritjes së përqindjes dhe merrni rezultatin të saktë në një shifër dhjetore.

10. Llogaritni gamën e vlerave të fitimit ditor brenda tre devijimeve standarde nga mesatarja. Në qelizat D15, D16 dhe F16, vendosni etiketat në përputhje me rrethanat: Tre devijime standarde, Fundi, Kufiri i sipërm. Futni formulat e llogaritjes në qelizat D17 dhe F17 dhe merrni rezultatin të saktë në shifrën e katërt dhjetore.

11. Përcaktoni numrin e vlerave të fitimit ditor që janë brenda tre devijimeve standarde duke filtruar fillimisht të dhënat. Llogaritni përqindjen e vlerave të fitimit ditor. Për ta bërë këtë, vendosni etiketën në qelizën H16 Përqindje, dhe në qelizën H17 programoni formulën për llogaritjen e përqindjes dhe merrni rezultatin të saktë në një shifër dhjetore.

13. Ndërtoni një histogram të kthimeve ditore të aksioneve në bursë dhe vendoseni së bashku me tabelën e shpërndarjes së frekuencës në zonën J1:S20. Tregoni në histogram mesataren e përafërt dhe intervalet që korrespondojnë me një, dy dhe tre devijime standarde nga mesatarja, përkatësisht.

Karakteristikat e shpërndarjes

Masat e dispersionit të kampionimit.

Minimumi dhe maksimumi i kampionit janë, respektivisht, vlerat më të vogla dhe më të mëdha të ndryshores që studiohet. Diferenca midis maksimumit dhe minimumit quhet fushëveprimi mostrat. Të gjitha të dhënat e mostrës janë të vendosura midis minimumit dhe maksimumit. Këta tregues duket se përshkruajnë kufijtë e kampionit.

R№1= 15,6-10=5,6

R №2 =0,85-0,6=0,25

Varianca e mostrës(anglisht) variancë) Dhe devijimi standard mostra (anglisht) devijimi standard) janë një masë e ndryshueshmërisë së një ndryshoreje dhe karakterizojnë shkallën e shpërndarjes së të dhënave rreth qendrës. Në këtë rast, devijimi standard është një tregues më i përshtatshëm për faktin se ka të njëjtin dimension me të dhënat aktuale që studiohen. Prandaj, treguesi i devijimit standard përdoret së bashku me mesataren aritmetike të kampionit për të përshkruar shkurtimisht rezultatet e analizës së të dhënave.

Është më e përshtatshme për të llogaritur variancën e mostrës duke përdorur formulën:

Devijimi standard llogaritet duke përdorur formulën:

Koeficienti i variacionit është një masë relative e shpërndarjes së një tipari.

Koeficienti i variacionit përdoret gjithashtu si një tregues i homogjenitetit të vëzhgimeve të mostrës. Besohet se nëse koeficienti i variacionit nuk kalon 10%, atëherë kampioni mund të konsiderohet homogjen, d.m.th., i marrë nga një popullatë e përgjithshme.

Meqenëse koeficienti i variacionit është në të dy mostrat, ato janë homogjene.

Mostra mund të paraqitet në mënyrë analitike në formën e një funksioni të shpërndarjes, si dhe në formën e një tabele frekuence të përbërë nga dy rreshta. Në krye janë elementët e përzgjedhjes (opsionet), të renditura në rend rritës; Frekuencat e opsionit shkruhen në fund.

Frekuenca e variantit është një numër i barabartë me numrin e përsëritjeve të një varianti të caktuar në mostër.

Shembulli nr. 1 "Nënat"

Lloji i kurbës së shpërndarjes

Asimetria ose koeficienti i anshmërisë (një term i krijuar për herë të parë nga Pearson, 1895) është një masë e anshmërisë së një shpërndarjeje. Nëse anshmëria është qartësisht e ndryshme nga 0, shpërndarja është asimetrike, dendësia e shpërndarjes normale është simetrike me mesataren.

Indeksi asimetri(anglisht) shtrembërim) përdoret për të karakterizuar shkallën e simetrisë së shpërndarjes së të dhënave rreth qendrës. Asimetria mund të marrë vlera negative dhe pozitive. Një vlerë pozitive për këtë parametër tregon se të dhënat janë zhvendosur në të majtë të qendrës, dhe një vlerë negative tregon se të dhënat janë zhvendosur në të djathtë. Kështu, shenja e indeksit të anshmërisë tregon drejtimin e paragjykimit të të dhënave, ndërsa madhësia tregon shkallën e këtij paragjykimi. Shtrirja e barabartë me zero tregon se të dhënat janë të përqendruara në mënyrë simetrike rreth qendrës.

Sepse asimetria është pozitive, prandaj, maja e kurbës lëviz në të majtë të qendrës.

Koeficienti i kurtozës(anglisht) kurtosis) është një karakteristikë se sa ngushtë është grupuar pjesa më e madhe e të dhënave rreth qendrës.

Me një kurtozë pozitive, kurba mprehet, me një kurtozë negative, zbutet.

Lakorja është e rrafshuar;

Kurba mprehet.