Mga katangian ng scattering. Mga katangian ng scattering Dispersion at mga katangian nito Chebyshev's inequality Mga katangian ng posisyon at scattering

Gaano man kahalaga ang mga average na katangian, ang isang pantay na mahalagang katangian ng isang array ng numerical data ay ang pag-uugali ng natitirang mga miyembro ng array na may kaugnayan sa average, kung gaano sila naiiba mula sa average, kung gaano karaming mga miyembro ng array ang naiiba makabuluhang mula sa average. Sa panahon ng pagsasanay sa pagbaril, pinag-uusapan nila ang katumpakan ng mga resulta sa mga istatistika na pinag-aaralan nila ang mga katangian ng pagpapakalat (pagkalat).

Ang pagkakaiba sa pagitan ng anumang halaga ng x at ang average na halaga ng x ay tinatawag paglihis at kinakalkula bilang ang pagkakaiba x, - x. Sa kasong ito, ang paglihis ay maaaring tumagal ng parehong mga positibong halaga kung ang numero ay mas malaki kaysa sa average, at mga negatibong halaga kung ang numero ay mas mababa kaysa sa average. Gayunpaman, sa mga istatistika ay madalas na mahalaga na makapagpatakbo gamit ang isang numero na nagpapakilala sa "katumpakan" ng lahat ng mga numerical na elemento ng isang array ng data. Anumang pagsasama-sama ng lahat ng mga paglihis ng mga miyembro ng array ay hahantong sa zero, dahil ang mga positibo at negatibong mga paglihis ay magkakansela sa isa't isa. Upang maiwasan ang pag-zero, ang mga squared differences, o mas tiyak, ang arithmetic mean ng squared deviations, ay ginagamit upang makilala ang scattering. Ang ganitong katangian ng scattering ay tinatawag sample na pagkakaiba-iba.

Kung mas malaki ang pagkakaiba, mas malaki ang scattering ng mga random variable na halaga. Upang kalkulahin ang dispersion, isang tinatayang halaga ng sample mean x ang ginagamit na may margin na isang digit na nauugnay sa lahat ng miyembro ng array ng data. Kung hindi, kapag nagsusuma ng malaking bilang ng mga tinatayang halaga, isang malaking error ang maiipon. Kaugnay ng dimensyon ng mga numerical na halaga, dapat tandaan ang isang sagabal ng naturang dispersion indicator bilang sample variance: ang unit ng sukat ng variance D ay ang parisukat ng yunit ng pagsukat ng mga halaga X, na ang katangian ay dispersion. Upang mapupuksa ang disbentaha na ito, ipinakilala ng mga istatistika ang isang nakakalat na katangian bilang sample na standard deviation , na tinutukoy ng simbolo A (basahin ang "sigma") at kinakalkula gamit ang formula

Karaniwan, higit sa kalahati ng mga miyembro ng array ng data ay naiiba sa average ng mas mababa kaysa sa standard deviation, i.e. kabilang sa segment [X - A; x + a]. Kung hindi, sinasabi nila: ang average na tagapagpahiwatig, na isinasaalang-alang ang pagkalat ng data, ay katumbas ng x ± a.

Ang pagpapakilala ng isa pang katangian ng scattering ay nauugnay sa dimensyon ng mga miyembro ng array ng data. Ang lahat ng mga numerical na katangian sa mga istatistika ay ipinakilala para sa layunin ng paghahambing ng mga resulta ng pag-aaral ng iba't ibang mga numerical array na nagpapakilala sa iba't ibang mga random na variable. Gayunpaman, ang paghahambing ng mga karaniwang paglihis mula sa iba't ibang mga average na halaga ng iba't ibang mga set ng data ay hindi nagpapahiwatig, lalo na kung ang mga sukat ng mga dami na ito ay magkakaiba din. Halimbawa, kung ihahambing ang haba at bigat ng anumang bagay o pagkakalat sa paggawa ng mga micro- at macro-product. Kaugnay ng mga pagsasaalang-alang sa itaas, ang isang kamag-anak na katangian ng scattering ay ipinakilala, na tinatawag na koepisyent ng pagkakaiba-iba at kinakalkula ng formula

Upang kalkulahin ang mga numerical na katangian ng scattering ng mga random na variable na halaga, ito ay maginhawang gumamit ng isang talahanayan (Talahanayan 6.9).

Talahanayan 6.9

Pagkalkula ng mga numerical na katangian ng scattering ng random variable values

Xj- X

(Xj-X)2/

Sa proseso ng pagpuno sa talahanayang ito, matatagpuan ang sample mean X, na gagamitin sa dalawang anyo sa hinaharap. Bilang panghuling average na katangian (halimbawa, sa ikatlong hanay ng talahanayan) sample average X dapat na bilugan sa digit na katumbas ng pinakamaliit na digit ng sinumang miyembro ng numeric data array x g Gayunpaman, ang tagapagpahiwatig na ito ay ginagamit sa talahanayan para sa karagdagang mga kalkulasyon, at sa sitwasyong ito, lalo na kapag kinakalkula sa ikaapat na hanay ng talahanayan, ang average na sample X dapat bilugan na may margin na isang digit na may kaugnayan sa pinakamaliit na digit ng sinumang miyembro ng numeric data array X ( .

Ang resulta ng mga kalkulasyon gamit ang isang talahanayan tulad ng talahanayan. 6.9 ay makakakuha ng halaga ng sample dispersion, at upang maitala ang sagot na ito ay kinakailangan, batay sa halaga ng sample dispersion, upang kalkulahin ang halaga ng standard deviation a.

Ang sagot ay nagpapahiwatig ng: a) ang average na resulta na isinasaalang-alang ang pagkalat ng data sa form x±o; b) katangian ng katatagan ng data V. Dapat suriin ng sagot ang kalidad ng koepisyent ng pagkakaiba-iba: mabuti o masama.

Ang katanggap-tanggap na koepisyent ng pagkakaiba-iba bilang isang tagapagpahiwatig ng homogeneity o katatagan ng mga resulta sa pananaliksik sa palakasan ay itinuturing na 10-15%. Ang koepisyent ng pagkakaiba-iba V= 20% sa anumang pananaliksik ay itinuturing na isang napakalaking pigura. Kung ang laki ng sample P> 25, pagkatapos V> Ang 32% ay isang napakasamang tagapagpahiwatig.

Halimbawa, para sa isang discrete variation series 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 mesa 6.9 ay pupunan bilang mga sumusunod (Talahanayan 6.10).

Talahanayan 6.10

Isang halimbawa ng pagkalkula ng mga numerical na katangian ng scattering ng mga halaga

*1

fi

1

L P 25 = 2,92 = 2,9

D_S_47.6_ P 25

Sagot: a) ang average na katangian, na isinasaalang-alang ang pagkalat ng data, ay katumbas ng X± a = = 3 ± 1.4; b) ang katatagan ng mga nakuhang sukat ay nasa mababang antas, dahil ang koepisyent ng pagkakaiba-iba V = 48% > 32%.

Analogue ng mesa Magagamit din ang 6.9 upang kalkulahin ang mga katangian ng scattering ng isang serye ng pagkakaiba-iba ng pagitan. Kasabay nito, ang mga pagpipilian x g ay papalitan ng mga kinatawan ng mga puwang xv at opsyon na absolute frequency f(- sa ganap na frequency ng mga agwat f v

Batay sa itaas, ang mga sumusunod ay maaaring gawin: mga konklusyon.

Ang mga konklusyon ng mga istatistika ng matematika ay posible kung ang impormasyon tungkol sa mass phenomena ay naproseso.

Karaniwan, ang isang sample ay pinag-aaralan mula sa pangkalahatang populasyon ng mga bagay, na dapat na kinatawan.

Ang pang-eksperimentong data na nakuha bilang resulta ng pag-aaral ng anumang pag-aari ng mga sample na bagay ay kumakatawan sa halaga ng isang random na variable, dahil hindi mahuhulaan ng mananaliksik nang maaga kung aling numero ang tumutugma sa isang partikular na bagay.

Upang pumili ng isa o isa pang algorithm para sa paglalarawan at paunang pagproseso ng pang-eksperimentong data, mahalagang matukoy ang uri ng random na variable: discrete, tuloy-tuloy o halo-halong.

Ang mga discrete random variable ay inilalarawan ng isang discrete variation series at ang graphical na anyo nito - isang frequency polygon.

Ang magkakahalo at tuluy-tuloy na mga random na variable ay inilalarawan ng isang serye ng pagkakaiba-iba ng pagitan at ang graphical na anyo nito - isang histogram.

Kapag naghahambing ng ilang mga sample ayon sa nabuong antas ng isang partikular na ari-arian, ginagamit ang average na mga katangiang numero at ang mga katangiang pang-numero ng pagkakalat ng isang random na variable na may kaugnayan sa average.

Kapag kinakalkula ang average na katangian, mahalagang piliin nang tama ang uri ng average na katangian na sapat sa lugar ng aplikasyon nito. Ang mga istrukturang average na halaga, mode at median, ay nagpapakilala sa istruktura ng lokasyon ng variant sa isang nakaayos na hanay ng pang-eksperimentong data. Ginagawang posible ng quantitative average na hatulan ang average na laki ng opsyon (sample average).

Upang kalkulahin ang mga numerical na katangian ng scattering - sample variance, standard deviation at coefficient of variation - ang tabular method ay epektibo.

Inilalarawan ng mga katangian ng posisyon ang sentro ng pamamahagi. Kasabay nito, ang mga kahulugan ng opsyon ay maaaring ipangkat sa paligid nito sa parehong malawak at makitid na banda. Samakatuwid, upang ilarawan ang pamamahagi, kinakailangan upang makilala ang hanay ng mga pagbabago sa mga halaga ng katangian. Ang mga katangian ng scattering ay ginagamit upang ilarawan ang hanay ng pagkakaiba-iba ng isang katangian. Ang pinakamalawak na ginagamit ay ang hanay ng variation, dispersion, standard deviation at coefficient of variation.

Saklaw ng pagkakaiba-iba ay tinukoy bilang pagkakaiba sa pagitan ng maximum at minimum na halaga ng isang katangian sa populasyon na pinag-aaralan:

R=x max - x min.

Ang halatang bentahe ng indicator na isinasaalang-alang ay ang pagiging simple ng pagkalkula. Gayunpaman, dahil ang saklaw ng pagkakaiba-iba ay nakasalalay sa mga halaga lamang ng mga matinding halaga ng katangian, ang saklaw ng aplikasyon nito ay limitado sa medyo homogenous na pamamahagi. Sa ibang mga kaso, ang nilalaman ng impormasyon ng tagapagpahiwatig na ito ay napakaliit, dahil maraming mga distribusyon na ibang-iba sa hugis, ngunit may parehong saklaw. Sa mga praktikal na pag-aaral, minsan ginagamit ang hanay ng variation na may maliliit (hindi hihigit sa 10) na mga sample size. Halimbawa, mula sa hanay ng variation, madaling masuri kung gaano kaiba ang pinakamahusay at pinakamasamang resulta sa isang grupo ng mga atleta.

Sa halimbawang ito:

R=16.36 – 13.04=3.32 (m).

Ang pangalawang katangian ng pagkakalat ay pagpapakalat. Ang dispersion ay ang average na parisukat ng paglihis ng random variable mula sa mean nito. Ang pagpapakalat ay isang katangian ng pagkalat, ang pagkalat ng mga halaga ng isang dami sa paligid ng average na halaga nito. Ang salitang "pagkakalat" mismo ay nangangahulugang "pagkalat."

Kapag nagsasagawa ng mga sample na pag-aaral, kinakailangan upang magtatag ng isang pagtatantya para sa pagkakaiba-iba. Ang variance na kinakalkula mula sa sample na data ay tinatawag na sample na variance at tinutukoy S 2 .

Sa unang tingin, ang pinaka-natural na pagtatantya para sa pagkakaiba-iba ay istatistikal na pagkakaiba-iba, na kinakalkula batay sa kahulugan gamit ang formula:

Sa formula na ito - ang kabuuan ng mga squared deviation ng mga value ng attribute x i mula sa arithmetic mean . Upang makuha ang mean square deviation, ang kabuuan na ito ay hinati sa laki ng sample P.

Gayunpaman, ang naturang pagtatantya ay hindi walang kinikilingan. Maaaring ipakita na ang kabuuan ng mga squared deviations ng attribute values ​​para sa isang sample na arithmetic mean ay mas mababa kaysa sa kabuuan ng squared deviations mula sa anumang iba pang value, kabilang ang mula sa totoong mean (mathematical expectation). Samakatuwid, ang resulta na nakuha mula sa formula sa itaas ay maglalaman ng isang sistematikong error, at ang tinantyang halaga ng pagkakaiba ay mababawasan. Upang maalis ang bias, sapat na upang ipakilala ang isang kadahilanan sa pagwawasto. Ang resulta ay ang sumusunod na relasyon para sa tinantyang pagkakaiba:

Para sa malalaking halaga n Naturally, ang parehong mga pagtatantya - may kinikilingan at walang kinikilingan - ay mag-iiba nang kaunti at ang pagpapakilala ng isang salik sa pagwawasto ay nagiging walang kabuluhan. Bilang isang tuntunin, ang formula para sa pagtatantya ng pagkakaiba ay dapat na pinuhin kung kailan n<30.

Sa kaso ng pinagsama-samang data, ang huling formula ay maaaring bawasan sa sumusunod na form upang pasimplehin ang mga kalkulasyon:

saan k- bilang ng mga pagitan ng pagpapangkat;

n i- dalas ng pagitan na may numero i;

x i- ang median na halaga ng pagitan na may numero i.

Bilang halimbawa, kalkulahin natin ang pagkakaiba para sa nakagrupong data ng halimbawang sinusuri natin (tingnan ang Talahanayan 4.):

S 2 =/ 28=0.5473 (m2).

Ang pagkakaiba-iba ng isang random na variable ay may sukat ng parisukat ng dimensyon ng random na variable, na nagpapahirap sa pagbibigay-kahulugan at ginagawa itong hindi masyadong malinaw. Para sa isang mas visual na paglalarawan ng scattering, mas maginhawang gumamit ng isang katangian na ang dimensyon ay tumutugma sa dimensyon ng katangiang pinag-aaralan. Para sa layuning ito, ipinakilala ang konsepto karaniwang lihis(o karaniwang lihis).

Karaniwang lihis ay tinatawag na positibong square root ng variance:

Sa aming halimbawa, ang standard deviation ay katumbas ng

Ang karaniwang paglihis ay may parehong mga yunit ng pagsukat bilang mga resulta ng pagsukat ng katangian na pinag-aaralan at, sa gayon, ito ay nagpapakilala sa antas ng paglihis ng katangian mula sa arithmetic mean. Sa madaling salita, ipinapakita nito kung paano matatagpuan ang pangunahing bahagi ng opsyon na may kaugnayan sa arithmetic mean.

Ang karaniwang paglihis at pagkakaiba ay ang pinakamalawak na ginagamit na mga sukat ng pagkakaiba-iba. Ito ay dahil sa ang katunayan na ang mga ito ay kasama sa isang makabuluhang bahagi ng theorems ng probability theory, na nagsisilbing pundasyon ng mathematical statistics. Bilang karagdagan, ang pagkakaiba ay maaaring mabulok sa mga sangkap na elemento nito, na ginagawang posible upang masuri ang impluwensya ng iba't ibang mga kadahilanan sa pagkakaiba-iba ng katangian na pinag-aaralan.

Bilang karagdagan sa mga ganap na tagapagpahiwatig ng pagkakaiba-iba, na kung saan ay pagpapakalat at karaniwang paglihis, ang mga kamag-anak ay ipinakilala sa mga istatistika. Ang koepisyent ng pagkakaiba-iba ay kadalasang ginagamit. Ang koepisyent ng pagkakaiba-iba katumbas ng ratio ng standard deviation sa arithmetic mean, na ipinahayag bilang isang porsyento:

Mula sa kahulugan ay malinaw na, sa kahulugan nito, ang koepisyent ng pagkakaiba-iba ay isang kamag-anak na sukatan ng pagpapakalat ng isang katangian.

Para sa halimbawang pinag-uusapan:

Ang koepisyent ng pagkakaiba-iba ay malawakang ginagamit sa istatistikal na pananaliksik. Bilang isang kamag-anak na halaga, pinapayagan ka nitong ihambing ang pagkakaiba-iba ng parehong mga katangian na may iba't ibang mga yunit ng pagsukat, pati na rin ang parehong katangian sa maraming iba't ibang mga populasyon na may iba't ibang mga halaga ng arithmetic mean.

Ang koepisyent ng pagkakaiba-iba ay ginagamit upang makilala ang homogeneity ng nakuhang pang-eksperimentong data. Sa pagsasanay ng pisikal na kultura at palakasan, ang pagkalat ng mga resulta ng pagsukat depende sa halaga ng koepisyent ng pagkakaiba-iba ay itinuturing na maliit (V<10%), средним (11-20%) и большим (V> 20%).

Ang mga paghihigpit sa paggamit ng koepisyent ng pagkakaiba-iba ay nauugnay sa kamag-anak na kalikasan nito - ang kahulugan ay naglalaman ng normalisasyon sa arithmetic mean. Sa pagsasaalang-alang na ito, sa maliit na ganap na mga halaga ng arithmetic mean, ang koepisyent ng pagkakaiba-iba ay maaaring mawala ang nilalaman ng impormasyon nito. Kung mas malapit ang arithmetic mean sa zero, nagiging hindi gaanong kaalaman ang indicator na ito. Sa limitadong kaso, ang arithmetic mean ay napupunta sa zero (halimbawa, temperatura) at ang koepisyent ng variation ay napupunta sa infinity, anuman ang pagkalat ng katangian. Sa pamamagitan ng pagkakatulad sa kaso ng error, ang sumusunod na panuntunan ay maaaring mabalangkas. Kung ang halaga ng arithmetic mean sa sample ay mas malaki kaysa sa isa, kung gayon ang paggamit ng coefficient of variation ay legal kung hindi, ang dispersion at standard deviation ay dapat gamitin upang ilarawan ang pagkalat ng eksperimentong data.

Sa pagtatapos ng bahaging ito, isasaalang-alang namin ang pagtatasa ng mga pagkakaiba-iba sa mga halaga ng mga katangian ng pagsusuri. Tulad ng nabanggit na, ang mga halaga ng mga katangian ng pamamahagi na kinakalkula mula sa pang-eksperimentong data ay hindi nag-tutugma sa kanilang mga tunay na halaga para sa pangkalahatang populasyon. Hindi posible na tumpak na maitatag ang huli, dahil, bilang panuntunan, imposibleng suriin ang buong populasyon. Kung gagamitin namin ang mga resulta ng iba't ibang sample mula sa parehong populasyon upang tantyahin ang mga parameter ng pamamahagi, lumalabas na ang mga pagtatantya na ito para sa iba't ibang sample ay naiiba sa bawat isa. Ang mga tinantyang halaga ay nagbabago sa paligid ng kanilang mga tunay na halaga.

Ang mga paglihis ng mga pagtatantya ng mga pangkalahatang parameter mula sa totoong mga halaga ng mga parameter na ito ay tinatawag na mga error sa istatistika. Ang dahilan ng kanilang paglitaw ay ang limitadong laki ng sample - hindi lahat ng mga bagay sa pangkalahatang populasyon ay kasama dito. Upang matantya ang laki ng mga error sa istatistika, ginagamit ang karaniwang paglihis ng mga katangian ng sample.

Bilang halimbawa, isaalang-alang ang pinakamahalagang katangian ng posisyon - ang arithmetic mean. Maaaring ipakita na ang karaniwang paglihis ng arithmetic mean ay tinutukoy ng kaugnayan:

saan σ - standard deviation para sa populasyon.

Dahil hindi alam ang tunay na halaga ng standard deviation, tinatawag ang isang quantity karaniwang error ng arithmetic mean at katumbas:

Inilalarawan ng value ang error na, sa karaniwan, ay pinapayagan kapag pinapalitan ang pangkalahatang average ng sample na pagtatantya nito. Ayon sa formula, ang pagtaas ng laki ng sample sa panahon ng isang pag-aaral ay humahantong sa pagbaba sa karaniwang error sa proporsyon sa square root ng sample size.

Para sa halimbawang isinasaalang-alang, ang karaniwang error ng arithmetic mean ay katumbas ng . Sa aming kaso, ito ay naging 5.4 beses na mas mababa kaysa sa karaniwang paglihis.

    EFFECTIVE SCATERING SURFACE (LUGAR)- katangian ng reflectivity ng target, na ipinahayag ng ratio ng electrical power. mag. enerhiya na sinasalamin ng target sa direksyon ng receiver sa ibabaw ng enerhiya flux density insidente sa target. Depende sa… … Encyclopedia ng Strategic Missile Forces

    Quantum mechanics ... Wikipedia

    - (EPR) na katangian ng reflectivity ng isang target na na-irradiated ng electromagnetic waves. Ang halaga ng EPR ay tinukoy bilang ang ratio ng daloy (kapangyarihan) ng electromagnetic energy na ipinapakita ng target sa direksyon ng radio-electronic equipment (RES) sa... ... Marine Dictionary

    scatter band- Mga istatistikal na katangian ng pang-eksperimentong data, na sumasalamin sa kanilang paglihis mula sa average na halaga. Mga Paksa: metalurhiya sa pangkalahatan EN desperal band ... Gabay ng Teknikal na Tagasalin

    - (modulation transfer function), function, sa tulong ng cut ang "sharpness" properties ng imaging optical lenses ay tinasa. sistema at dept. mga elemento ng naturang mga sistema. Ch.k.x. ay ang tinatawag na Fourier transform. line scattering function na naglalarawan sa katangian ng "pagkalat"... ... Pisikal na encyclopedia

    Modulation transfer function, isang function na sinusuri ang "sharpness" properties ng imaging optical system at mga indibidwal na elemento ng naturang mga system (tingnan, halimbawa, Sharpness ng isang photographic na imahe). Ch.k.x. may Fourier......

    scatter band- istatistikal na katangian ng pang-eksperimentong data, na sumasalamin sa kanilang paglihis mula sa average na halaga. Tingnan din ang: Slip strip Relief strip Harddenability strip... Encyclopedic Dictionary of Metallurgy

    BANDA NG KAKALAT- istatistikal na katangian ng pang-eksperimentong data, na sumasalamin sa kanilang paglihis mula sa average na halaga... Diksyonaryo ng metalurhiko

    Mga katangian ng scattering ng random variable values. M. t. h ay nauugnay sa square deviation (Tingnan ang Square deviation) σ sa pamamagitan ng formula Ang paraan ng pagsukat ng scattering ay ipinaliwanag sa pamamagitan ng katotohanan na sa kaso ng normal ... ... Great Soviet Encyclopedia

    VARIATION STATISTICS- VARIATION STATISTICS, isang termino na pinag-iisa ang isang pangkat ng mga diskarte sa pagsusuri sa istatistika na pangunahing ginagamit sa mga natural na agham. Sa ikalawang kalahati ng ika-19 na siglo. Quetelet, “Anthro poometrie ou mesure des differentes facultes de 1... ... Great Medical Encyclopedia

    Inaasahang halaga- (Kahulugan ng populasyon) Ang inaasahan sa matematika ay ang pamamahagi ng probabilidad ng isang random na variable, kahulugan, inaasahan sa matematika ng mga discrete at tuloy-tuloy na random na variable, sample, conditional expectation, pagkalkula,... ... Investor Encyclopedia

Ang isa sa mga dahilan para sa pagsasagawa ng istatistikal na pagsusuri ay ang pangangailangan na isaalang-alang ang impluwensya ng mga random na kadahilanan (mga kaguluhan) sa tagapagpahiwatig na pinag-aaralan, na humahantong sa pagkalat (scattering) ng data. Ang paglutas ng mga problema kung saan mayroong nakakalat na data ay nauugnay sa panganib, dahil kahit na gamitin mo ang lahat ng magagamit na impormasyon, hindi mo magagawa. eksakto hulaan kung ano ang mangyayari sa hinaharap. Upang sapat na harapin ang mga ganitong sitwasyon, ipinapayong maunawaan ang kalikasan ng panganib at matukoy ang antas ng pagpapakalat ng isang set ng data. May tatlong numerical na katangian na naglalarawan sa sukat ng dispersion: standard deviation, range at coefficient of variation (variability). Hindi tulad ng mga tipikal na tagapagpahiwatig (mean, median, mode) na nagpapakilala sa sentro, nagpapakita ang mga katangian ng scattering gaano kalapit Ang mga indibidwal na halaga ng set ng data ay matatagpuan patungo sa sentrong ito
Kahulugan ng standard deviation Karaniwang lihis(standard deviation) ay isang sukatan ng random deviations ng mga halaga ng data mula sa mean. Sa totoong buhay, karamihan sa data ay nailalarawan sa pamamagitan ng scattering, i.e. Ang mga indibidwal na halaga ay matatagpuan sa ilang distansya mula sa average.
Imposibleng gamitin ang standard deviation bilang isang pangkalahatang katangian ng scattering sa pamamagitan lamang ng pag-average ng mga deviation ng data, dahil ang bahagi ng deviations ay magiging positibo, at ang ibang bahagi ay magiging negatibo, at, bilang resulta, ang resulta ng pag-average ay maaaring katumbas ng sero. Upang maalis ang negatibong palatandaan, gamitin ang karaniwang pamamaraan: unang kalkulahin pagpapakalat bilang kabuuan ng mga squared deviations na hinati ng ( n–1), at pagkatapos ay ang square root ay kinuha mula sa resultang halaga. Ang pormula para sa pagkalkula ng karaniwang paglihis ay ang mga sumusunod: Tandaan 1: Ang pagkakaiba-iba ay hindi naghahatid ng anumang karagdagang impormasyon kumpara sa karaniwang paglihis, ngunit ito ay mas mahirap bigyang-kahulugan dahil ito ay ipinahayag sa "mga yunit ng squared", habang ang karaniwang paglihis ay ipinahayag. sa mga yunit na pamilyar sa amin (halimbawa, mga dolyar). Tandaan 2: Ang formula sa itaas ay para sa pagkalkula ng standard deviation ng isang sample at mas tumpak na tinatawag sample na standard deviation. Kapag kinakalkula ang standard deviation populasyon(tinutukoy ng simbolong s) hatiin ng n. Ang halaga ng sample na standard deviation ay bahagyang mas malaki (dahil hinati ito sa n–1), na nagbibigay ng pagwawasto para sa randomness ng sample mismo. Kapag ang set ng data ay karaniwang ipinamamahagi, ang karaniwang paglihis ay magkakaroon ng isang espesyal na kahulugan. Sa figure sa ibaba, ang mga marka ay ginawa sa magkabilang panig ng mean sa mga distansya ng isa, dalawa at tatlong standard deviations, ayon sa pagkakabanggit. Ipinapakita ng figure na humigit-kumulang 66.7% (dalawang-katlo) ng lahat ng mga halaga ay nasa loob ng isang karaniwang paglihis sa magkabilang panig ng mean, 95% ng mga halaga ay nasa loob ng dalawang karaniwang paglihis ng mean, at halos lahat ng data. (99.7%) ay nasa loob ng tatlong standard deviations mula sa mean.
66,7%


Ang property na ito ng standard deviation para sa normal na distributed na data ay tinatawag na "two-thirds rule."

Sa ilang sitwasyon, gaya ng pagsusuri sa kontrol sa kalidad ng produkto, ang mga limitasyon ay kadalasang itinatakda upang ang mga obserbasyon na iyon (0.3%) na higit sa tatlong karaniwang paglihis mula sa mean ay itinuturing na isang karapat-dapat na problema.

Sa kasamaang palad, kung ang data ay hindi sumusunod sa isang normal na distribusyon, kung gayon ang panuntunang inilarawan sa itaas ay hindi mailalapat.

Kasalukuyang may hadlang na tinatawag na panuntunan ni Chebyshev na maaaring ilapat sa mga distribusyon na walang simetriko (skewed).

Bumuo ng paunang data Set ng SV

Ipinapakita ng Talahanayan 1 ang dinamika ng mga pagbabago sa pang-araw-araw na kita sa stock exchange, na naitala sa mga araw ng trabaho para sa panahon mula Hulyo 31 hanggang Oktubre 9, 1987.

Talahanayan 1. Dynamics ng mga pagbabago sa araw-araw na kita sa stock exchange

petsa Araw-araw na kita petsa Araw-araw na kita petsa Araw-araw na kita
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Ilunsad ang Excel
Lumikha ng file I-click ang button na I-save sa Standard toolbar. Buksan ang folder ng Statistics sa dialog box na lalabas at pangalanan ang file na Scattering Characteristics.xls.
Itakda ang label 6. Sa Sheet1, sa cell A1, itakda ang label na Daily Profit, 7. at sa hanay na A2:A49, ilagay ang data mula sa Talahanayan 1.
Itakda ang AVERAGE VALUE function 8. Sa cell D1, ilagay ang label na Average. Sa cell D2, kalkulahin ang average gamit ang AVERAGE statistical function.
Itakda ang STANDARDEV function Sa cell D4, ilagay ang label na Standard Deviation. Sa cell D5, kalkulahin ang standard deviation gamit ang statistical function na STDEV
Bawasan ang bit size ng resulta sa ikaapat na decimal place.
Interpretasyon ng mga resulta Tanggihan Ang average na pang-araw-araw na kita ay 0.04% (ang average na pang-araw-araw na kita ay -0.0004). Nangangahulugan ito na ang average na pang-araw-araw na kita para sa panahong isinasaalang-alang ay humigit-kumulang zero, i.e. pinanatili ng merkado ang isang average na rate. Ang karaniwang paglihis ay naging 0.0118. Nangangahulugan ito na ang isang dolyar ($1) na namuhunan sa stock market ay nagbago ng average na $0.0118 bawat araw, ibig sabihin. ang kanyang puhunan ay maaaring magresulta sa pakinabang o pagkawala ng $0.0118.
Suriin natin kung ang mga halaga ng pang-araw-araw na kita na ibinigay sa Talahanayan 1 ay tumutugma sa mga patakaran ng normal na pamamahagi 1. Kalkulahin ang pagitan na tumutugma sa isang karaniwang paglihis sa magkabilang panig ng mean. 2. Sa mga cell D7, D8 at F8, itakda ang mga label ayon sa pagkakabanggit: Isang standard deviation, Lower bound, Upper bound. 3. Sa cell D9, ilagay ang formula = -0.0004 – 0.0118, at sa cell F9, ilagay ang formula = -0.0004 + 0.0118. 4. Kunin ang resulta nang tumpak sa ikaapat na decimal place.

5. Tukuyin ang bilang ng mga pang-araw-araw na halaga ng kita na nasa loob ng isang standard deviation. Una, i-filter ang data, na iniiwan ang mga pang-araw-araw na halaga ng kita sa hanay [-0.0121, 0.0114]. Upang gawin ito, pumili ng anumang cell sa column A na may mga pang-araw-araw na halaga ng kita at patakbuhin ang command:

Data®Filter®AutoFilter

Buksan ang menu sa pamamagitan ng pag-click sa arrow sa header Araw-araw na kita, at piliin ang (Kondisyon...). Sa dialog box ng Custom na AutoFilter, itakda ang mga opsyon tulad ng ipinapakita sa ibaba. I-click ang OK.

Upang mabilang ang bilang ng na-filter na data, piliin ang hanay ng mga pang-araw-araw na halaga ng kita, i-right click sa isang walang laman na espasyo sa status bar at piliin ang Bilang ng Mga Halaga mula sa menu ng konteksto. Basahin ang resulta. Ngayon ipakita ang lahat ng orihinal na data sa pamamagitan ng pagpapatakbo ng command: Data®Filter®Display All at i-off ang autofilter gamit ang command: Data®Filter®AutoFilter.

6. Kalkulahin ang porsyento ng mga pang-araw-araw na halaga ng kita na isang standard deviation ang layo mula sa mean. Upang gawin ito, ilagay ang label sa cell H8 Porsiyento, at sa cell H9 program ang formula para sa pagkalkula ng porsyento at makuha ang resulta na tumpak sa isang decimal na lugar.

7. Kalkulahin ang hanay ng mga pang-araw-araw na halaga ng kita sa loob ng dalawang karaniwang paglihis mula sa mean. Sa mga cell D11, D12 at F12, itakda ang mga label nang naaayon: Dalawang karaniwang paglihis, Bottom line, Pinakamataas na limitasyon. Ilagay ang mga formula ng pagkalkula sa mga cell D13 at F13 at makuha ang resulta nang tumpak sa ikaapat na decimal place.

8. Tukuyin ang bilang ng mga pang-araw-araw na halaga ng kita na nasa loob ng dalawang standard deviations sa pamamagitan ng unang pag-filter ng data.

9. Kalkulahin ang porsyento ng mga pang-araw-araw na halaga ng kita na dalawang standard deviations ang layo mula sa mean. Upang gawin ito, ilagay ang label sa cell H12 Porsiyento, at sa cell H13 program ang formula ng pagkalkula ng porsyento at makuha ang resulta na tumpak sa isang decimal na lugar.

10. Kalkulahin ang hanay ng mga pang-araw-araw na halaga ng kita sa loob ng tatlong standard deviations mula sa mean. Sa mga cell D15, D16 at F16, itakda ang mga label nang naaayon: Tatlong karaniwang paglihis, Bottom line, Pinakamataas na limitasyon. Ilagay ang mga formula ng pagkalkula sa mga cell D17 at F17 at makuha ang resulta nang tumpak sa ikaapat na decimal place.

11. Tukuyin ang bilang ng mga pang-araw-araw na halaga ng kita na nasa loob ng tatlong standard deviations sa pamamagitan ng unang pag-filter ng data. Kalkulahin ang porsyento ng mga pang-araw-araw na halaga ng kita. Upang gawin ito, ilagay ang label sa cell H16 Porsiyento, at sa cell H17 program ang formula para sa pagkalkula ng porsyento at makuha ang resulta na tumpak sa isang decimal na lugar.

13. Bumuo ng histogram ng pang-araw-araw na stock return sa stock exchange at ilagay ito kasama ng frequency distribution table sa lugar J1:S20. Ipakita sa histogram ang tinatayang mean at mga pagitan na tumutugma sa isa, dalawa, at tatlong karaniwang paglihis mula sa mean, ayon sa pagkakabanggit.

Mga katangian ng scattering

Mga sukat ng sampling dispersion.

Ang minimum at maximum ng sample ay, ayon sa pagkakabanggit, ang pinakamaliit at pinakamalaking halaga ng variable na pinag-aaralan. Ang pagkakaiba sa pagitan ng maximum at minimum ay tinatawag saklaw mga sample. Ang lahat ng sample na data ay matatagpuan sa pagitan ng minimum at maximum. Ang mga tagapagpahiwatig na ito ay tila binabalangkas ang mga hangganan ng sample.

R№1= 15.6-10=5.6

R №2 =0.85-0.6=0.25

Sample na pagkakaiba-iba(Ingles) pagkakaiba-iba) At karaniwang lihis mga sample (Ingles) karaniwang lihis) ay isang sukatan ng pagkakaiba-iba ng isang variable at nailalarawan ang antas ng pagkakalat ng data sa paligid ng gitna. Sa kasong ito, ang karaniwang paglihis ay isang mas maginhawang tagapagpahiwatig dahil sa katotohanan na mayroon itong parehong dimensyon sa aktwal na data na pinag-aaralan. Samakatuwid, ang standard deviation indicator ay ginagamit kasama ng arithmetic mean ng sample upang mailarawan ang mga resulta ng pagsusuri ng data.

Ito ay mas kapaki-pakinabang upang kalkulahin ang sample na pagkakaiba-iba gamit ang formula:

Ang karaniwang paglihis ay kinakalkula gamit ang formula:

Ang coefficient ng variation ay isang relatibong sukatan ng dispersion ng isang katangian.

Ang koepisyent ng pagkakaiba-iba ay ginagamit din bilang isang tagapagpahiwatig ng homogeneity ng mga obserbasyon ng sample. Ito ay pinaniniwalaan na kung ang koepisyent ng pagkakaiba-iba ay hindi lalampas sa 10%, kung gayon ang sample ay maaaring ituring na homogenous, ibig sabihin, nakuha mula sa isang pangkalahatang populasyon.

Dahil ang koepisyent ng pagkakaiba-iba ay nasa parehong mga sample, sila ay homogenous.

Ang sample ay maaaring iharap sa analytically sa anyo ng isang distribution function, pati na rin sa anyo ng isang frequency table na binubuo ng dalawang linya. Sa tuktok na linya ay ang mga elemento ng pagpili (mga opsyon), na nakaayos sa pataas na pagkakasunud-sunod; Ang mga frequency ng opsyon ay nakasulat sa ilalim na linya.

Ang dalas ng variant ay isang numero na katumbas ng bilang ng mga pag-uulit ng isang ibinigay na variant sa sample.

Sample No. 1 "Mga Ina"

Uri ng kurba ng pamamahagi

Kawalaan ng simetrya o coefficient of skewness (isang terminong unang likha ni Pearson, 1895) ay isang sukatan ng skewness ng isang distribution. Kung ang skewness ay malinaw na naiiba mula sa 0, ang pamamahagi ay walang simetriko, ang density ng normal na pamamahagi ay simetriko tungkol sa mean.

Index kawalaan ng simetrya(Ingles) pagkahilig) ay ginagamit upang makilala ang antas ng simetrya ng pamamahagi ng data sa paligid ng gitna. Ang kawalaan ng simetrya ay maaaring magkaroon ng parehong negatibo at positibong mga halaga. Ang isang positibong halaga para sa parameter na ito ay nagpapahiwatig na ang data ay inilipat sa kaliwa ng gitna, at isang negatibong halaga ay nagpapahiwatig na ang data ay inilipat sa kanan. Kaya, ang tanda ng skewness index ay nagpapahiwatig ng direksyon ng bias ng data, habang ang magnitude ay nagpapahiwatig ng antas ng bias na ito. Ang skewness na katumbas ng zero ay nagpapahiwatig na ang data ay simetriko na puro sa paligid ng gitna.

kasi ang asymmetry ay positibo, samakatuwid, ang tuktok ng curve ay gumagalaw sa kaliwa ng gitna.

Kurtosis coefficient(Ingles) kurtosis) ay isang katangian kung gaano kalapit ang karamihan ng data ay nakapangkat sa paligid ng gitna.

Sa isang positibong kurtosis, ang kurba ay tumatalas, na may negatibong kurtosis, ito ay kumikinis.

Ang kurba ay patag;

Ang kurba ay tumatalas.