Parametrat bazë të një kampioni të vogël. Mostra e vogël

Metoda e mostrës së vogël

Avantazhi kryesor i metodës së mostrës së vogël është aftësia për të vlerësuar dinamikën e procesit me kalimin e kohës, duke reduktuar kohën për procedurat llogaritëse.

Mostrat e menjëhershme zgjidhen rastësisht në periudha të caktuara kohore që variojnë nga 5 deri në 20 njësi. Periudha e kampionimit përcaktohet në mënyrë empirike dhe varet nga qëndrueshmëria e procesit, e përcaktuar duke analizuar informacionin apriori.

Për çdo mostër të menjëhershme përcaktohen karakteristikat kryesore statistikore. Mostrat e menjëhershme dhe karakteristikat e tyre kryesore statistikore janë paraqitur në Shtojcën B.

Një hipotezë rreth homogjenitetit të shpërndarjes së mostrës është paraqitur dhe testuar duke përdorur një nga kriteret e mundshme (kriteri i Fisher-it).

Testimi i hipotezës për homogjenitetin e karakteristikave të mostrës.

Për të kontrolluar rëndësinë e diferencës ndërmjet mesatareve aritmetike në 2 seri matjesh, është paraqitur masa G. Llogaritjet janë dhënë në Shtojcën B.

Rregulli i vendimit formulohet si më poshtë:

ku tr është vlera e kuantilit të shpërndarjes së normalizuar në një probabilitet të caktuar besimi P, ? = 0,095, n = 10, tр =2,78.

Kur plotësohet pabarazia, konfirmohet hipoteza se diferenca midis mesatareve të mostrës nuk është e rëndësishme.

Meqenëse pabarazia është e plotësuar në të gjitha rastet, hipoteza se diferenca midis mesatareve të mostrës nuk është e rëndësishme konfirmohet.

Për të testuar hipotezën në lidhje me homogjenitetin e variancave të mostrës, matja F0 prezantohet si raport i vlerësimeve të paanshme të variancave të rezultateve të 2 serive të matjeve. Për më tepër, më i madhi nga 2 vlerësimet merret si numërues dhe nëse Sx1>Sx2, atëherë

Rezultatet e llogaritjes janë dhënë në Shtojcën B.

Pastaj përcaktohen vlerat e probabilitetit të besimit P dhe vlerat e F(K1; K2; ?/2) përcaktohen me K1 = n1 - 1 dhe K2 = n2 - 1.

Me P = 0,025 dhe K1 = 10-1 = 4 dhe K2 = 10-1 = 4 F (9;9;0,025/2) =4,1.

Rregulli i vendimit: nëse F(K1; K2; ?/2)>F0, atëherë hipoteza për homogjenitetin e variancave në të dy mostrat pranohet.

Meqenëse kushti F(K1; K2; ?/2) > F0 është i plotësuar në të gjitha rastet, hipoteza e homogjenitetit të variancave pranohet.

Kështu, konfirmohet hipoteza për homogjenitetin e variancave të mostrës, gjë që tregon stabilitetin e procesit; hipoteza për homogjenitetin e mjeteve të mostrës duke përdorur metodën e krahasimit të mesatareve është konfirmuar, kjo do të thotë se qendra e dispersionit nuk ka ndryshuar dhe procesi është në një gjendje të qëndrueshme.

Metoda e shpërndarjes dhe e saktë e grafikut

Gjatë një periudhe të caktuar kohe, merren mostra të menjëhershme prej 3 deri në 10 produkte dhe përcaktohen karakteristikat statistikore të çdo kampioni.

Të dhënat e marra vizatohen në diagrame me kohën në boshtin e abshisave? ose numrat k të mostrave, dhe në boshtin e ordinatave - vlerat individuale të xk ose vlera e një prej karakteristikave statistikore (mesatarja aritmetike e mostrës, devijimi standard i mostrës). Përveç kësaj, dy vija horizontale Тв dhe Тн janë vizatuar në diagram, duke kufizuar gamën e tolerancës së produktit.

Mostrat e menjëhershme janë dhënë në Shtojcën B.


Grafiku i saktësisë Figura 1

Diagrami tregon qartë ecurinë e procesit të prodhimit. Mund të përdoret për të treguar se procesi i prodhimit është i paqëndrueshëm

Zgjerimi i karakteristikave të mostrës në popullatën e përgjithshme, bazuar në ligjin e numrave të mëdhenj, kërkon një madhësi mjaftueshëm të madhe të mostrës. Megjithatë, në praktikën e kërkimit statistikor, shpesh haset në pamundësinë, për një arsye apo një tjetër, për të rritur numrin e njësive të mostrës që kanë një madhësi të vogël. Kjo vlen për studimin e veprimtarive të ndërmarrjeve, institucioneve arsimore, bankave tregtare, etj., numri i të cilave në rajone është, si rregull, i parëndësishëm dhe ndonjëherë arrin vetëm në 5-10 njësi.

Në rastin kur popullata e mostrës përbëhet nga një numër i vogël njësish, më pak se 30, kampioni quhet i vogël Në këtë rast, teorema e Lyapunov nuk mund të përdoret për të llogaritur gabimin e kampionimit, pasi mesatarja e mostrës ndikohet ndjeshëm nga vlera e secilës prej njësive të zgjedhura rastësisht dhe shpërndarja e saj mund të ndryshojë ndjeshëm nga normalja.

Në vitin 1908 V.S. Gosset vërtetoi se vlerësimi i mospërputhjes midis mesatares së mostrës së një kampioni të vogël dhe mesatares së përgjithshme ka një ligj të veçantë shpërndarjeje (shih Kapitullin 4). Duke u marrë me problemin e vlerësimit probabilistik të mesatares së kampionit me një numër të vogël vëzhgimesh, ai tregoi se në këtë rast është e nevojshme të merret parasysh shpërndarja jo e vetë mjeteve të mostrës, por e madhësisë së devijimeve të tyre nga mesatarja e popullsia origjinale. Në këtë rast, përfundimet mund të jenë mjaft të besueshme.

Zbulimi i nxënësit quhet teoria e mostrës së vogël.

Kur vlerësohen rezultatet e një kampioni të vogël, vlera e variancës së përgjithshme nuk përdoret në llogaritjet. Në mostrat e vogla, varianca e mostrës "korrigjuar" përdoret për të llogaritur gabimin mesatar të kampionimit:

ato. në ndryshim nga mostrat e mëdha në emërues në vend P kostot (dhe - 1). Llogaritja e gabimit mesatar të kampionimit për një kampion të vogël është dhënë në tabelë. 5.7.

Tabela 5.7

Llogaritja e gabimit mesatar të një kampioni të vogël

Gabimi margjinal i një kampioni të vogël është: ku t- faktor besimi.

Madhësia t lidhet ndryshe me vlerësimin e mundshëm sesa me një kampion të madh. Në përputhje me shpërndarjen Studenti, vlerësimi i mundshëm varet nga të dyja vlerat t, dhe në madhësinë e kampionit I në rast se gabimi margjinal nuk e kalon r-fish gabimin mesatar në mostrat e vogla. Megjithatë, kjo varet kryesisht nga numri i njësive të zgjedhura.

V.S. Gosset përpiloi një tabelë të shpërndarjeve të probabilitetit në mostra të vogla që korrespondojnë me vlerat e dhëna të koeficientit të besimit t dhe vëllime të ndryshme të një kampioni të vogël dhe, një fragment prej tij është dhënë në tabelë. 5.8.

Tabela 5.8

Fragment i tabelës së probabilitetit të studentit (probabilitetet shumëzuar me 1000)

Të dhënat e tabelës 5.8 tregojnë se me një rritje të pakufizuar në madhësinë e kampionit (i = °°), shpërndarja Studenti priret drejt ligjit të shpërndarjes normale dhe në i = 20 ndryshon pak nga ai.

Tabela e shpërndarjes së studentëve shpesh jepet në një formë tjetër, më e përshtatshme për përdorim praktik (Tabela 5.9).

Tabela 5.9

Disa vlera (T-shpërndarjet e studentit

Numri i shkallëve të lirisë

për intervalin me një drejtim

për ndarje të dyanshme

P= 0,99

Le të shohim se si të përdorim tabelën e shpërndarjes. Çdo vlerë fikse P llogaritni numrin e shkallëve të lirisë k, Ku k = n - 1. Për çdo vlerë të shkallës së lirisë, tregohet vlera kufi t p (t 095 ose t 0 99), i cili me një probabilitet të caktuar R nuk do të tejkalohet për shkak të luhatjeve të rastësishme në rezultatet e kampionimit. Në bazë të madhësisë tp përcaktohen kufijtë e besimit

intervali

Si rregull, niveli i besimit i përdorur në testimin e dyanshëm është P = 0,95 ose P = 0.99, e cila nuk përjashton zgjedhjen e vlerave të tjera të probabilitetit. Vlera e probabilitetit zgjidhet bazuar në kërkesat specifike të detyrave për të cilat përdoret një mostër e vogël.

Probabiliteti që vlerat mesatare të përgjithshme të shkojnë përtej intervalit të besimit është i barabartë me q, Ku q = 1 - R. Kjo vlerë është shumë e vogël. Prandaj, për probabilitetet e konsideruara Rështë 0.05 dhe 0.01.

Mostrat e vogla janë të përhapura në shkencat teknike dhe biologjinë, por ato duhet të përdoren në kërkimet statistikore me shumë kujdes, vetëm me ekzaminimin e duhur teorik dhe praktik. Një mostër e vogël mund të përdoret vetëm nëse shpërndarja e karakteristikës në popullatë është normale ose afër saj, dhe vlera mesatare llogaritet nga të dhënat e mostrës të marra si rezultat i vëzhgimeve të pavarura. Përveç kësaj, mbani në mend se saktësia e rezultateve nga një madhësi e vogël kampioni është më e ulët se sa nga një madhësi e madhe kampioni.

statistika të mostrës së vogël

Në përgjithësi pranohet se fillimi i S. m.v. ose, siç quhet shpesh, statistika “n e vogël”, u themelua në dekadën e parë të shekullit të 20-të me botimin e veprës së W. Gosset, në të cilën ai vendosi shpërndarjen t të postuar nga “studenti” i cili. fitoi famë botërore pak më vonë. Në atë kohë, Gossett punonte si statisticien në fabrikën e birrës Guinness. Një nga detyrat e tij ishte të analizonte tufa të njëpasnjëshme të fuçive të portierit të sapokrijuar. Për një arsye që ai kurrë nuk e shpjegoi vërtet, Gossett eksperimentoi me idenë e reduktimit të ndjeshëm të numrit të mostrave të marra nga numri shumë i madh i fuçive në magazinat e fabrikës së birrës për të kontrolluar në mënyrë të rastësishme cilësinë e portierit. Kjo e shtyu atë të postulonte shpërndarjen t. Për shkak se aktet nënligjore të fabrikës së birrës Guinness i ndalonin punonjësit e tyre të publikonin rezultatet e kërkimit, Gossett publikoi rezultatet e eksperimentit të tij duke krahasuar kampionimin e kontrollit të cilësisë duke përdorur shpërndarjen t për mostra të vogla dhe shpërndarjen tradicionale z (shpërndarje normale) në mënyrë anonime, nën pseudonimin "Studenti". " - prandaj emri Student's t-distribution).

t-shpërndarja. Teoria e shpërndarjes t, si teoria e shpërndarjes z, përdoret për të testuar hipotezën zero se dy mostra janë thjesht mostra të rastësishme nga e njëjta popullatë dhe për këtë arsye statistikat e llogaritura (p.sh. mesatarja dhe devijimi standard) janë vlerësime të paanshme të parametrave të popullsisë. Megjithatë, ndryshe nga teoria e shpërndarjes normale, teoria e shpërndarjes t për mostrat e vogla nuk kërkon njohuri apriori ose vlerësime të sakta të vlerës së pritur dhe variancës së popullsisë. Për më tepër, megjithëse testimi i një ndryshimi midis mesatareve të dy mostrave të mëdha për rëndësi statistikore kërkon supozimin themelor që karakteristikat e popullatës shpërndahen normalisht, teoria e shpërndarjes t nuk kërkon supozime për parametrat.

Dihet mirë se karakteristikat e shpërndara normalisht përshkruhen nga një kurbë e vetme - kurba Gaussian, e cila plotëson ekuacionin e mëposhtëm:

Me shpërndarjen t, e gjithë familja e kurbave përfaqësohet me formulën e mëposhtme:

Kjo është arsyeja pse ekuacioni për t përfshin një funksion gama, që në matematikë do të thotë se me ndryshimin e n, një kurbë e ndryshme do të kënaqë ekuacionin e dhënë.

Shkallët e lirisë

Në ekuacionin për t, shkronja n tregon numrin e shkallëve të lirisë (df) të lidhura me vlerësimin e variancës së popullsisë (S2), e cila përfaqëson momentin e dytë të çdo funksioni gjenerues të momentit, siç është ekuacioni për shpërndarjen t. . Në S., numri i shkallëve të lirisë tregon se sa karakteristika mbeten të lira pas përdorimit të tyre të pjesshëm në një lloj të veçantë analize. Në një shpërndarje t, një nga devijimet nga mesatarja e mostrës është gjithmonë fikse, pasi shuma e të gjitha devijimeve të tilla duhet të jetë e barabartë me zero. Kjo ndikon në shumën e katrorëve kur llogaritet varianca e mostrës si një vlerësim i paanshëm i parametrit S2 dhe çon në df të barabartë me numrin e matjeve minus një për çdo mostër. Prandaj, në formulat dhe procedurat për llogaritjen e statistikave t për testimin e hipotezës zero, df = n - 2.

F-pacndarja. Hipoteza zero e testuar nga një test t është se dy mostrat janë nxjerrë rastësisht nga e njëjta popullatë ose janë nxjerrë rastësisht nga dy popullata të ndryshme me të njëjtën variancë. Por çfarë nëse duhet të analizoni më shumë grupe? Përgjigja për këtë pyetje u kërkua për njëzet vjet pasi Gosset zbuloi shpërndarjen t. Dy nga statisticienët më të shquar të shekullit të 20-të u përfshinë drejtpërdrejt në prodhimin e tij. Njëri është statisticieni më i madh anglez R. A. Fisher, i cili propozoi teoritë e para. formulime, zhvillimi i të cilave çoi në prodhimin e shpërndarjes F; puna e tij mbi teorinë e mostrave të vogla, duke zhvilluar idetë e Gosset, u botua në mesin e viteve 20 (Fisher, 1925). Një tjetër është George Snedecor, një nga një galaktikë statisticienësh të hershëm amerikanë, i cili zhvilloi një mënyrë për të krahasuar dy mostra të pavarura të çdo madhësie duke llogaritur raportin e dy vlerësimeve të variancës. Ai e quajti këtë marrëdhënie raporti F, sipas Fischer. Rezultatet e hulumtimit Snedecor çoi në faktin se shpërndarja F filloi të specifikohej si shpërndarja e raportit të dy statistikave c2, secila me shkallët e veta të lirisë:

Nga kjo erdhi puna klasike e Fisher mbi analizën e variancës, një metodë statistikore e fokusuar në mënyrë eksplicite në analizën e mostrave të vogla.

Shpërndarja e mostrës F (ku n = df) përfaqësohet nga ekuacioni i mëposhtëm:

Ashtu si me shpërndarjen t, funksioni gama tregon se ekziston një familje shpërndarjesh që plotësojnë ekuacionin për F. Megjithatë, në këtë rast, analiza përfshin dy sasi df: numrin e shkallëve të lirisë për numëruesin dhe për emëruesi i raportit F.

Tabelat për vlerësimin e statistikave t dhe F. Kur testoni hipotezën zero duke përdorur S., bazuar në teorinë e mostrave të mëdha, zakonisht kërkohet vetëm një tabelë kërkimi - një tabelë e devijimeve normale (z), e cila ju lejon të përcaktoni zonën nën kurbën normale midis çdo dy vlerash z. në boshtin x. Megjithatë, tabelat për shpërndarjet t- dhe F paraqiten domosdoshmërisht në një grup tabelash, pasi këto tabela bazohen në një shumëllojshmëri shpërndarjesh që rezultojnë nga ndryshimi i numrit të shkallëve të lirisë. Megjithëse shpërndarjet t- dhe F janë shpërndarje të densitetit të probabilitetit, si shpërndarja normale për mostrat e mëdha, ato ndryshojnë nga këto të fundit në katër mënyra që përdoren për t'i përshkruar ato. Shpërndarja t, për shembull, është simetrike (shëno t2 në ekuacionin e saj) për të gjitha df-të, por bëhet gjithnjë e më e lartë kur madhësia e kampionit zvogëlohet. Kurbat me kulm (ato me kurtozë më të madhe se normalja) priren të jenë më pak asimptotike (d.m.th., më pak afër boshtit x në skajet e shpërndarjes) sesa kthesat me kurtozë normale, siç është kurba Gaussian. Ky ndryshim rezulton në mospërputhje të dukshme midis pikave në boshtin x që korrespondojnë me vlerat t dhe z. Me df = 5 dhe një nivel α me dy bishta prej 0,05, t = 2,57, ndërsa z = 1,96. Prandaj, t = 2.57 tregon rëndësi statistikore në nivelin 5%. Megjithatë, në rastin e një kurbë normale, z = 2.57 (më saktë 2.58) tashmë do të tregojë një nivel 1% të rëndësisë statistikore. Krahasime të ngjashme mund të bëhen me shpërndarjen F, pasi t është e barabartë me F kur numri i mostrave është dy.

Çfarë përbën një mostër "të vogël"?

Në një kohë, u ngrit pyetja se sa i madh duhet të jetë kampioni në mënyrë që të konsiderohet i vogël. Thjesht nuk ka një përgjigje të qartë për këtë pyetje. Megjithatë, kufiri konvencional ndërmjet një kampioni të vogël dhe një kampioni të madh konsiderohet të jetë df = 30. Baza për këtë vendim disi arbitrar është rezultati i krahasimit të shpërndarjes t me shpërndarjen normale. Siç u përmend më lart, mospërputhja midis vlerave t dhe z priret të rritet kur df zvogëlohet dhe zvogëlohet me rritjen e df. Në fakt, t fillon t'i afrohet nga afër z shumë përpara rastit kufizues ku t = z për df = ∞. Një ekzaminim i thjeshtë vizual i vlerave të tabelës së t tregon se ky përafrim bëhet mjaft i shpejtë, duke filluar nga df = 30 e lart. Vlerat krahasuese të t (në df = 30) dhe z janë të barabarta, përkatësisht: 2.04 dhe 1.96 për p = 0.05; 2,75 dhe 2,58 për p = 0,01; 3,65 dhe 3,29 për p = 0,001.

Statistikat e tjera për mostrat "të vogla".

Megjithëse statistikat si t dhe F janë krijuar posaçërisht për përdorim me mostra të vogla, ato janë njëlloj të zbatueshme për mostrat e mëdha. Megjithatë, ka shumë metoda të tjera statistikore të dizajnuara për të analizuar mostra të vogla dhe shpesh përdoren për këtë qëllim. Kjo i referohet të ashtuquajturit. metoda joparametrike ose pa shpërndarje. Në thelb, shkallët e paraqitura në këto metoda synohen të aplikohen në matjet e marra duke përdorur shkallë që nuk plotësojnë përkufizimin e shkallëve të raportit ose intervalit. Më shpesh këto janë matje rendore (grade) ose nominale. Shkallët joparametrike nuk kërkojnë supozime në lidhje me parametrat e shpërndarjes, veçanërisht në lidhje me vlerësimet e dispersionit, sepse shkallët rendore dhe nominale eliminojnë vetë konceptin e dispersionit. Për këtë arsye, metodat joparametrike përdoren gjithashtu për matjet e marra duke përdorur shkallët e intervalit dhe të raportit kur analizohen mostra të vogla dhe supozimet bazë të kërkuara për përdorimin e metodave parametrike ka të ngjarë të shkelen. Këto teste, të cilat mund të aplikohen në mënyrë të arsyeshme për mostrat e vogla, përfshijnë: testin e saktë të probabilitetit të Fisher, analizën joparametrike (rank) me dy faktorë të Friedman-it, koeficientin e korrelacionit të renditjes t të Kendall, koeficientin e konkordancës së Kendall-it (W), testin H të Kruskal-it - Wallace për analizën e variancës jo-parametrike (të renditjes), Mann-Whitney U-test, testi mesatar, testi i shenjave, koeficienti i korrelacionit të rangut të Spearman r dhe testi Wilcoxon t.

Gjatë studimit të ndryshueshmërisë, dallohen karakteristikat sasiore dhe cilësore, studimi i të cilave kryhet nga statistikat e variacionit, e cila bazohet në teorinë e probabilitetit. Probabiliteti tregon shpeshtësinë e mundshme të takimit të një individi me një tipar të caktuar. P=m/n, ku m është numri i individëve me një vlerë të caktuar tipare; n është numri i të gjithë individëve në grup. Probabiliteti varion nga 0 në 1 (për shembull, probabiliteti është 0.02 - shfaqja e binjakëve në një tufë, d.m.th., dy binjakë do të shfaqen për 100 pjellje). Kështu, objekti i studimit të biometrikës është një karakteristikë e ndryshueshme, studimi i së cilës kryhet në një grup të caktuar objektesh, d.m.th. tërësia. Ka popullata të përgjithshme dhe të mostrës. Popullatë Ky është një grup i madh individësh që na interesojnë bazuar në tiparin që studiohet. Popullata e përgjithshme mund të përfshijë një specie kafshësh ose race të së njëjtës specie. Popullsia (raca) e përgjithshme përfshin disa milionë kafshë. Në të njëjtën kohë, raca ndahet në shumë grupe, d.m.th. tufat e fermave individuale. Meqenëse popullsia e përgjithshme përbëhet nga një numër i madh individësh, është teknikisht e vështirë për ta studiuar atë. Prandaj, ata nuk studiojnë të gjithë popullsinë, por vetëm një pjesë të saj, e cila quhet me zgjedhje ose popullata e mostrës.

Bazuar në popullatën e mostrës, bëhet një gjykim për të gjithë popullatën në tërësi. Marrja e mostrave duhet të kryhet sipas të gjitha rregullave, të cilat duhet të përfshijnë individë me të gjitha vlerat e tipareve të ndryshme. Përzgjedhja e individëve nga popullata e përgjithshme bëhet sipas parimit të rastësisë ose me short. Në biometrikë, ekzistojnë dy lloje të kampionimit të rastësishëm: i madh dhe i vogël. Mostra e madhe ata e quajnë atë që përfshin më shumë se 30 individë ose vëzhgime, dhe mostër e vogël më pak se 30 individë. Ekzistojnë metoda të ndryshme të përpunimit të të dhënave për popullatën e mostrave të mëdha dhe të vogla. Burimi i informacionit statistikor mund të jenë të dhënat nga të dhënat zooteknike dhe veterinare, të cilat japin informacion për çdo kafshë që nga lindja deri në asgjësimin. Një burim tjetër informacioni mund të jenë të dhënat nga eksperimentet shkencore dhe prodhuese të kryera në një numër të kufizuar kafshësh. Pasi të merret mostra, fillon përpunimi. Kjo bën të mundur marrjen në formën e sasive matematikore të një numri sasish ose koeficientësh statistikorë që karakterizojnë karakteristikat e grupeve të kafshëve me interes.

Parametrat ose treguesit e mëposhtëm statistikorë janë marrë duke përdorur metodën biometrike:

1. Vlerat mesatare të një karakteristike të ndryshme (mesatarja aritmetike, modaliteti, mesatarja, mesatarja gjeometrike).

2. Koeficientët që masin sasinë e variacionit d.m.th. (ndryshueshmëria) e karakteristikës së studiuar (devijimi standard, koeficienti i variacionit).

3. Koeficientët që matin madhësinë e marrëdhënies ndërmjet karakteristikave (koeficienti i korrelacionit, koeficienti i regresionit dhe raporti i korrelacionit).

4. Gabimet statistikore dhe besueshmëria e të dhënave statistikore të marra.

5. Pjesa e variacionit që lind nën ndikimin e faktorëve të ndryshëm dhe treguesve të tjerë që lidhen me studimin e problemeve gjenetike dhe të përzgjedhjes.

Gjatë përpunimit statistikor të një kampioni, anëtarët e popullatës organizohen në formën e një serie variacionesh. Një seri variacionesh është një grupim i individëve në klasa në varësi të vlerës së tiparit që studiohet. Seria e variacioneve përbëhet nga dy elementë: klasa dhe një seri frekuencash. Seritë e variacioneve mund të jenë të ndërprera ose të vazhdueshme. Quhen tipare që mund të marrin vetëm një numër të plotë numër i ndërprerë kokat, numri i vezëve, numri i derrave dhe të tjera. Quhen tipare që mund të shprehen me numra thyesorë të vazhdueshme(lartësia cm, rendimenti i qumështit kg, % yndyrë, pesha e gjallë dhe të tjera).

Kur ndërtoni një seri variacionesh, respektohen parimet ose rregullat e mëposhtme:

1. Përcaktoni ose numëroni numrin e individëve për të cilët do të ndërtohet seria e variacionit (n).

2. Gjeni vlerën max dhe min të karakteristikës që studiohet.

3. Përcaktoni intervalin e klasës K = max - min / numri i klasave, numri i klasave merret në mënyrë arbitrare.

4. Ndërtoni klasa dhe përcaktoni kufirin e secilës klasë, min+K.

5. Ata shpërndajnë anëtarët e popullsisë në klasa.

Pas ndërtimit të klasave dhe shpërndarjes së individëve në klasa, llogariten treguesit kryesorë të serisë së variacionit (X, σ, Cv, Mх, Мσ, Мcv). Vlera mesatare e atributit mori vlerën më të madhe në karakterizimin e popullsisë. Gjatë zgjidhjes së të gjitha problemeve zooteknike, veterinare, mjekësore, ekonomike dhe të tjera, gjithmonë përcaktohet vlera mesatare e një tipari (rendimenti mesatar i qumështit për tufën, % yndyra, pjelloria në mbarështimin e derrit, prodhimi i vezëve te pulat dhe tipare të tjera). Parametrat që karakterizojnë vlerën mesatare të një karakteristike përfshijnë si më poshtë:

1. Mesatarja aritmetike.

2. Mesatarja aritmetike e ponderuar.

3. Mesatarja gjeometrike.

4. Moda (Mo).

5. Mediana (Me) dhe parametra të tjerë.

Mesatarja aritmetike na tregon se çfarë vlere tiparesh kishin individët e një grupi të caktuar nëse do të ishte e njëjtë për të gjithë, dhe përcaktohet nga formula X = A + b × K

Vetia kryesore e mesatares aritmetike është se eliminon ndryshimin e një karakteristike dhe e bën atë të përbashkët për të gjithë popullsinë. Njëkohësisht duhet theksuar se mesatarja aritmetike merr një kuptim abstrakt, d.m.th. gjatë llogaritjes së tij, fitohen tregues të pjesshëm, të cilët në realitet mund të mos ekzistojnë. Për shembull: rendimenti i viçave për 100 lopë është 85.3 viça, pjelloria e dosave është 11.8 derra, prodhimi i vezëve të pulave është 252.4 vezë dhe tregues të tjerë.

Vlera e mesatares aritmetike është shumë e lartë në praktikën e blegtorisë dhe karakteristikat e popullsisë. Në praktikën e blegtorisë, në veçanti të blegtorisë, përdoret një vlerë aritmetike e ponderuar për të përcaktuar përmbajtjen mesatare të yndyrës në qumësht gjatë laktacionit.

Vlera mesatare gjeometrike llogaritet nëse është e nevojshme të karakterizohet ritmi i rritjes, norma e rritjes së popullsisë, kur mesatarja aritmetike shtrembëron të dhënat.

Moda emërtoni vlerën e hasur më shpesh të një karakteristike të ndryshme, si sasiore ashtu edhe cilësore. Numri modal për një lopë është numri i gjirit-4. Edhe pse ka lopë me pesë ose gjashtë cipë. Në një seri variacionesh, klasa modale do të jetë klasa ku ka numrin më të madh të frekuencave dhe ne e përcaktojmë atë si klasën zero.

mesatare quhet një variant që i ndan të gjithë anëtarët e popullsisë në dy pjesë të barabarta. Gjysma e anëtarëve të popullatës do të kenë një vlerë tipare të ndryshueshme më të vogël se mesatarja, dhe gjysma tjetër do të ketë një vlerë më të madhe se mesatarja (për shembull: standardi i racës). Mesatarja përdoret më shpesh për të karakterizuar karakteristikat cilësore. Për shembull: forma e sisës është në formë kupe, e rrumbullakët, e dhisë. Me opsionin e saktë të kampionimit, të tre treguesit duhet të jenë të njëjtë (d.m.th. X, Mo, Me). Pra, karakteristika e parë e një popullsie janë vlerat mesatare, por ato nuk mjaftojnë për të gjykuar popullsinë.

Treguesi i dytë i rëndësishëm i çdo popullate është ndryshueshmëria ose ndryshueshmëria e tiparit. Ndryshueshmëria e një tipari përcaktohet nga shumë faktorë mjedisorë dhe faktorë të brendshëm, d.m.th. faktorët trashëgues.

Përcaktimi i ndryshueshmërisë së një tipari ka një rëndësi të madhe, si në biologji ashtu edhe në praktikën blegtorale. Kështu, duke përdorur parametrat statistikorë që matin shkallën e ndryshueshmërisë së një tipari, është e mundur të përcaktohen dallimet e racës në shkallën e ndryshueshmërisë së tipareve të ndryshme ekonomikisht të dobishme, të parashikohet niveli i përzgjedhjes në grupe të ndryshme kafshësh, si dhe efektiviteti i tij. .

Gjendja aktuale e analizës statistikore bën të mundur jo vetëm përcaktimin e shkallës së manifestimit të ndryshueshmërisë fenotipike, por edhe ndarjen e ndryshueshmërisë fenotipike në llojet përbërëse të saj, përkatësisht ndryshueshmërinë gjenotipike dhe paratipike. Ky zbërthim i ndryshueshmërisë bëhet duke përdorur analizën e variancës.

Treguesit kryesorë të ndryshueshmërisë janë vlerat e mëposhtme statistikore:

1. Limitet;

2. Devijimi standard (σ);

3. Koeficienti i ndryshueshmërisë ose variacionit (Cv).

Mënyra më e thjeshtë për të paraqitur sasinë e ndryshueshmërisë së një tipari është përmes kufijve. Kufijtë përcaktohen si më poshtë: diferenca midis vlerave maksimale dhe minimale të atributit. Sa më i madh ky ndryshim, aq më i madh është ndryshueshmëria e këtij tipari. Parametri kryesor për matjen e ndryshueshmërisë së një tipari është devijimi standard ose (σ) dhe përcaktohet nga formula:

σ = ±К ∙ √∑ Pa 2- b 2

Vetitë kryesore të devijimit standard d.m.th. (σ) janë si më poshtë:

1. Sigma është gjithmonë një vlerë e emërtuar dhe shprehet (në kg, g, metra, cm, copë).

2. Sigma është gjithmonë një vlerë pozitive.

3. Sa më e madhe të jetë vlera e σ, aq më e madhe është ndryshueshmëria e tiparit.

4. Në serinë e variacioneve, të gjitha frekuencat përfshihen në ±3σ.

Duke përdorur devijimin standard, mund të përcaktoni se cilës seri variacionesh i përket një individi i caktuar. Metodat për përcaktimin e ndryshueshmërisë së një karakteristike duke përdorur kufijtë dhe devijimin standard kanë të metat e tyre, pasi është e pamundur të krahasohen karakteristika të ndryshme bazuar në madhësinë e ndryshueshmërisë. Është e nevojshme të dihet ndryshueshmëria e tipareve të ndryshme në të njëjtën kafshë ose në të njëjtin grup kafshësh, për shembull: ndryshueshmëria në rendimentin e qumështit, përmbajtja e yndyrës në qumësht, pesha e gjallë, sasia e yndyrës së qumështit. Prandaj, duke krahasuar ndryshueshmërinë e karakteristikave të kundërta dhe duke identifikuar shkallën e ndryshueshmërisë së tyre, koeficienti i ndryshueshmërisë llogaritet duke përdorur formulën e mëposhtme:

Kështu, metodat kryesore për vlerësimin e ndryshueshmërisë së karakteristikave ndërmjet anëtarëve të një popullate janë: kufijtë; devijimi standard (σ) dhe koeficienti i variacionit ose ndryshueshmërisë.

Në praktikën e blegtorisë dhe kërkimet eksperimentale, shpesh duhet të merren me mostra të vogla. Mostra e vogël ata quajnë numrin e individëve ose kafshëve që nuk i kalon 30 ose më pak se 30. Modelet e vendosura duke përdorur një kampion të vogël transferohen në të gjithë popullatën. Për një kampion të vogël, përcaktohen të njëjtat parametra statistikorë si për një kampion të madh (X, σ, Cv, Mx). Megjithatë, formulat dhe llogaritjet e tyre ndryshojnë nga një mostër e madhe (d.m.th., nga formulat dhe llogaritjet e një serie variacionesh).

1. Vlera mesatare aritmetike X = ∑V

V - vlera absolute e opsionit ose karakteristikës;

n është numri i varianteve ose numri i individëve.

2. Devijimi standard σ = ± √ ∑α 2

α = x-¯x, ky është ndryshimi midis vlerës së opsionit dhe mesatares aritmetike. Ky ndryshim α është në katror dhe α 2 n-1 është numri i shkallëve të lirisë, d.m.th. numri i të gjitha varianteve ose individëve të reduktuar me një (1).

Pyetje kontrolli:

1. Çfarë është biometria?

2.Cilët parametra statistikorë karakterizojnë popullsinë?

3.Cilët tregues karakterizojnë ndryshueshmërinë?

4. Çfarë është një mostër e vogël

5. Çfarë janë modaliteti dhe mesatarja?

Leksioni nr 12

Bioteknologjia dhe transplantimi i embrionit

1. Koncepti i bioteknologjisë.

2. Përzgjedhja e lopëve dhuruese dhe marrëse, transplantimi i embrionit.

3. Rëndësia e transplantit në blegtori.

Në praktikën e hulumtimit statistikor haset shpesh mostra të vogla , të cilat kanë një vëllim më të vogël se 30 njësi. Mostrat e mëdha zakonisht përfshijnë mostra me më shumë se 100 njësi.

Zakonisht mostrat e vogla përdoren në rastet kur është e pamundur ose jopraktike të përdoret një mostër e madhe. Duhet të merret me mostra të tilla, për shembull, kur anketohen turistët dhe vizitorët e hoteleve.

Madhësia e gabimit të një kampioni të vogël përcaktohet duke përdorur formula që ndryshojnë nga ato për një madhësi relativisht të madhe të mostrës ().

Me një madhësi të vogël kampioni n Marrëdhënia ndërmjet variancës së mostrës dhe popullsisë duhet të merret parasysh:

Meqenëse në një kampion të vogël fraksioni është domethënës, varianca llogaritet duke marrë parasysh të ashtuquajturat numri i shkallëve të lirisë . Kuptohet si numri i opsioneve që mund të marrin vlera arbitrare pa ndryshuar vlerën e mesatares.

Gabimi mesatar i një kampioni të vogël përcaktohet nga formula:

Gabimi maksimal i kampionimit për mesataren dhe proporcionin gjendet në mënyrë të ngjashme me rastin e një kampioni të madh:

ku t është koeficienti i besimit, në varësi të nivelit të dhënë të rëndësisë dhe numrit të shkallëve të lirisë (Shtojca 5).

Vlerat e koeficientit varen jo vetëm nga probabiliteti i dhënë i besimit, por edhe nga madhësia e kampionit n. Për vlerat individuale të t dhe n, probabiliteti i besimit përcaktohet nga shpërndarja Student, e cila përmban shpërndarjet e devijimeve të standardizuara:

Koment. Ndërsa madhësia e kampionit rritet, shpërndarja Studenti i afrohet shpërndarjes normale: kur n=20 ndryshon pak nga shpërndarja normale. Gjatë kryerjes së anketave të vogla të mostrës, duhet pasur parasysh se sa më e vogël të jetë madhësia e kampionit n, aq më i madh është ndryshimi midis shpërndarjes Student dhe shpërndarjes normale. Për shembull, kur p min. = 4 ky ndryshim është mjaft domethënës, gjë që tregon një rënie në saktësinë e rezultateve të një kampioni të vogël.