Osnovni parametri malog uzorka. Mali uzorak

Metoda malog uzorka

Glavna prednost metode malog uzorka je mogućnost procjene dinamike procesa tijekom vremena, smanjujući vrijeme za računske postupke.

Trenutačni uzorci se nasumično biraju u određenim vremenskim razdobljima u rasponu od 5 do 20 jedinica. Razdoblje uzorkovanja utvrđuje se empirijski i ovisi o stabilnosti procesa, utvrđenoj analizom apriornih informacija.

Za svaki trenutni uzorak utvrđuju se glavne statističke karakteristike. Trenutačni uzorci i njihove glavne statističke karakteristike prikazani su u Dodatku B.

Postavlja se hipoteza o homogenosti disperzije uzorka i testira pomoću jednog od mogućih kriterija (Fisherov kriterij).

Testiranje hipoteze o homogenosti karakteristika uzorka.

Da bi se provjerila značajnost razlike između aritmetičkih sredina u 2 serije mjerenja, uvedena je mjera G. Izračuni su dati u Dodatku B

Pravilo odlučivanja je formulirano na sljedeći način:

gdje je tr vrijednost kvantila normalizirane distribucije pri danoj vjerojatnosti pouzdanosti P, ? = 0,095, n = 10, tr = 2,78.

Kada je nejednakost zadovoljena, hipoteza je potvrđena da razlika između srednjih vrijednosti uzorka nije značajna.

Budući da je nejednakost zadovoljena u svim slučajevima, potvrđena je hipoteza da razlika između srednjih vrijednosti uzorka nije značajna.

Za testiranje hipoteze o homogenosti varijanci uzorka uvodi se mjera F0 kao omjer nepristranih procjena varijanci rezultata 2 serije mjerenja. Štoviše, veća od 2 procjene uzima se kao brojnik i ako je Sx1>Sx2, tada

Rezultati proračuna dati su u Dodatku B.

Zatim se specificiraju vrijednosti vjerojatnosti pouzdanosti P i vrijednosti F(K1; K2; ?/2) se određuju s K1 = n1 - 1 i K2 = n2 - 1.

S P = 0,025 i K1 = 10-1 = 4 i K2 = 10-1 = 4 F (9;9;0,025/2) =4,1.

Pravilo odlučivanja: ako je F(K1; K2; ?/2)>F0, hipoteza o homogenosti varijanci u dva uzorka je prihvaćena.

Budući da je uvjet F(K1; K2; ?/2) > F0 zadovoljen u svim slučajevima, prihvaća se hipoteza o homogenosti varijanci.

Time je potvrđena hipoteza o homogenosti varijanci uzorka, što ukazuje na stabilnost procesa; potvrđena je hipoteza o homogenosti uzoraka srednjih vrijednosti metodom usporedbe srednjih vrijednosti, što znači da se središte disperzije nije promijenilo i proces je u stabilnom stanju.

Metoda raspršenog i preciznog dijagrama

U određenom vremenskom razdoblju uzimaju se trenutni uzorci od 3 do 10 proizvoda te se utvrđuju statističke karakteristike svakog uzorka.

Dobiveni podaci se ucrtavaju u dijagrame s vremenom na apscisnoj osi? ili brojevi k uzoraka, a na osi ordinata - pojedinačne vrijednosti xk ili vrijednost jednog od statističkih obilježja (aritmetička sredina uzorka, standardna devijacija uzorka). Osim toga, dvije vodoravne linije Tv i Tn nacrtane su na dijagramu, ograničavajući raspon tolerancije proizvoda.

Trenutačni uzorci dati su u Dodatku B.


Slika 1. dijagram točnosti

Dijagram jasno prikazuje napredak proizvodnog procesa. Može se koristiti za označavanje da je proizvodni proces nestabilan

Proširenje karakteristika uzorka na opću populaciju, temeljeno na zakonu velikih brojeva, zahtijeva dovoljno veliku veličinu uzorka. Međutim, u praksi statističkih istraživanja često se susrećemo s nemogućnošću, iz ovog ili onog razloga, povećanja broja jedinica uzorka koji imaju malu veličinu. To se odnosi na proučavanje djelatnosti poduzeća, obrazovnih institucija, poslovnih banaka itd., čiji je broj u regijama u pravilu neznatan, a ponekad iznosi samo 5-10 jedinica.

U slučaju kada se uzorak populacije sastoji od malog broja jedinica, manje od 30, poziva se uzorak mali U ovom slučaju, Lyapunovljev teorem ne može se koristiti za izračunavanje pogreške uzorkovanja, budući da je srednja vrijednost uzorka pod značajnim utjecajem vrijednosti svake od slučajno odabranih jedinica i njezina se distribucija može značajno razlikovati od normalne.

Godine 1908. V.S. Gosset je dokazao da procjena diskrepancije između uzorka srednje vrijednosti malog uzorka i opće sredine ima poseban zakon distribucije (vidi Poglavlje 4). Baveći se problemom probabilističke procjene uzoračke sredine s malim brojem opažanja, pokazao je da je u ovom slučaju potrebno uzeti u obzir distribuciju ne samih uzoračkih sredina, već veličine njihovih odstupanja od sredine uzorka. izvorno stanovništvo. U ovom slučaju zaključci mogu biti prilično pouzdani.

Studentovo otkriće se zove teorija malog uzorka.

Pri procjeni rezultata malog uzorka u izračunima se ne koristi vrijednost opće varijance. U malim uzorcima, "ispravljena" varijanca uzorka koristi se za izračun prosječne pogreške uzorkovanja:

oni. za razliku od velikih uzoraka u nazivniku umjesto P troškovi (i - 1). Izračun prosječne pogreške uzorkovanja za mali uzorak dan je u tablici. 5.7.

Tablica 5.7

Izračun prosječne pogreške malog uzorka

Granična greška malog uzorka je: gdje t- faktor povjerenja.

Veličina t drugačije se odnosi na vjerojatnu procjenu nego na veliki uzorak. U skladu sa Studentovom distribucijom, vjerojatna procjena ovisi o obje vrijednosti t, i na veličini uzorka I u slučaju da granična pogreška ne prelazi r-struku prosječnu pogrešku u malim uzorcima. Međutim, to uvelike ovisi o broju odabranih jedinica.

V.S. Gosset je sastavio tablicu distribucije vjerojatnosti u malim uzorcima koji odgovaraju zadanim vrijednostima koeficijenta pouzdanosti t i različite količine malog uzorka, a izvadak iz njega dan je u tablici. 5.8.

Tablica 5.8

Fragment Studentove tablice vjerojatnosti (vjerojatnosti pomnožene s 1000)

Tablični podaci 5.8 pokazuju da s neograničenim povećanjem veličine uzorka (i = °°), Studentova distribucija teži normalnom zakonu distribucije, a pri i = 20 malo se razlikuje od njega.

Tablica distribucije učenika često se daje u drugom obliku, pogodnijem za praktičnu upotrebu (tablica 5.9).

Tablica 5.9

Neke vrijednosti (Studentove t-distribucije

Broj stupnjeva slobode

za jednosmjerni interval

za dvosmjerni razmak

P= 0,99

Pogledajmo kako koristiti tablicu distribucije. Svaka fiksna vrijednost P izračunati broj stupnjeva slobode k, Gdje k = n - 1. Za svaku vrijednost stupnja slobode navedena je granična vrijednost t p (t 095 ili t 0 99), koji uz zadanu vjerojatnost R neće biti premašen zbog slučajnih fluktuacija u rezultatima uzorkovanja. Na temelju veličine t str određuju se granice povjerenja

interval

U pravilu se koristi razina pouzdanosti za dvostrano testiranje P = 0,95 ili P = 0,99, što ne isključuje izbor drugih vrijednosti vjerojatnosti. Vrijednost vjerojatnosti odabire se na temelju specifičnih zahtjeva zadataka za koje se koristi mali uzorak.

Vjerojatnost da opće prosječne vrijednosti izađu izvan intervala pouzdanosti jednaka je q, Gdje q = 1 - R. Ova vrijednost je vrlo mala. Prema tome, za razmatrane vjerojatnosti R to je 0,05 i 0,01.

Mali uzorci rašireni su u tehničkim znanostima i biologiji, ali se u statističkim istraživanjima moraju koristiti s velikim oprezom, samo uz odgovarajuću teoretsku i praktičnu provjeru. Mali uzorak može se koristiti samo ako je distribucija obilježja u populaciji normalna ili joj je bliska, a prosječna vrijednost se izračunava iz podataka uzorka dobivenih kao rezultat neovisnih promatranja. Osim toga, imajte na umu da je točnost rezultata iz malog uzorka niža nego iz velikog uzorka.

statistika malog uzorka

Općenito je prihvaćeno da je početak S. m.v. ili, kako se često naziva, statistika “malih n”, utemeljena je u prvom desetljeću 20. stoljeća objavljivanjem rada W. Gosseta, u koji je smjestio t-distribuciju koju je postulirao “student” koji svjetsku slavu stekao nešto kasnije. Gossett je u to vrijeme radio kao statističar u Guinnessovoj pivovari. Jedna od njegovih dužnosti bila je analiza uzastopnih serija bačvica svježe pripremljenog portera. Iz razloga koji nikada nije objasnio, Gossett je eksperimentirao s idejom značajnog smanjenja broja uzoraka uzetih iz vrlo velikog broja bačvi u skladištima pivovare kako bi nasumično kontrolirao kvalitetu portera. To ga je navelo da pretpostavi t-distribuciju. Budući da su statuti Guinnessovih pivovara zabranjivali njihovim zaposlenicima objavljivanje rezultata istraživanja, Gossett je anonimno objavio rezultate svog eksperimenta uspoređujući uzorkovanje kontrole kvalitete pomoću t-distribucije za male uzorke i tradicionalne z-distribucije (normalna distribucija), pod pseudonimom "Student " - otuda i naziv Studentova t-distribucija).

t-distribucija. Teorija t-distribucije, kao i teorija z-distribucije, koristi se za testiranje nulte hipoteze da su dva uzorka jednostavno nasumični uzorci iz iste populacije i stoga su izračunate statistike (npr. srednja vrijednost i standardna devijacija) nepristrane procjene parametara populacije. Međutim, za razliku od teorije normalne distribucije, teorija t-distribucije za male uzorke ne zahtijeva apriorno znanje niti precizne procjene očekivane vrijednosti i varijance populacije. Štoviše, iako testiranje razlike između srednjih vrijednosti dva velika uzorka za statističku značajnost zahtijeva temeljnu pretpostavku da su karakteristike populacije normalno raspoređene, teorija t distribucije ne zahtijeva pretpostavke o parametrima.

Dobro je poznato da se normalno raspodijeljene karakteristike opisuju jednom jedinom krivuljom - Gaussovom krivuljom, koja zadovoljava sljedeću jednadžbu:

Uz t-distribuciju, cijela obitelj krivulja predstavljena je sljedećom formulom:

Zbog toga jednadžba za t uključuje gama funkciju, što u matematici znači da kako se n mijenja, druga krivulja će zadovoljiti danu jednadžbu.

Stupnjevi slobode

U jednadžbi za t, slovo n označava broj stupnjeva slobode (df) povezanih s procjenom varijance populacije (S2), koja predstavlja drugi moment bilo koje funkcije generiranja momenta, kao što je jednadžba za t distribuciju . U S., broj stupnjeva slobode pokazuje koliko karakteristika ostaje slobodno nakon njihove djelomične upotrebe u određenoj vrsti analize. U t-distribuciji, jedno od odstupanja od srednje vrijednosti uzorka uvijek je fiksno, jer zbroj svih takvih odstupanja mora biti jednak nuli. To utječe na zbroj kvadrata pri izračunavanju varijance uzorka kao nepristrane procjene parametra S2 i dovodi do toga da je df jednak broju mjerenja minus jedan za svaki uzorak. Dakle, u formulama i postupcima za izračunavanje t-statistike za testiranje nulte hipoteze, df = n - 2.

F-pacndivision. Nulta hipoteza testirana t testom je da su dva uzorka nasumično izvučena iz iste populacije ili su nasumično izvučena iz dvije različite populacije s istom varijancom. Ali što ako trebate analizirati više grupa? Za odgovorom na ovo pitanje tragalo se dvadeset godina nakon što je Gosset otkrio t-distribuciju. U njegovu su izradu izravno sudjelovala dva najeminentnija statističara 20. stoljeća. Jedan je najveći engleski statističar R. A. Fisher, koji je predložio prve teorije. formulacije čiji je razvoj doveo do proizvodnje F-distribucije; njegov rad o teoriji malog uzorka, razvijajući Gossetove ideje, objavljen je sredinom 20-ih (Fisher, 1925.). Drugi je George Snedecor, jedan iz plejade ranih američkih statističara, koji je razvio način usporedbe dva neovisna uzorka bilo koje veličine izračunavanjem omjera dviju procjena varijance. On je ovaj odnos nazvao F-omjer, prema Fischeru. Rezultati istraživanja Snedecor je doveo do činjenice da se F-distribucija počela specificirati kao distribucija omjera dviju statistika c2, svaka sa svojim stupnjevima slobode:

Iz toga je proizašao Fisherov klasični rad o analizi varijance, statističkoj metodi koja je eksplicitno usmjerena na analizu malih uzoraka.

Distribucija uzorkovanja F (gdje je n = df) predstavljena je sljedećom jednadžbom:

Kao i kod t-distribucije, gama funkcija pokazuje da postoji obitelj distribucija koje zadovoljavaju jednadžbu za F. U ovom slučaju, međutim, analiza uključuje dvije df veličine: broj stupnjeva slobode za brojnik i za nazivnik F-omjera.

Tablice za procjenu t- i F-statistike. Pri testiranju nulte hipoteze pomoću S., na temelju teorije velikih uzoraka, obično je potrebna samo jedna tablica pretraživanja - tablica normalnih odstupanja (z), koja vam omogućuje određivanje površine ispod normalne krivulje između bilo koje dvije z vrijednosti na x-osi. Međutim, tablice za t- i F-distribucije nužno su prikazane u skupu tablica, budući da se te tablice temelje na različitim distribucijama koje proizlaze iz variranja broja stupnjeva slobode. Iako su t- i F-distribucije distribucije gustoće vjerojatnosti, poput normalne distribucije za velike uzorke, razlikuju se od potonjih na četiri načina koji se koriste za njihovo opisivanje. Distribucija t je, na primjer, simetrična (zabilježite t2 u njezinoj jednadžbi) za sve df, ali postaje sve vršnija kako se veličina uzorka smanjuje. Vršne krivulje (one s kurtozom većom od normalne) imaju tendenciju da budu manje asimptotične (tj. manje su blizu x-osi na krajevima distribucije) nego krivulje s normalnom kurtozom, kao što je Gaussova krivulja. Ova razlika rezultira vidljivim odstupanjima između točaka na x-osi koje odgovaraju vrijednostima t i z. S df = 5 i dvosmjernom α razinom od 0,05, t = 2,57, dok je odgovarajući z = 1,96. Stoga t = 2,57 označava statističku značajnost na razini od 5%. No, u slučaju normalne krivulje, z = 2,57 (točnije 2,58) već će označavati razinu statističke značajnosti od 1%. Slične usporedbe mogu se napraviti s F distribucijom, budući da je t jednako F kada je broj uzoraka dva.

Što čini "mali" uzorak?

Svojedobno se postavljalo pitanje koliki treba biti uzorak da bi se smatrao malim. Jednostavan odgovor na ovo pitanje jednostavno ne postoji. Međutim, smatra se da je konvencionalna granica između malog i velikog uzorka df = 30. Osnova za ovu donekle proizvoljnu odluku rezultat je usporedbe t-distribucije s normalnom distribucijom. Kao što je gore navedeno, razlika između t i z vrijednosti ima tendenciju povećanja kako se df smanjuje i smanjuje kako se df povećava. Zapravo, t se počinje približavati z mnogo prije graničnog slučaja gdje je t = z za df = ∞. Jednostavan vizualni pregled tabličnih vrijednosti t pokazuje da ova aproksimacija postaje prilično brza, počevši od df = 30 i više. Usporedne vrijednosti t (pri df = 30) i z jednake su: 2,04 i 1,96 za p = 0,05; 2,75 i 2,58 za p = 0,01; 3,65 i 3,29 za p = 0,001.

Ostale statistike za “male” uzorke

Iako su statistike kao što su t i F posebno dizajnirane za korištenje s malim uzorcima, jednako su primjenjive i na velike uzorke. Postoje, međutim, mnoge druge statističke metode namijenjene analizi malih uzoraka i često se koriste u tu svrhu. To se odnosi na tzv. neparametarske ili metode bez distribucije. Uglavnom, ljestvice koje se pojavljuju u ovim metodama namijenjene su za primjenu na mjerenja dobivena korištenjem ljestvica koje ne zadovoljavaju definiciju omjernih ili intervalnih ljestvica. Najčešće su to redne (rang) ili nazivne mjere. Neparametarske ljestvice ne zahtijevaju pretpostavke o parametrima distribucije, posebice o procjenama disperzije, jer ordinalne i nominalne ljestvice eliminiraju sam koncept disperzije. Iz tog razloga, neparametarske metode se također koriste za mjerenja dobivena korištenjem skala intervala i omjera kada se analiziraju mali uzorci i kada je vjerojatno da će osnovne pretpostavke potrebne za upotrebu parametarskih metoda biti narušene. Ovi testovi, koji se razumno mogu primijeniti na male uzorke, uključuju: Fisherov egzaktni test vjerojatnosti, Friedmanovu dvofaktorsku neparametrijsku (rang) analizu varijance, Kendallov t rang koeficijent korelacije, Kendallov koeficijent podudarnosti (W), Kruskalov H test - Wallace za neparametarsku (rang) jednosmjernu analizu varijance, Mann-Whitneyjev U-test, test medijana, test predznaka, Spearmanov koeficijent korelacije ranga r i Wilcoxonov t-test.

Pri proučavanju varijabilnosti razlikuju se kvantitativna i kvalitativna obilježja čije se proučavanje provodi varijacijskom statistikom koja se temelji na teoriji vjerojatnosti. Vjerojatnost ukazuje na moguću učestalost pojedinca s određenom osobinom. P=m/n, gdje je m broj jedinki s određenom vrijednošću svojstva; n je broj svih jedinki u grupi. Vjerojatnost se kreće od 0 do 1 (npr. vjerojatnost je 0,02 - pojava blizanaca u stadu, tj. na 100 teljenja pojavit će se dva blizanca). Dakle, predmet proučavanja biometrije je različita karakteristika, čije se proučavanje provodi na određenoj skupini objekata, tj. totalitet. Postoje opća i ogledna populacija. Populacija Ovo je velika skupina pojedinaca koja nas zanima na temelju osobine koja se proučava. Opća populacija može uključivati ​​vrstu životinje ili pasminu iste vrste. Opća populacija (pasmina) uključuje nekoliko milijuna životinja. U isto vrijeme, pasmina se dijeli na mnoge skupine, tj. stada individualnih farmi. Budući da se opća populacija sastoji od velikog broja jedinki, tehnički ju je teško proučavati. Stoga ne proučavaju cjelokupno stanovništvo, već samo jedan njegov dio, koji je tzv izborni ili uzorak populacije.

Na temelju uzorka populacije donosi se sud o cjelokupnoj populaciji kao cjelini. Uzorkovanje se mora provoditi prema svim pravilima, pri čemu moraju biti obuhvaćene jedinke sa svim vrijednostima varirajućeg svojstva. Odabir jedinki iz opće populacije provodi se po principu slučajnosti ili ždrijebom. U biometriji postoje dvije vrste nasumičnog uzorkovanja: veliko i malo. Veliki uzorak naziva se onaj koji uključuje više od 30 pojedinaca ili opažanja, te mali uzorak manje od 30 osoba. Postoje različite metode obrade podataka za velike i male uzorke populacije. Izvor statističkih podataka mogu biti podaci iz zootehničkih i veterinarskih evidencija, koji daju podatke o svakoj životinji od rođenja do zbrinjavanja. Drugi izvor informacija mogu biti podaci iz znanstvenih i proizvodnih pokusa provedenih na ograničenom broju životinja. Nakon što je uzorak dobiven, počinje obrada. To omogućuje dobivanje niza statističkih veličina ili koeficijenata u obliku matematičkih veličina koji karakteriziraju značajke skupina životinja od interesa.

Biometrijskom metodom dobivaju se sljedeći statistički parametri ili pokazatelji:

1. Prosječne vrijednosti varirajuće karakteristike (aritmetička sredina, mod, medijan, geometrijska sredina).

2. Koeficijenti koji mjere količinu varijacije tj. (varijabilnost) karakteristike koja se proučava (standardna devijacija, koeficijent varijacije).

3. Koeficijenti koji mjere veličinu odnosa između obilježja (koeficijent korelacije, koeficijent regresije i omjer korelacije).

4. Statističke pogreške i pouzdanost dobivenih statističkih podataka.

5. Udio varijacije koji nastaje pod utjecajem različitih čimbenika i drugih pokazatelja koji su povezani s proučavanjem genetičkih i selekcijskih problema.

Pri statističkoj obradi uzorka članovi populacije organizirani su u obliku varijacijskog niza. Niz varijacija je grupiranje jedinki u klase ovisno o vrijednosti osobine koja se proučava. Varijacijski niz sastoji se od dva elementa: klasa i niza frekvencija. Serije varijacija mogu biti isprekidane ili kontinuirane. Pozivaju se značajke koje mogu uzeti samo cijeli broj isprekidani broj grla, broj jaja, broj prasadi i dr. Obilježja koja se mogu izraziti razlomačkim brojevima nazivaju se stalan(visina cm, mliječnost kg, % masti, živa težina i drugo).

Pri izradi niza varijacija pridržavaju se sljedećih načela ili pravila:

1. Odredite ili prebrojite broj pojedinaca za koje će se konstruirati niz varijacija (n).

2. Pronađite maksimalnu i minimalnu vrijednost karakteristike koja se proučava.

3. Odrediti interval razreda K = max - min / broj razreda, broj razreda se uzima proizvoljno.

4. Konstruirati klase i odrediti granicu svake klase, min+K.

5. Članove stanovništva raspoređuju u klase.

Nakon konstruiranja razreda i raspodjele jedinki u razrede, izračunavaju se glavni pokazatelji varijacijskog niza (X, σ, Cv, Mh, Mσ, Mcv). Prosječna vrijednost atributa dobila je najveću vrijednost u karakterizaciji populacije. Pri rješavanju svih zootehničkih, veterinarskih, medicinskih, ekonomskih i drugih problema uvijek se utvrđuje prosječna vrijednost nekog svojstva (prosječna mliječnost za stado, % masti, plodnost u uzgoju svinja, proizvodnja jaja kod kokoši i druga svojstva). Parametri koji karakteriziraju prosječnu vrijednost karakteristike uključuju sljedeće:

1. Aritmetička sredina.

2. Ponderirana aritmetička sredina.

3. Geometrijska sredina.

4. Moda (Mo).

5. Medijan (Me) i drugi parametri.

Aritmetička sredina pokazuje nam koju vrijednost osobina imaju pojedinci određene skupine ako je ista za sve, a određuje se formulom X = A + b × K

Glavno svojstvo aritmetičke sredine je da eliminira varijaciju obilježja i čini ga zajedničkim za cijelu populaciju. Pritom treba napomenuti da aritmetička sredina poprima apstraktno značenje, tj. pri njegovom izračunavanju dobivaju se frakcijski pokazatelji koji u stvarnosti možda i ne postoje. Na primjer: prinos teladi na 100 krava je 85,3 teladi, plodnost krmača je 11,8 prasadi, proizvodnja jaja kokoši je 252,4 jaja i drugi pokazatelji.

Vrijednost aritmetičke sredine vrlo je visoka u stočarskoj praksi i karakteristikama populacije. U praksi stočarstva, posebno stočarstva, za određivanje prosječnog sadržaja masti u mlijeku tijekom laktacije koristi se ponderirana aritmetička vrijednost.

Geometrijska srednja vrijednost izračunava se ako je potrebno karakterizirati stopu rasta, stopu povećanja populacije, kada aritmetička sredina iskrivljuje podatke.

Moda imenovati najčešće susrećene vrijednosti različitih karakteristika, kvantitativnih i kvalitativnih. Modalni broj za kravu je sisa broj-4. Iako ima krava s pet-šest sisa. U nizu varijacija, modalna klasa bit će klasa u kojoj postoji najveći broj frekvencija i mi je definiramo kao nultu klasu.

Medijan naziva se varijanta koja sve članove populacije dijeli na dva jednaka dijela. Polovica članova populacije imat će vrijednost varijable osobine manju od medijana, a druga polovica će imati vrijednost veću od medijana (na primjer: standard pasmine). Medijan se najčešće koristi za karakterizaciju kvalitativnih karakteristika. Na primjer: oblik vimena je čašičast, okrugao, kozji. S ispravnom opcijom uzorkovanja, sva tri pokazatelja bi trebala biti ista (tj. X, Mo, Me). Dakle, prva karakteristika populacije su prosječne vrijednosti, ali one nisu dovoljne za prosudbu populacije.

Drugi važan pokazatelj svake populacije je varijabilnost ili varijabilnost svojstva. Varijabilnost svojstva određena je mnogim čimbenicima okoline i unutarnjim čimbenicima, tj. nasljedni faktori.

Utvrđivanje varijabilnosti svojstva od velike je važnosti, kako u biologiji, tako iu praksi stočarstva. Tako je pomoću statističkih parametara kojima se mjeri stupanj varijabilnosti neke osobine moguće utvrditi pasminske razlike u stupnju varijabilnosti različitih gospodarski korisnih svojstava, predvidjeti razinu selekcije u različitim skupinama životinja, kao i njezinu učinkovitost. .

Sadašnje stanje statističke analize omogućuje ne samo utvrđivanje stupnja izraženosti fenotipske varijabilnosti, već i podjelu fenotipske varijabilnosti na sastavne tipove, naime genotipsku i paratipsku varijabilnost. Ova dekompozicija varijabilnosti provodi se analizom varijance.

Glavni pokazatelji varijabilnosti su sljedeće statističke vrijednosti:

1. Granice;

2. Standardna devijacija (σ);

3. Koeficijent varijabilnosti ili varijacije (Cv).

Najjednostavniji način da se prikaže količina varijabilnosti svojstva je kroz granice. Granice se određuju na sljedeći način: razlika između maksimalne i minimalne vrijednosti atributa. Što je ta razlika veća, to je veća varijabilnost ove osobine. Glavni parametar za mjerenje varijabilnosti svojstva je standardna devijacija ili (σ) i određuje se formulom:

σ = ±K ∙ √∑ Pa 2- b 2

Glavna svojstva standardne devijacije tj. (σ) su kako slijedi:

1. Sigma je uvijek imenovana vrijednost i izražava se (u kg, g, metrima, cm, kom.).

2. Sigma je uvijek pozitivna vrijednost.

3. Što je veća vrijednost σ, veća je varijabilnost svojstva.

4. U nizu varijacija sve su frekvencije uključene u ±3σ.

Pomoću standardne devijacije možete odrediti kojem nizu varijacija određena osoba pripada. Metode za određivanje varijabilnosti obilježja korištenjem granica i standardne devijacije imaju svoje nedostatke, budući da je nemoguće usporediti različite karakteristike na temelju veličine varijabilnosti. Potrebno je poznavati varijabilnost raznih svojstava kod iste životinje ili iste skupine životinja, npr.: varijabilnost mliječnosti, sadržaja masti u mlijeku, žive mase, količine mliječne masti. Stoga se usporedbom varijabilnosti suprotnih obilježja i utvrđivanjem stupnja njihove varijabilnosti koeficijent varijabilnosti izračunava prema sljedećoj formuli:

Dakle, glavne metode za procjenu varijabilnosti karakteristika među pripadnicima populacije su: granice; standardna devijacija (σ) i koeficijent varijacije ili varijabilnosti.

U stočarskoj praksi i eksperimentalnim istraživanjima često se radi o malim uzorcima. Mali uzorak nazivaju broj jedinki ili životinja koji ne prelazi 30 ili manje od 30. Utvrđeni obrasci prenose se na cjelokupnu populaciju pomoću malog uzorka. Za mali uzorak određuju se isti statistički parametri kao i za veliki uzorak (X, σ, Cv, Mx). Međutim, njihove formule i izračuni razlikuju se od velikog uzorka (tj. od formula i izračuna niza varijacija).

1. Aritmetička sredina vrijednosti X = ∑V

V - apsolutna vrijednost opcije ili karakteristike;

n je broj varijanti ili broj jedinki.

2. Standardna devijacija σ = ± √ ∑α 2

α = x-¯x, to je razlika između vrijednosti opcije i aritmetičke sredine. Ova razlika α je na kvadrat i α 2 n-1 je broj stupnjeva slobode, tj. broj svih varijanti ili pojedinaca smanjen za jedan (1).

Kontrolna pitanja:

1.Što je biometrija?

2.Koji statistički parametri karakteriziraju populaciju?

3.Koji pokazatelji karakteriziraju varijabilnost?

4.Što je mali uzorak

5. Što su moda i medijan?

Predavanje br.12

Biotehnologija i transplantacija embrija

1. Pojam biotehnologije.

2. Odabir krava donora i primatelja, transplantacija embrija.

3. Značaj transplantacije u stočarstvu.

U praksi statističkih istraživanja često se susreće male uzorke , koji imaju volumen manji od 30 jedinica. Veliki uzorci obično uključuju uzorke od više od 100 jedinica.

Obično se mali uzorci koriste u slučajevima kada je nemoguće ili nepraktično koristiti veliki uzorak. S takvim se uzorcima treba pozabaviti, primjerice, anketiranjem turista i posjetitelja hotela.

Veličina pogreške malog uzorka određena je pomoću formula koje se razlikuju od onih za relativno veliki uzorak ().

S malom veličinom uzorka n treba uzeti u obzir odnos između varijance uzorka i populacije:

Budući da je u malom uzorku udio značajan, varijanca se izračunava uzimajući u obzir tzv broj stupnjeva slobode . Shvaća se kao broj opcija koje mogu uzeti proizvoljne vrijednosti bez promjene vrijednosti prosjeka.

Prosječna pogreška malog uzorka određena je formulom:

Najveća pogreška uzorkovanja za srednju vrijednost i udio nalazi se slično kao u slučaju velikog uzorka:

gdje je t koeficijent pouzdanosti, ovisno o zadanoj razini značajnosti i broju stupnjeva slobode (prilog 5).

Vrijednosti koeficijenata ovise ne samo o danoj vjerojatnosti pouzdanosti, već i o veličini uzorka n. Za pojedinačne vrijednosti t i n, vjerojatnost pouzdanosti određena je Studentovom distribucijom koja sadrži distribucije standardiziranih odstupanja:

Komentar. Kako se veličina uzorka povećava, Studentova se distribucija približava normalnoj distribuciji: kada n=20 malo se razlikuje od normalne distribucije. Pri provođenju istraživanja malog uzorka treba voditi računa da što je manji uzorak n, veća je razlika između Studentove distribucije i normalne distribucije. Na primjer, kada p min . = 4 ova razlika je prilično značajna, što ukazuje na smanjenje točnosti rezultata malog uzorka.