Maza parauga pamatparametri. Neliels paraugs

Mazo paraugu metode

Mazās izlases metodes galvenā priekšrocība ir iespēja novērtēt procesa dinamiku laika gaitā, samazinot laiku skaitļošanas procedūrām.

Momentānie paraugi tiek nejauši atlasīti noteiktos laika periodos no 5 līdz 20 vienībām. Izlases periods tiek noteikts empīriski un ir atkarīgs no procesa stabilitātes, ko nosaka, analizējot a priori informāciju.

Katrai momentānai izlasei tiek noteikti galvenie statistiskie raksturlielumi. Momentānie paraugi un to galvenie statistiskie raksturlielumi ir sniegti B pielikumā.

Tiek izvirzīta hipotēze par parauga dispersijas viendabīgumu un pārbaudīta, izmantojot vienu no iespējamiem kritērijiem (Fišera kritērijs).

Hipotēzes par izlases raksturlielumu viendabīguma pārbaude.

Lai pārbaudītu vidējo aritmētisko atšķirību nozīmi 2 mērījumu sērijās, B pielikumā ir sniegts mērījums G

Lēmuma noteikums ir formulēts šādi:

kur tr ir normalizētā sadalījuma kvantiles vērtība pie noteiktas ticamības varbūtības P, ? = 0,095, n = 10, tр = 2,78.

Kad nevienlīdzība ir izpildīta, tiek apstiprināta hipotēze, ka atšķirība starp izlases vidējiem nav būtiska.

Tā kā nevienlīdzība ir izpildīta visos gadījumos, apstiprinās hipotēze, ka atšķirība starp izlases vidējiem nav būtiska.

Lai pārbaudītu hipotēzi par izlases dispersiju viendabīgumu, F0 mērs tiek ieviests kā objektīvu novērtējumu attiecība pret 2 mērījumu sēriju rezultātu dispersiju. Turklāt lielākais no 2 aprēķiniem tiek ņemts par skaitītāju un, ja Sx1>Sx2, tad

Aprēķinu rezultāti ir sniegti B pielikumā.

Tad tiek noteiktas ticamības varbūtības P vērtības un F(K1; K2; ?/2) vērtības tiek noteiktas ar K1 = n1 - 1 un K2 = n2 - 1.

Ar P = 0,025 un K1 = 10-1 = 4 un K2 = 10-1 = 4 F (9; 9; 0,025/2) = 4,1.

Lēmuma noteikums: ja F(K1; K2; ?/2)>F0, tad tiek pieņemta hipotēze par dispersiju homogenitāti abās izlasēs.

Tā kā nosacījums F(K1; K2; ?/2) > F0 ir izpildīts visos gadījumos, tiek pieņemta hipotēze par dispersiju homogenitāti.

Tādējādi apstiprinās hipotēze par izlases dispersiju viendabīgumu, kas norāda uz procesa stabilitāti; apstiprinās hipotēze par izlases līdzekļu viendabīgumu, izmantojot vidējo salīdzināšanas metodi, kas nozīmē, ka dispersijas centrs nav mainījies un process ir stabilā stāvoklī.

Izkliedes un precizitātes diagrammas metode

Noteiktā laika periodā tiek ņemti momentālie paraugi no 3 līdz 10 produktiem un noteikti katra parauga statistiskie raksturlielumi.

Iegūtos datus attēlo diagrammās ar laiku uz abscisu ass? vai paraugu skaitļi k, bet uz ordinātu ass - atsevišķas xk vērtības vai viena statistiskā raksturlieluma vērtība (izlases vidējais aritmētiskais, izlases standartnovirze). Turklāt diagrammā ir novilktas divas horizontālas līnijas Тв un Тн, kas ierobežo produkta pielaides diapazonu.

Momentānie paraugi ir doti B pielikumā.


1. attēla precizitātes diagramma

Diagramma skaidri parāda ražošanas procesa gaitu. To var izmantot, lai norādītu, ka ražošanas process ir nestabils

Izlases raksturlielumu attiecināšana uz vispārējo populāciju, pamatojoties uz lielo skaitļu likumu, prasa pietiekami lielu izlases lielumu. Taču statistikas pētījumu praksē bieži vien ir sastopama iespēja viena vai otra iemesla dēļ palielināt to izlases vienību skaitu, kurām ir mazs izmērs. Tas attiecas uz uzņēmumu, izglītības iestāžu, komercbanku uc darbības izpēti, kuru skaits reģionos parasti ir niecīgs un dažkārt sasniedz tikai 5-10 vienības.

Gadījumā, ja izlases kopa sastāv no neliela vienību skaita, mazāk nekā 30, tiek izsaukta izlase mazsŠajā gadījumā izlases kļūdas aprēķināšanai nevar izmantot Ļapunova teorēmu, jo izlases vidējo lielumu būtiski ietekmē katras nejauši izvēlētās vienības vērtība un tās sadalījums var būtiski atšķirties no parastā.

1908. gadā V.S. Gosets pierādīja, ka nelielas izlases un vispārējā vidējā izlases vidējās neatbilstības novērtējumam ir īpašs sadalījuma likums (sk. 4. nodaļu). Risinot izlases vidējā varbūtības noteikšanas problēmu ar nelielu novērojumu skaitu, viņš parādīja, ka šajā gadījumā ir jāņem vērā nevis pašu izlases vidējo sadalījums, bet gan to noviržu lielums no vidējā lieluma. sākotnējā populācija. Šajā gadījumā secinājumi var būt diezgan ticami.

Studentu atklājums sauc mazo paraugu teorija.

Novērtējot nelielas izlases rezultātus, aprēķinos netiek izmantota vispārējās dispersijas vērtība. Mazos paraugos, lai aprēķinātu vidējo izlases kļūdu, tiek izmantota “labotā” izlases dispersija:

tie. atšķirībā no lielajiem paraugiem saucējā vietā P izmaksas (un - 1). Vidējās izlases kļūdas aprēķins nelielam paraugam ir dots tabulā. 5.7.

5.7. tabula

Nelielas izlases vidējās kļūdas aprēķins

Nelielas izlases robežkļūda ir: kur t- uzticības faktors.

Lielums t attiecas uz iespējamo novērtējumu nekā ar lielu izlasi. Saskaņā ar Studenta sadalījumu iespējamais novērtējums ir atkarīgs no abām vērtībām t, un par izlases lielumu I gadījumā, ja robežkļūda nepārsniedz r reizes vidējo kļūdu mazos izlasēs. Tomēr tas lielā mērā ir atkarīgs no izvēlēto vienību skaita.

V.S. Gossets sastādīja tabulu ar varbūtības sadalījumu mazos paraugos, kas atbilst ticamības koeficienta dotajām vērtībām t un dažāda apjoma neliela parauga un, izvilkums no tā dots tabulā. 5.8.

5.8. tabula

Studenta varbūtību tabulas fragments (varbūtības reizināts ar 1000)

Tabulas dati 5.8 norāda, ka ar neierobežotu izlases lieluma palielinājumu (i = °°), Stjudenta sadalījums tiecas pēc normālā sadalījuma likuma, un pie i = 20 tas maz atšķiras no tā.

Studentu sadalījuma tabula bieži tiek dota citā, praktiskai lietošanai ērtākā formā (5.9. tabula).

5.9. tabula

Dažas vērtības (Studentu t sadalījums

Brīvības pakāpju skaits

vienvirziena intervālam

divvirzienu atstatumam

P= 0,99

Apskatīsim, kā izmantot sadales tabulu. Katra fiksētā vērtība P aprēķināt brīvības pakāpju skaitu k, Kur k = n - 1. Katrai brīvības pakāpes vērtībai ir norādīta robežvērtība t p (t 095 vai t 0 99), kas ar noteiktu varbūtību R netiks pārsniegts izlases rezultātu svārstību dēļ. Pamatojoties uz lielumu tp tiek noteiktas uzticības robežas

intervāls

Parasti divpusējai pārbaudei tiek izmantots ticamības līmenis P = 0,95 vai P = 0,99, kas neizslēdz citu varbūtības vērtību izvēli. Varbūtības vērtība tiek izvēlēta, pamatojoties uz to uzdevumu īpašajām prasībām, kuriem tiek izmantota neliela izlase.

Varbūtība, ka vispārējās vidējās vērtības pārsniedz ticamības intervālu, ir vienāda ar q, Kur q = 1 - R.Šī vērtība ir ļoti maza. Attiecīgi aplūkotajām varbūtībām R tas ir 0,05 un 0,01.

Mazie paraugi ir plaši izplatīti tehniskajās zinātnēs un bioloģijā, taču tie ir jāizmanto statistiskajos pētījumos ar lielu piesardzību, tikai ar atbilstošu teorētisko un praktisko pārbaudi. Nelielu izlasi var izmantot tikai tad, ja raksturlieluma sadalījums populācijā ir normāls vai tuvs tam, un vidējo vērtību aprēķina no izlases datiem, kas iegūti neatkarīgu novērojumu rezultātā. Turklāt ņemiet vērā, ka rezultātu precizitāte no maza parauga ir zemāka nekā no liela izlases lieluma.

mazas izlases statistika

Ir vispārpieņemts, ka sākums S. m.v. jeb, kā mēdz dēvēt, “mazā n” statistika, tika dibināta 20. gadsimta pirmajā desmitgadē, publicējot V. Goseta darbu, kurā viņš ievietoja “studenta” postulēto t sadalījumu. pasaules slavu ieguva nedaudz vēlāk. Tajā laikā Gosets strādāja par statistiķi Ginesa alus darītavās. Viens no viņa pienākumiem bija analizēt secīgas svaigi pagatavota portera mucu partijas. Tā kā viņš nekad īsti nepaskaidroja, Gossets eksperimentēja ar ideju ievērojami samazināt paraugu skaitu, kas ņemti no ļoti lielā mucu skaita alus darītavas noliktavās, lai nejauši kontrolētu portera kvalitāti. Tas viņam lika postulēt t sadalījumu. Tā kā Ginesa alus darītavu statūti aizliedza saviem darbiniekiem publicēt pētījumu rezultātus, Gossets anonīmi publicēja sava eksperimenta rezultātus, salīdzinot kvalitātes kontroles paraugu ņemšanu, izmantojot t-sadalījumu maziem paraugiem un tradicionālo z-izplatījumu (normālo sadalījumu) anonīmi ar pseidonīmu "Students " - tātad nosaukums Studenta t sadalījums).

t-sadale. T-sadales teorija, tāpat kā z-sadales teorija, tiek izmantota, lai pārbaudītu nulles hipotēzi, ka divas izlases ir vienkārši nejaušas izlases no vienas un tās pašas kopas, un tāpēc aprēķinātā statistika (piemēram, vidējā un standarta novirze) ir objektīvi populācijas parametru aprēķini. Tomēr atšķirībā no normālā sadalījuma teorijas t sadalījuma teorijai maziem paraugiem nav vajadzīgas a priori zināšanas vai precīzi aprēķini par paredzamo vērtību un populācijas dispersiju. Turklāt, lai gan, lai pārbaudītu atšķirību starp divu lielu izlasi statistiskā nozīmīguma noteikšanai, ir nepieciešams fundamentāls pieņēmums, ka populācijas raksturlielumi ir normāli sadalīti, t sadalījuma teorija neprasa pieņēmumus par parametriem.

Ir labi zināms, ka normāli sadalītos raksturlielumus apraksta viena līkne - Gausa līkne, kas apmierina šādu vienādojumu:

Izmantojot t sadalījumu, visa līkņu saime tiek attēlota ar šādu formulu:

Tāpēc t vienādojumā ir iekļauta gamma funkcija, kas matemātikā nozīmē, ka, mainoties n, doto vienādojumu apmierinās cita līkne.

Brīvības pakāpes

t vienādojumā burts n apzīmē brīvības pakāpju skaitu (df), kas saistītas ar populācijas dispersijas (S2) aplēsi, kas apzīmē jebkura momenta otro momentu, kas ģenerē funkciju, piemēram, t sadalījuma vienādojumu. . S. brīvības pakāpju skaits norāda, cik raksturlielumu paliek brīvi pēc to daļējas izmantošanas noteiktā analīzē. T-sadalījumā viena no novirzēm no izlases vidējās vienmēr ir fiksēta, jo visu šādu noviržu summai jābūt vienādai ar nulli. Tas ietekmē kvadrātu summu, aprēķinot izlases dispersiju kā objektīvu parametra S2 novērtējumu, un rezultātā df ir vienāds ar mērījumu skaitu mīnus viens katram paraugam. Tādējādi formulās un procedūrās t-statistikas aprēķināšanai nulles hipotēzes pārbaudei df = n - 2.

F-pacdivision. Nulles hipotēze, kas pārbaudīta ar t testu, ir tāda, ka divi paraugi tika nejauši ņemti no vienas un tās pašas populācijas vai tika nejauši atlasīti no divām dažādām populācijām ar vienādu dispersiju. Bet ko darīt, ja jums ir jāanalizē vairāk grupu? Atbilde uz šo jautājumu tika meklēta divdesmit gadus pēc tam, kad Gosset atklāja t-izplatījumu. Tās izveidē bija tieši iesaistīti divi no izcilākajiem 20. gadsimta statistiķiem. Viens no tiem ir lielākais angļu statistiķis R. A. Fišers, kurš ierosināja pirmās teorijas. preparāti, kuru izstrādes rezultātā tika ražots F-izplatījums; viņa darbs par mazo paraugu teoriju, attīstot Goseta idejas, tika publicēts 20. gadu vidū (Fišers, 1925). Vēl viens ir Džordžs Snedekors, viens no agrīno amerikāņu statistiķu galaktikas, kurš izstrādāja veidu, kā salīdzināt divus neatkarīgus jebkura lieluma paraugus, aprēķinot divu dispersijas novērtējumu attiecību. Viņš šīs attiecības nosauca par F koeficientu Fišera vārdā. Pētījuma rezultāti Snedecor noveda pie tā, ka F sadalījumu sāka norādīt kā divu statistiku c2 attiecības sadalījumu, katrai no tām ir savas brīvības pakāpes:

No tā izrietēja Fišera klasiskais darbs par dispersijas analīzi, kas ir statistikas metode, kas skaidri vērsta uz mazu paraugu analīzi.

Izlases sadalījumu F (kur n = df) attēlo šāds vienādojums:

Tāpat kā ar t sadalījumu, gamma funkcija norāda, ka pastāv sadalījumu saime, kas apmierina F vienādojumu. Tomēr šajā gadījumā analīzē ir iekļauti divi df lielumi: skaitītāja brīvības pakāpju skaits un skaitītāja brīvības pakāpju skaits. F koeficienta saucējs.

Tabulas t- un F-statistikas novērtēšanai. Pārbaudot nulles hipotēzi, izmantojot S., pamatojoties uz lielo paraugu teoriju, parasti ir nepieciešama tikai viena uzmeklēšanas tabula - normālo noviržu tabula (z), kas ļauj noteikt laukumu zem normālās līknes starp jebkurām divām z vērtībām. uz x ass. Tomēr t un F sadalījumu tabulas obligāti ir uzrādītas tabulu komplektā, jo šīs tabulas ir balstītas uz dažādiem sadalījumiem, kas izriet no dažāda brīvības pakāpju skaita. Lai gan t un F sadalījumi ir varbūtības blīvuma sadalījumi, tāpat kā normāls sadalījums lieliem paraugiem, tie atšķiras no pēdējiem četros veidos, kas tiek izmantoti to aprakstīšanai. Piemēram, t sadalījums ir simetrisks (vienādojumā ņemiet vērā t2) visiem df, bet kļūst arvien augstāks, kad izlases lielums samazinās. Maksimālās līknes (tās, kurām ir lielāka par parasto izliekumu) mēdz būt mazāk asimptotiskas (t.i., mazāk tuvu x asij sadalījuma galos) nekā līknes ar normālu izliekumu, piemēram, Gausa līkne. Šī atšķirība rada ievērojamas neatbilstības starp punktiem uz x ass, kas atbilst t un z vērtībām. Ar df = 5 un divpusēju α līmeni 0,05, t = 2,57, bet atbilstošais z = 1,96. Tāpēc t = 2,57 norāda uz statistisko nozīmīgumu 5% līmenī. Taču normālas līknes gadījumā z = 2,57 (precīzāk 2,58) jau norādīs uz 1% statistiskās nozīmīguma līmeni. Līdzīgus salīdzinājumus var veikt ar F sadalījumu, jo t ir vienāds ar F, ja paraugu skaits ir divi.

Kas ir "mazais" paraugs?

Savulaik tika uzdots jautājums par to, cik lielai izlasei jābūt, lai to uzskatītu par mazu. Uz šo jautājumu vienkārši nav konkrētas atbildes. Tomēr nosacītā robeža starp mazu un lielu izlasi tiek uzskatīta par df = 30. Šī nedaudz patvaļīgā lēmuma pamatā ir t sadalījuma salīdzināšana ar normālo sadalījumu. Kā minēts iepriekš, neatbilstībai starp t un z vērtībām ir tendence palielināties, samazinoties df, un samazināties, palielinoties df. Faktiski t sāk tuvoties z ilgi pirms ierobežojošā gadījuma, kur t = z, ja df = ∞. Vienkārša t tabulas vērtību vizuāla pārbaude parāda, ka šī tuvināšana kļūst diezgan ātra, sākot no df = 30 un vairāk. t (pie df = 30) un z salīdzinošās vērtības ir attiecīgi vienādas: 2,04 un 1,96, ja p = 0,05; 2,75 un 2,58, ja p = 0,01; 3,65 un 3,29, ja p = 0,001.

Cita statistika par “mazajiem” paraugiem

Lai gan statistika, piemēram, t un F, ir īpaši izstrādāta lietošanai ar maziem paraugiem, tie ir vienlīdz piemērojami lieliem paraugiem. Tomēr ir daudzas citas statistikas metodes, kas paredzētas nelielu paraugu analīzei un bieži tiek izmantotas šim nolūkam. Tas attiecas uz tā saukto. neparametriskās vai bez sadales metodes. Būtībā skalas, kas parādās šajās metodēs, ir paredzētas pielietošanai mērījumiem, kas iegūti, izmantojot skalas, kas neatbilst attiecību vai intervālu skalu definīcijai. Visbiežāk tie ir kārtas (ranga) vai nominālie mērījumi. Neparametriskās skalas neprasa pieņēmumus par sadalījuma parametriem, jo ​​īpaši attiecībā uz dispersijas aplēsēm, jo ​​kārtas un nominālās skalas izslēdz pašu dispersijas jēdzienu. Šī iemesla dēļ neparametriskas metodes tiek izmantotas arī mērījumiem, kas iegūti, izmantojot intervālu un attiecību skalas, ja tiek analizēti mazi paraugi un, iespējams, tiek pārkāpti parametru metožu izmantošanai nepieciešamie pamatpieņēmumi. Šie testi, kurus var saprātīgi piemērot maziem paraugiem, ietver: Fišera precīzās varbūtības testu, Frīdmena divu faktoru neparametrisko (ranga) dispersijas analīzi, Kendala t ranga korelācijas koeficientu, Kendala sakritības koeficientu (W), Kruskal H testu - Wallace. neparametriskai (ranga) vienvirziena dispersijas analīzei, Manna-Vitnija U-tests, mediānas tests, zīmju tests, Spīrmena ranga korelācijas koeficients r un Vilkoksona t-tests.

Pētot mainīgumu, tiek izdalīti kvantitatīvie un kvalitatīvie raksturlielumi, kuru izpēti veic variāciju statistika, kas balstās uz varbūtību teoriju. Varbūtība norāda iespējamo biežumu, kad indivīds atbilst noteiktai iezīmei. P=m/n, kur m ir īpatņu skaits ar noteiktu pazīmes vērtību; n ir visu indivīdu skaits grupā. Varbūtība svārstās no 0 līdz 1 (piemēram, varbūtība ir 0,02 - dvīņu parādīšanās ganāmpulkā, t.i., uz 100 atnešanās parādīsies divi dvīņi). Tādējādi biometrijas izpētes objekts ir mainīgs raksturlielums, kura izpēte tiek veikta noteiktai objektu grupai, t.i. kopums. Ir vispārīgas un izlases populācijas. PopulācijaŠī ir liela personu grupa, kas mūs interesē, pamatojoties uz pētāmo pazīmi. Vispārējā populācijā var ietilpt viena un tās pašas sugas dzīvnieku suga vai šķirne. Kopējā populācijā (šķirnē) ir vairāki miljoni dzīvnieku. Tajā pašā laikā šķirne sadalās daudzās grupās, t.i. individuālo saimniecību ganāmpulki. Tā kā vispārējā populācija sastāv no liela skaita indivīdu, to ir tehniski grūti izpētīt. Tāpēc viņi nepēta visu populāciju, bet tikai daļu no tās, ko sauc izvēles vai izlases populācija.

Pamatojoties uz izlases kopu, tiek pieņemts spriedums par visu populāciju kopumā. Paraugu ņemšana jāveic saskaņā ar visiem noteikumiem, kuros jāiekļauj indivīdi ar visām mainīgās pazīmes vērtībām. Personu atlase no kopējās populācijas tiek veikta pēc nejaušības principa vai izlozes veidā. Biometrijā ir divu veidu izlases veida izlase: liela un maza. Liels paraugs tiek saukts tāds, kas ietver vairāk nekā 30 indivīdus vai novērojumus, un mazs paraugs mazāk nekā 30 personas. Ir dažādas datu apstrādes metodes lielām un mazām izlases populācijām. Statistiskās informācijas avots var būt dati no zootehniskās un veterinārās uzskaites, kas sniedz informāciju par katru dzīvnieku no dzimšanas līdz iznīcināšanai. Vēl viens informācijas avots var būt dati no zinātniskiem un ražošanas eksperimentiem, kas veikti ar ierobežotu skaitu dzīvnieku. Kad paraugs ir iegūts, sākas apstrāde. Tas ļauj matemātisku lielumu veidā iegūt vairākus statistiskos lielumus vai koeficientus, kas raksturo interesējošo dzīvnieku grupu īpašības.

Izmantojot biometrisko metodi, iegūst šādus statistiskos parametrus vai rādītājus:

1. Dažādu raksturlielumu vidējās vērtības (vidējais aritmētiskais, režīms, mediāna, ģeometriskais vidējais).

2. Koeficienti, kas mēra variācijas apjomu t.i. pētāmā raksturlieluma mainīgums (standarta novirze, variācijas koeficients).

3. Koeficienti, kas mēra raksturlielumu attiecības lielumu (korelācijas koeficients, regresijas koeficients un korelācijas koeficients).

4. Statistiskās kļūdas un iegūto statistikas datu ticamība.

5. Variāciju īpatsvars, kas rodas dažādu faktoru un citu rādītāju ietekmē, kas saistīti ar ģenētisko un selekcijas problēmu izpēti.

Statistiski apstrādājot izlasi, kopas locekļi tiek sakārtoti variāciju rindas veidā. Variāciju sērija ir indivīdu grupēšana klasēs atkarībā no pētāmās pazīmes vērtības. Variāciju sērija sastāv no diviem elementiem: klasēm un frekvenču sērijas. Variāciju sērijas var būt intermitējošas vai nepārtrauktas. Tiek izsaukti līdzekļi, kuriem var būt tikai vesels skaitlis intermitējošais numurs galvas, olu skaits, sivēnu skaits un citi. Tiek izsauktas pazīmes, kuras var izteikt daļskaitļos nepārtraukts(augstums cm, izslaukums kg, tauku %, dzīvsvars un citi).

Veidojot variāciju sēriju, tiek ievēroti šādi principi vai noteikumi:

1. Nosakiet vai saskaitiet īpatņu skaitu, kuriem tiks izveidota variāciju sērija (n).

2. Atrodiet pētāmā raksturlieluma maksimālo un minimālo vērtību.

3. Noteikt klases intervālu K = max - min / klašu skaits, klašu skaits tiek ņemts patvaļīgi.

4. Konstruēt klases un noteikt katras klases robežu, min+K.

5. Viņi sadala iedzīvotāju locekļus klasēs.

Pēc klašu konstruēšanas un indivīdu sadalīšanas klasēs tiek aprēķināti galvenie variāciju rindas rādītāji (X, σ, Cv, Mх, Мσ, Мcv). Vislielāko vērtību populācijas raksturošanā saņēma atribūta vidējā vērtība. Risinot visas zootehniskās, veterinārās, medicīniskās, ekonomiskās un citas problēmas, vienmēr tiek noteikta pazīmes vidējā vērtība (vidējais izslaukums ganāmpulkam, tauku %, auglība cūku audzēšanā, olu ražošana cāļiem un citas pazīmes). Parametri, kas raksturo raksturlieluma vidējo vērtību, ir šādi:

1. Vidējais aritmētiskais.

2. Svērtais aritmētiskais vidējais.

3. Ģeometriskais vidējais.

4. Mode (Mo).

5. Mediāna (Me) un citi parametri.

Vidējais aritmētiskais parāda, kāda īpašību vērtība bija noteiktas grupas indivīdiem, ja tā bija vienāda visiem, un to nosaka pēc formulas X = A + b × K

Galvenā aritmētiskā vidējā īpašība ir tāda, ka tas novērš raksturlieluma variācijas un padara to kopīgu visai populācijai. Vienlaikus jāatzīmē, ka vidējais aritmētiskais iegūst abstraktu nozīmi, t.i. to aprēķinot, tiek iegūti frakcionēti rādītāji, kuru patiesībā var nebūt. Piemēram: teļu raža no 100 govīm ir 85,3 teļi, sivēnmāšu auglība 11,8 sivēni, cāļu olu raža ir 252,4 olas un citi rādītāji.

Vidējā aritmētiskā vērtība ir ļoti augsta lopkopības praksē un populācijas raksturojumos. Lopkopības praksē, īpaši liellopu audzēšanā, vidējā tauku satura noteikšanai pienā laktācijas laikā izmanto svērto aritmētisko vērtību.

Ģeometriskā vidējā vērtība aprēķina, ja nepieciešams raksturot pieauguma tempu, populācijas pieauguma tempu, kad vidējais aritmētiskais deformē datus.

Mode nosauciet visbiežāk sastopamo mainīgā raksturlieluma vērtību, gan kvantitatīvo, gan kvalitatīvo. Govs modālais numurs ir pupa numurs-4. Lai gan ir govis ar pieciem sešiem pupiem. Variāciju sērijā modālā klase būs klase, kurā ir lielākais frekvenču skaits, un mēs to definējam kā nulles klasi.

Mediāna sauc par variantu, kas sadala visus populācijas pārstāvjus divās vienādās daļās. Pusei populācijas locekļu mainīgās pazīmes vērtība būs mazāka par vidējo, bet otrai pusei vērtība būs lielāka par vidējo (piemēram, šķirnes standarts). Kvalitatīvo īpašību raksturošanai visbiežāk izmanto mediānu. Piemēram: tesmeņa forma ir kausveida, apaļa, kaza. Izmantojot pareizo paraugu ņemšanas opciju, visiem trim indikatoriem jābūt vienādiem (t.i., X, Mo, Me). Tādējādi pirmā populācijas īpašība ir vidējās vērtības, taču ar tām nepietiek, lai spriestu par populāciju.

Otrs svarīgais jebkuras populācijas rādītājs ir pazīmes mainīgums vai mainīgums. Pazīmes mainīgumu nosaka daudzi vides faktori un iekšējie faktori, t.i. iedzimtie faktori.

Pazīmes mainīguma noteikšanai ir liela nozīme gan bioloģijā, gan lopkopības praksē. Tādējādi, izmantojot statistikas parametrus, kas mēra pazīmes mainīguma pakāpi, var konstatēt šķirnes atšķirības dažādu ekonomiski noderīgu pazīmju mainības pakāpē, prognozēt selekcijas līmeni dažādās dzīvnieku grupās, kā arī tās efektivitāti. .

Pašreizējais statistiskās analīzes stāvoklis ļauj ne tikai noteikt fenotipiskās mainīguma izpausmes pakāpi, bet arī sadalīt fenotipisko mainīgumu tā sastāvdaļu tipos, proti, genotipiskajā un paratipiskajā mainīgumā. Šī mainīguma sadalīšana tiek veikta, izmantojot dispersijas analīzi.

Galvenie mainīguma rādītāji ir šādas statistiskās vērtības:

1. Limiti;

2. Standartnovirze (σ);

3. Mainīguma vai variācijas koeficients (Cv).

Vienkāršākais veids, kā parādīt pazīmes mainīguma apjomu, ir ar ierobežojumiem. Robežas tiek noteiktas šādi: atšķirība starp atribūta maksimālo un minimālo vērtību. Jo lielāka šī atšķirība, jo lielāka ir šīs pazīmes mainīgums. Galvenais parametrs pazīmes mainīguma mērīšanai ir standarta novirze jeb (σ), un to nosaka pēc formulas:

σ = ±K ∙ √∑ Pa 2- b 2

Galvenās standartnovirzes īpašības t.i. (σ) ir šādi:

1. Sigma vienmēr ir nosaukta vērtība un tiek izteikta (kg, g, metros, cm, gab.).

2. Sigma vienmēr ir pozitīva vērtība.

3. Jo lielāka ir σ vērtība, jo lielāka ir pazīmes mainīgums.

4. Variāciju sērijās visas frekvences ir iekļautas ±3σ.

Izmantojot standarta novirzi, varat noteikt, kurai variāciju sērijai pieder konkrēta persona. Metodēm raksturlieluma mainīguma noteikšanai, izmantojot robežas un standartnovirzi, ir savi trūkumi, jo nav iespējams salīdzināt dažādus raksturlielumus, pamatojoties uz mainīguma lielumu. Ir jāzina dažādu pazīmju mainība vienam dzīvniekam vai vienai un tai pašai dzīvnieku grupai, piemēram: izslaukuma mainīgums, tauku saturs pienā, dzīvsvars, piena tauku daudzums. Tāpēc, salīdzinot pretējo raksturlielumu mainīgumu un identificējot to mainīguma pakāpi, mainīguma koeficientu aprēķina, izmantojot šādu formulu:

Tādējādi galvenās metodes populācijas locekļu raksturlielumu mainīguma novērtēšanai ir: robežas; standartnovirze (σ) un variācijas vai mainīguma koeficients.

Lopkopības praksē un eksperimentālajos pētījumos bieži nākas saskarties ar maziem paraugiem. Neliels paraugs viņi sauc par īpatņu vai dzīvnieku skaitu, kas nepārsniedz 30 vai mazāk par 30. Izveidotos modeļus pārnes uz visu populāciju, izmantojot nelielu izlasi. Nelielai izlasei tiek noteikti tādi paši statistiskie parametri kā lielai izlasei (X, σ, Cv, Mx). Tomēr to formulas un aprēķini atšķiras no lielas izlases (t.i., no variāciju sērijas formulām un aprēķiniem).

1. Vidējā aritmētiskā vērtība X = ∑V

V - opcijas vai raksturlieluma absolūtā vērtība;

n ir variantu skaits vai indivīdu skaits.

2. Standartnovirze σ = ± √ ∑α 2

α = x-¯x, šī ir starpība starp opcijas vērtību un vidējo aritmētisko. Šī starpība α ir kvadrātā un α 2 n-1 ir brīvības pakāpju skaits, t.i. visu variantu vai indivīdu skaits samazināts par vienu (1).

Kontroles jautājumi:

1. Kas ir biometrija?

2.Kādi statistiskie parametri raksturo populāciju?

3.Kādi rādītāji raksturo mainīgumu?

4.Kas ir mazs paraugs

5. Kas ir režīms un mediāna?

Lekcija Nr.12

Biotehnoloģija un embriju transplantācija

1. Biotehnoloģijas jēdziens.

2. Donoru un recipientu govju atlase, embriju transplantācija.

3. Transplantācijas nozīme lopkopībā.

Statistikas pētījumu praksē bieži sastopas mazi paraugi , kuru tilpums ir mazāks par 30 vienībām. Lielajos paraugos parasti ietilpst paraugi, kas pārsniedz 100 vienības.

Parasti mazus paraugus izmanto gadījumos, kad nav iespējams vai nepraktiski izmantot lielu paraugu. Ar šādiem paraugiem nākas saskarties, piemēram, aptaujājot tūristus un viesnīcu apmeklētājus.

Nelielas izlases kļūdas lielumu nosaka, izmantojot formulas, kas atšķiras no tām, kas paredzētas salīdzinoši lielam paraugam ().

Ar nelielu izlases lielumu n jāņem vērā sakarība starp izlasi un populācijas dispersiju:

Tā kā nelielā izlasē frakcija ir nozīmīga, dispersiju aprēķina, ņemot vērā t.s brīvības pakāpju skaits . Tas tiek saprasts kā opciju skaits, kurām var būt patvaļīgas vērtības, nemainot vidējo vērtību.

Neliela parauga vidējo kļūdu nosaka pēc formulas:

Vidējā un proporcijas maksimālā izlases kļūda tiek atrasta līdzīgi kā lielas izlases gadījumā:

kur t ir ticamības koeficients atkarībā no dotā nozīmīguma līmeņa un brīvības pakāpju skaita (5. pielikums).

Koeficientu vērtības ir atkarīgas ne tikai no dotās ticamības varbūtības, bet arī no izlases lieluma n. Atsevišķām vērtībām t un n ticamības varbūtību nosaka Stjudenta sadalījums, kas satur standartnoviržu sadalījumus:

komentēt. Pieaugot izlases lielumam, Stjudenta sadalījums tuvojas normālajam sadalījumam: kad n=20 tas maz atšķiras no normālā sadalījuma. Veicot nelielas izlases aptaujas, jāņem vērā, ka jo mazāks ir izlases lielums n, jo lielāka atšķirība starp Stjudenta sadalījumu un normālo sadalījumu. Piemēram, kad p min. = 4 šī atšķirība ir diezgan būtiska, kas liecina par nelielas izlases rezultātu precizitātes samazināšanos.