Egy kis minta alapvető paraméterei. Kis minta

Kismintás módszer

A kismintás módszer fő előnye, hogy képes kiértékelni a folyamat időbeli dinamikáját, csökkentve ezzel a számítási eljárások idejét.

A pillanatnyi mintákat véletlenszerűen választják ki bizonyos időszakokban, 5 és 20 egység között. A mintavételi periódust empirikusan határozzuk meg, és a folyamat stabilitásától függ, amelyet az a priori információk elemzésével határozunk meg.

Minden pillanatnyi minta esetében meghatározzák a fő statisztikai jellemzőket. A pillanatnyi mintákat és főbb statisztikai jellemzőit a B. függelék tartalmazza.

Felterjesztünk egy hipotézist a minta diszperziójának homogenitására vonatkozóan, és az egyik lehetséges kritérium (Fisher-kritérium) segítségével teszteljük.

A minta jellemzőinek homogenitására vonatkozó hipotézis tesztelése.

A számtani átlagok különbségének 2 mérési sorozatban való ellenőrzésére a B. függelékben a G mértéket mutatjuk be

A döntési szabály a következőképpen fogalmazódik meg:

ahol tr a normalizált eloszlás kvantisének értéke adott P megbízhatósági valószínűség mellett, ? = 0,095, n = 10, tr = 2,78.

Ha az egyenlőtlenség teljesül, beigazolódik a hipotézis, hogy a mintaátlagok közötti különbség nem szignifikáns.

Mivel az egyenlőtlenség minden esetben teljesül, beigazolódik az a hipotézis, hogy a mintaátlagok közötti különbség nem szignifikáns.

A minta varianciáinak homogenitására vonatkozó hipotézis tesztelésére az F0 mértéket 2 méréssorozat eredményeinek torzítatlan becsléseinek arányaként vezetjük be. Ezenkívül a 2 becslés közül a nagyobbat veszik számlálónak, és ha Sx1>Sx2, akkor

A számítási eredményeket a B. függelék tartalmazza.

Ezután megadjuk a P konfidenciavalószínűség értékeit, és meghatározzuk az F(K1; K2; ?/2) értékeit, ahol K1 = n1 - 1 és K2 = n2 - 1.

P = 0,025 és K1 = 10-1 = 4 és K2 = 10-1 = 4 F (9; 9; 0,025/2) = 4,1.

Döntési szabály: ha F(K1; K2; ?/2)>F0, akkor a két minta varianciáinak homogenitására vonatkozó hipotézist elfogadjuk.

Mivel az F(K1; K2; ?/2) > F0 feltétel minden esetben teljesül, a varianciák homogenitásának hipotézise elfogadható.

Így beigazolódik a mintavarianciák homogenitására vonatkozó hipotézis, ami a folyamat stabilitását jelzi; A mintaátlagok homogenitására vonatkozó hipotézis az átlagok összehasonlításának módszerével beigazolódik, ez azt jelenti, hogy a diszperziós középpont nem változott, és a folyamat stabil állapotban van.

Szórványos és precíziós ábrázolási módszer

Egy bizonyos idő alatt 3-10 termékből azonnali mintát vesznek, és meghatározzák az egyes minták statisztikai jellemzőit.

A kapott adatokat diagramokon ábrázoljuk az idővel az abszcissza tengelyen? vagy a minták k száma, az ordináta tengelyen pedig az xk egyedi értékei vagy valamelyik statisztikai jellemző értéke (minta aritmetikai átlaga, minta szórása). Ezenkívül két vízszintes vonal Тв és Тн van húzva a diagramon, korlátozva a termék tűréstartományát.

A pillanatnyi mintákat a B. függelék tartalmazza.


1. ábra pontossági diagram

A diagram jól mutatja a gyártási folyamat előrehaladását. Használható annak jelzésére, hogy a gyártási folyamat instabil

A minta jellemzőinek kiterjesztése az általános sokaságra a nagy számok törvénye alapján kellően nagy mintaméretet igényel. A statisztikai kutatás gyakorlatában azonban gyakran találkozhatunk azzal, hogy ilyen vagy olyan okból nem lehet növelni a kis méretű mintaegységek számát. Ez vonatkozik a vállalkozások, oktatási intézmények, kereskedelmi bankok stb. tevékenységének tanulmányozására, amelyek száma a régiókban általában elenyésző, esetenként mindössze 5-10 egységet tesz ki.

Abban az esetben, ha a minta sokasága kevés, 30-nál kevesebb egységből áll, a mintát hívják kicsi Ebben az esetben a Ljapunov-tétel nem használható a mintavételi hiba kiszámításához, mivel a minta átlagát jelentősen befolyásolja az egyes véletlenszerűen kiválasztott egységek értéke, és eloszlása ​​jelentősen eltérhet a normáltól.

1908-ban V.S. Gosset bebizonyította, hogy a kis minta mintaátlaga és az általános átlag közötti eltérés becslésének sajátos eloszlási törvénye van (lásd 4. fejezet). A mintaátlag kisszámú megfigyeléssel történő valószínűségi becslésének problémájával foglalkozva megmutatta, hogy ebben az esetben nem maguknak a mintaátlagoknak az eloszlását kell figyelembe venni, hanem azt, hogy mekkora eltérésük van a minta átlagától. eredeti népesség. Ebben az esetben a következtetések meglehetősen megbízhatóak lehetnek.

A diák felfedezése az ún kis minta elmélet.

Kis minta eredményeinek értékelésekor az általános variancia értéke nem kerül felhasználásra a számításoknál. Kis mintákban a „korrigált” mintavarianciát használják az átlagos mintavételi hiba kiszámításához:

azok. szemben a nagy mintákkal a nevezőben helyette P költségek (és -1). A kis minta átlagos mintavételi hibájának kiszámítását a táblázat tartalmazza. 5.7.

5.7. táblázat

Kis minta átlagos hibájának kiszámítása

Egy kis minta határhibája: hol t- bizalmi tényező.

Nagyságrend t másképpen viszonyul a valószínű becsléshez, mint egy nagy mintához. A Student-eloszlással összhangban a valószínű becslés mindkét értéktől függ t, valamint az I. mintanagyságra abban az esetben, ha a határhiba nem haladja meg a kis minták átlagos hibájának r-szeresét. Ez azonban nagyban függ a kiválasztott egységek számától.

V.S. Gosset összeállított egy táblázatot a valószínűségi eloszlásokról kis mintákban, amelyek megfelelnek a konfidencia együttható adott értékeinek tés egy kis minta különböző térfogatai, valamint egy kivonat a táblázatban. 5.8.

5.8. táblázat

A Student-féle valószínűségi táblázat töredéke (a valószínűségek szorozva 1000-rel)

Táblázat adatok Az 5.8. ábra azt mutatja, hogy a minta méretének korlátlan növelésével (i = °°) a Student-eloszlás a normál eloszlási törvényhez igazodik, és i = 20-nál alig tér el attól.

A Hallgatói eloszlási táblázat gyakran más, a gyakorlati felhasználás szempontjából kényelmesebb formában kerül megadásra (5.9. táblázat).

5.9. táblázat

Néhány érték (Diák t-eloszlása

A szabadságfokok száma

egyirányú intervallumra

kétirányú távolságtartáshoz

P= 0,99

Nézzük meg az elosztási tábla használatát. Minden fix érték P Számítsa ki a szabadsági fokok számát k, Ahol k = n - 1. A szabadságfok minden értékénél a határértéket feltüntetjük t p (t 095 vagy t 0 99), amely adott valószínűséggel R nem lépi túl a mintavételi eredmények véletlenszerű ingadozása miatt. Nagyságrend alapján tp a bizalom határai meghatározottak

intervallum

Általános szabály, hogy a kétoldalas tesztelés megbízhatósági szintjét használják P = 0,95 ill P = 0,99, ami nem zárja ki más valószínűségi értékek megválasztását. A valószínűségi érték kiválasztása azon feladatok konkrét követelményei alapján történik, amelyekhez kis mintát használnak.

Annak a valószínűsége, hogy az általános átlagértékek túllépik a konfidenciaintervallumot, egyenlő q, Ahol q = 1 - R. Ez az érték nagyon kicsi. Ennek megfelelően a figyelembe vett valószínűségekre R ez 0,05 és 0,01.

A műszaki tudományokban és a biológiában elterjedtek a kis minták, de a statisztikai kutatásokban nagy körültekintéssel, csak megfelelő elméleti és gyakorlati vizsgálattal kell őket alkalmazni. Kis minta csak akkor használható, ha a jellemző eloszlása ​​a sokaságban normális vagy ahhoz közeli, és az átlagértéket független megfigyelések eredményeként kapott mintaadatokból számítjuk. Ezenkívül ne feledje, hogy a kis mintaméretből származó eredmények pontossága alacsonyabb, mint a nagy mintaméret esetén.

kismintás statisztikák

Általánosan elfogadott, hogy az S. m.v. vagy ahogy szokták nevezni „kis n” statisztika, a 20. század első évtizedében alakult meg W. Gosset munkája publikálásával, amelyben a „tanuló” által feltételezett t-eloszlást helyezte el, aki valamivel később szerzett világhírnevet. Akkoriban Gossett statisztikusként dolgozott a Guinness sörfőzdéknél. Egyik feladata az volt, hogy elemezze az egymást követő hordós frissen főzött portereket. Valójában soha nem magyarázott okból, Gossett azzal az ötlettel kísérletezett, hogy jelentősen csökkentse a sörfőzde raktáraiban található nagyon sok hordóból vett minták számát, hogy véletlenszerűen ellenőrizhesse a portás minőségét. Ez arra késztette, hogy feltegye a t-eloszlást. Mivel a Guinness sörfőzdék alapszabálya megtiltotta alkalmazottaik számára kutatási eredmények közzétételét, Gossett a kis minták t-eloszlását és a hagyományos z-eloszlást (normál eloszlást) használó minőség-ellenőrzési mintavételezési kísérletének eredményeit névtelenül, „Student” álnéven tette közzé. " - innen a Student-féle t-eloszlás elnevezés).

t-eloszlás. A t-eloszláselmélet a z-eloszláselmélethez hasonlóan annak a nullhipotézisnek a tesztelésére szolgál, amely szerint két minta egyszerűen véletlenszerű minta ugyanabból a sokaságból, ezért a számított statisztikák (pl. átlag és szórás) a sokaság paramétereinek torzítatlan becslései. A normál eloszlás elméletétől eltérően azonban a kis minták t-eloszlásának elmélete nem igényli a várható érték és a sokaság varianciájának előzetes ismeretét vagy pontos becslését. Sőt, bár két nagy minta átlaga közötti különbség statisztikai szignifikancia szempontjából történő tesztelése megköveteli azt az alapvető feltevést, hogy a sokaság jellemzői normális eloszlásúak, a t eloszlás elmélete nem követeli meg a paraméterekre vonatkozó feltételezéseket.

Köztudott, hogy a normál eloszlású jellemzőket egyetlen görbe írja le - a Gauss-görbe, amely kielégíti a következő egyenletet:

A t-eloszlással az egész görbecsaládot a következő képlet ábrázolja:

Ez az oka annak, hogy a t-re vonatkozó egyenlet tartalmaz egy gamma-függvényt, ami a matematikában azt jelenti, hogy n változásával egy másik görbe elégíti ki az adott egyenletet.

A szabadság fokai

A t egyenletében az n betű a sokaságvariancia (S2) becsléséhez kapcsolódó szabadsági fokok számát (df) jelöli, amely bármely pillanatgeneráló függvény második momentumát jelenti, például a t eloszlás egyenletét. . Az S.-ben a szabadsági fokok száma azt jelzi, hogy hány jellemző marad szabadon egy adott típusú elemzésben való részleges felhasználásuk után. A t-eloszlásban a mintaátlagtól való eltérések egyike mindig rögzített, mivel az összes ilyen eltérés összegének nullával kell egyenlőnek lennie. Ez befolyásolja a négyzetek összegét, amikor a minta varianciáját az S2 paraméter torzítatlan becsléseként számítjuk ki, és azt eredményezi, hogy a df egyenlő a mérések számával mínusz eggyel minden mintára. Ezért a nullhipotézis tesztelésére szolgáló t-statisztika számítási képleteiben és eljárásaiban df = n - 2.

F-pacdivision. A t-próbával tesztelt nullhipotézis az, hogy a két mintát véletlenszerűen ugyanabból a sokaságból, vagy véletlenszerűen két különböző populációból vették, azonos varianciával. De mi van, ha több csoportot kell elemeznie? Erre a kérdésre húsz évig keresték a választ, miután Gosset felfedezte a t-eloszlást. Előállításában a 20. század két legkiválóbb statisztikusa vett részt közvetlenül. Az egyik a legnagyobb angol statisztikus, R. A. Fisher, aki az első elméleteket javasolta. készítmények, amelyek fejlesztése az F-eloszlás előállításához vezetett; a 20-as évek közepén jelent meg a kis mintaelméletről szóló, Gosset gondolatait kidolgozó munkája (Fisher, 1925). Egy másik George Snedecor, a korai amerikai statisztikusok galaxisának egyik tagja, aki kifejlesztett egy módszert két független, tetszőleges méretű minta összehasonlítására két becslés varianciaarányának kiszámításával. Ezt a kapcsolatot Fischer után F-aránynak nevezte. Kutatási eredmények A Snedecor oda vezetett, hogy az F-eloszlást két c2 statisztika arányának eloszlásaként kezdték meghatározni, amelyek mindegyike saját szabadságfokkal rendelkezik:

Ebből született Fisher klasszikus varianciaanalízis-műve, egy statisztikai módszer, amely kifejezetten a kis minták elemzésére összpontosít.

Az F mintavételi eloszlást (ahol n = df) a következő egyenlet ábrázolja:

A t-eloszláshoz hasonlóan a gamma-függvény azt jelzi, hogy létezik egy olyan eloszláscsalád, amely kielégíti az F egyenletét. Ebben az esetben azonban az elemzés két df-mennyiséget foglal magában: a számláló és a számláló szabadságfokainak számát. az F-arány nevezője.

Táblázatok a t- és F-statisztika becsléséhez. A nullhipotézis S. segítségével történő tesztelésekor, a nagy minták elmélete alapján, általában csak egy keresőtáblára van szükség - a normál eltérések táblázatára (z), amely lehetővé teszi a normálgörbe alatti terület meghatározását bármely két z érték között az x tengelyen. A t- és F-eloszlások tábláit azonban szükségszerűen egy táblázatkészletben mutatjuk be, mivel ezek a táblák sokféle eloszláson alapulnak, amelyek a szabadsági fokok számának változásából erednek. Bár a t- és F-eloszlások valószínűségi sűrűségeloszlások, hasonlóan a nagy minták normál eloszlásához, négy módon különböznek az utóbbitól, amelyeket a leírásukra használnak. A t eloszlás például szimmetrikus (jegyezzük meg a t2-t az egyenletében) minden df-re, de a minta méretének csökkenésével egyre csúcsosabbá válik. A csúcsos görbék (a normálnál nagyobb görbületűek) általában kevésbé aszimptotikusak (azaz kevésbé közel állnak az x-tengelyhez az eloszlás végein), mint a normál görbék, például a Gauss-görbe. Ez a különbség észrevehető eltéréseket eredményez az x tengely pontjai között, amelyek megfelelnek a t és z értékeknek. df = 5 és 0,05 kétirányú α szint mellett t = 2,57, míg a megfelelő z = 1,96. Ezért a t = 2,57 statisztikai szignifikancia 5%-os szinten. Normális görbe esetén azonban z = 2,57 (pontosabban 2,58) már 1%-os statisztikai szignifikanciaszintet jelez. Hasonló összehasonlítások tehetők az F eloszlással, mivel t egyenlő F-vel, ha a minták száma kettő.

Mit jelent a „kis” minta?

Egy időben felmerült a kérdés, hogy mekkora legyen a minta ahhoz, hogy kicsinek tekintsük. Erre a kérdésre egyszerűen nincs határozott válasz. Egy kis és egy nagy minta közötti egyezményes határt azonban df = 30-nak tekintjük. Ennek a kissé önkényes döntésnek az alapja a t-eloszlás és a normál eloszlás összehasonlítása. Amint fentebb megjegyeztük, a t és z értékek közötti eltérés df csökkenésével nő, és df növekedésével csökken. Valójában t már jóval a határeset előtt kezd közeledni z-hez, ahol t = z df = ∞ esetén. A táblázatban szereplő t értékek egyszerű vizuális vizsgálata azt mutatja, hogy ez a közelítés meglehetősen gyors lesz, df = 30-tól kezdve. t (df = 30-nál) és z összehasonlító értéke egyenlő: 2,04 és 1,96 p = 0,05 esetén; 2,75 és 2,58 p = 0,01 esetén; 3,65 és 3,29 p = 0,001 esetén.

Egyéb statisztikák a „kis” mintákról

Bár az olyan statisztikákat, mint a t és az F, kifejezetten kis mintákra tervezték, de ugyanúgy alkalmazhatók nagy mintákra is. Számos más statisztikai módszer létezik azonban kis minták elemzésére, és gyakran használják erre a célra. Ez utal az ún. nem paraméteres vagy eloszlásmentes módszerek. Az ezekben a módszerekben megjelenő skálákat alapvetően olyan skálákkal végzett mérésekre kívánjuk alkalmazni, amelyek nem felelnek meg az arány- vagy intervallumskálák definíciójának. Leggyakrabban ezek ordinális (rang) vagy névleges mérések. A nem paraméteres skálák nem igényelnek feltevéseket az eloszlási paraméterekkel kapcsolatban, különös tekintettel a diszperzió becslésére, mivel az ordinális és névleges skálák kiküszöbölik a diszperzió fogalmát. Emiatt nem paraméteres módszereket is alkalmaznak az intervallum- és arányskálákkal végzett mérésekhez kis minták elemzésekor, és valószínűleg megsértik a parametrikus módszerek használatához szükséges alapfeltevéseket. Ezek a tesztek, amelyek ésszerűen alkalmazhatók kis mintákra, a következők: Fisher pontos valószínűségi tesztje, Friedman kéttényezős nemparaméteres (rang) varianciaanalízise, ​​Kendall t-rangú korrelációs együtthatója, Kendall konkordancia együtthatója (W), Kruskal H tesztje - Wallace nem-parametrikus (rang) egyirányú varianciaanalízishez, Mann-Whitney U-próba, medián teszt, előjel teszt, Spearman rangkorrelációs együttható r és Wilcoxon t-próba.

A variabilitás vizsgálata során kvantitatív és minőségi jellemzőket különböztetnek meg, amelyek vizsgálatát a valószínűségszámításon alapuló variációs statisztika végzi. A valószínűség azt jelzi, hogy az egyén milyen gyakorisággal találkozik egy adott tulajdonsággal. P=m/n, ahol m az adott tulajdonságértékkel rendelkező egyedek száma; n a csoport összes egyedének száma. A valószínűség 0-tól 1-ig terjed (például a valószínűség 0,02 - ikrek megjelenése egy falkában, azaz 100 ellésenként két iker jelenik meg). Így a biometrikus adatok vizsgálatának tárgya egy változó jellemző, amelynek vizsgálatát az objektumok egy bizonyos csoportján, pl. totalitás. Vannak általános és mintapopulációk. Népesség Ez az egyének nagy csoportja, amely a vizsgált tulajdonság alapján érdekel bennünket. Az általános populáció tartalmazhat ugyanahhoz a fajhoz tartozó állatfajt vagy fajtát. Az általános populáció (fajta) több millió állatot foglal magában. Ugyanakkor a fajta sok csoportra oszlik, pl. egyéni gazdaságok állományai. Mivel az általános populáció nagyszámú egyedből áll, technikailag nehéz tanulmányozni. Ezért nem a teljes populációt vizsgálják, hanem annak csak egy részét, amit ún választható vagy mintapopuláció.

A minta sokasága alapján a teljes sokaság egészére vonatkozóan születik ítélet. A mintavételt az összes szabály szerint kell végezni, amelynek tartalmaznia kell a változó tulajdonság összes értékével rendelkező egyedeket. Az egyedek kiválasztása a teljes populációból a véletlen elve szerint vagy sorshúzással történik. A biometrikus adatokban kétféle véletlenszerű mintavétel létezik: nagy és kicsi. Nagy minta 30-nál több egyedből vagy megfigyelésből állót neveznek, és kis minta kevesebb mint 30 személy. Különböző adatfeldolgozási módszerek léteznek nagy és kis mintapopulációkhoz. A statisztikai információk forrása lehet a tenyésztéstechnikai és állatorvosi nyilvántartások adatai, amelyek az egyes állatokról a születéstől a selejtezésig nyújtanak információt. További információforrás lehet korlátozott számú állaton végzett tudományos és termelési kísérletek adatai. A minta beszerzése után megkezdődik a feldolgozás. Ez lehetővé teszi, hogy matematikai mennyiségek formájában számos statisztikai mennyiséget vagy együtthatót kapjunk, amelyek jellemzik az érdeklődésre számot tartó állatcsoportok jellemzőit.

A következő statisztikai paramétereket vagy mutatókat a biometrikus módszerrel kapjuk meg:

1. Változó jellemző átlagértékei (számtani átlag, módus, medián, geometriai átlag).

2. A variáció mértékét mérő együtthatók i.e. (változékonysága) a vizsgált jellemző (szórás, variációs együttható).

3. A jellemzők közötti kapcsolat nagyságát mérő együtthatók (korrelációs együttható, regressziós együttható és korrelációs arány).

4. Statisztikai hibák és a kapott statisztikai adatok megbízhatósága.

5. A genetikai és szelekciós problémák vizsgálatához kapcsolódó különféle tényezők és egyéb mutatók hatására fellépő variációk aránya.

A minta statisztikai feldolgozásakor a sokaság tagjai variációs sorozatokba szerveződnek. A variációk sorozata az egyének osztályokba való csoportosítása a vizsgált tulajdonság értékétől függően. A variációs sorozat két elemből áll: osztályokból és egy frekvenciasorozatból. A variációs sorozat lehet szakaszos vagy folyamatos. Olyan funkciókat hívunk meg, amelyek csak egész számot vehetnek fel szaggatott szám fejek, tojások száma, malacok száma és mások. A törtszámokkal kifejezhető jellemzőket nevezzük folyamatos(magasság cm, tejhozam kg, zsír %, élősúly és egyebek).

A variációs sorozat összeállításakor a következő elveket vagy szabályokat kell betartani:

1. Határozza meg vagy számolja meg azon egyedek számát, amelyekre az (n) variációs sorozatot összeállítjuk.

2. Határozza meg a vizsgált jellemző max és min értékét!

3. Határozza meg az osztályintervallumot K = max - min / osztályok száma, az osztályok számát tetszőlegesen vesszük.

4. Szerkesszünk osztályokat, és határozzuk meg az egyes osztályok határát, min+K.

5. Osztályokba osztják a lakosság tagjait.

Az osztályok felépítése és az egyedek osztályokba való felosztása után kiszámítjuk a variációs sorozat főbb mutatóit (X, σ, Cv, Mх, Мσ, Мcv). A populáció jellemzésében az attribútum átlagértéke kapta a legnagyobb értéket. Minden tenyésztéstechnikai, állategészségügyi, orvosi, gazdasági és egyéb probléma megoldása során mindig meghatározásra kerül egy-egy tulajdonság átlagértéke (az állomány átlagos tejhozama, zsírszázalék, sertéstenyésztési termékenység, csirkék tojástermelése és egyéb tulajdonságok). Egy jellemző átlagos értékét jellemző paraméterek a következők:

1. Számtani közép.

2. Súlyozott számtani átlag.

3. Geometriai átlag.

4. Divat (Mo).

5. Medián (Me) és egyéb paraméterek.

Számtani átlaga megmutatja, hogy egy adott csoport egyedei milyen tulajdonságokkal rendelkeztek, ha ez mindenki számára azonos volt, és az X = A + b × K képlettel határozza meg

A számtani átlag fő tulajdonsága, hogy kiküszöböli egy jellemző változását, és az egész sokaságra közössé teszi. Ugyanakkor meg kell jegyezni, hogy a számtani közép absztrakt jelentést kap, pl. kiszámításakor törtmutatókat kapunk, amelyek a valóságban nem léteznek. Például: a 100 tehénre jutó borjak hozama 85,3 borjú, a kocák termékenysége 11,8 malac, a csirkék tojástermelése 252,4 tojás és egyéb mutatók.

Az állattenyésztési gyakorlatban és a populáció jellemzőiben igen magas a számtani átlag értéke. Az állattenyésztés, különösen a szarvasmarha-tenyésztés gyakorlatában a tej laktáció alatti átlagos zsírtartalmának meghatározására súlyozott számtani értéket alkalmaznak.

Geometriai középérték akkor kerül kiszámításra, ha a növekedési ütem, a népességnövekedés ütemének jellemzésére van szükség, amikor a számtani átlag torzítja az adatokat.

Divat Nevezze meg egy változó jellemző leggyakrabban előforduló értékét, mind mennyiségi, mind minőségi szempontból. A tehén modális száma a 4-es bimbószám. Bár vannak öt-hat csecsbimbós tehenek. Egy variációs sorozatban a modális osztály az az osztály lesz, ahol a legtöbb frekvencia van, és ezt nulla osztályként definiáljuk.

Középső olyan változatnak nevezzük, amely a populáció minden tagját két egyenlő részre osztja. A populáció felének változó tulajdonságértéke kisebb lesz, mint a medián, a másik fele pedig nagyobb, mint a medián (például: fajtastandard). A mediánt leggyakrabban a minőségi jellemzők jellemzésére használják. Például: a tőgy alakja csésze alakú, kerek, kecske. Helyes mintavételi lehetőség esetén mindhárom mutatónak azonosnak kell lennie (azaz X, Mo, Me). Így egy populáció első jellemzője az átlagértékek, de ezek nem elegendőek a populáció megítéléséhez.

Bármely populáció második fontos mutatója a tulajdonság variabilitása vagy változékonysága. Egy tulajdonság változékonyságát számos környezeti tényező és belső tényező határozza meg, pl. örökletes tényezők.

Egy adott tulajdonság variabilitásának meghatározása nagy jelentőséggel bír, mind a biológiában, mind az állattenyésztési gyakorlatban. Így egy tulajdonság variabilitásának mértékét mérő statisztikai paraméterek segítségével fajtakülönbségeket lehet megállapítani a különböző gazdaságilag hasznos tulajdonságok variabilitásának mértékében, előre jelezni a szelekció mértékét a különböző állatcsoportokban, valamint annak hatékonyságát. .

A statisztikai elemzés jelenlegi állása nemcsak a fenotípusos variabilitás megnyilvánulásának mértékének megállapítását teszi lehetővé, hanem a fenotípusos variabilitás komponenstípusaira, nevezetesen genotípusos és paratípusos variabilitásra való felosztását is. A variabilitás e dekompozíciója varianciaanalízissel történik.

A változékonyság fő mutatói a következő statisztikai értékek:

1. Határok;

2. Szórás (σ);

3. Variációs vagy variációs együttható (Cv).

Egy tulajdonság variabilitásának mértékét a legegyszerűbben határokon keresztül mutathatjuk be. A határértékek meghatározása a következőképpen történik: az attribútum max és minimum értéke közötti különbség. Minél nagyobb ez a különbség, annál nagyobb ez a tulajdonság változékonysága. Egy tulajdonság variabilitásának mérésének fő paramétere a szórás vagy (σ), és a következő képlet határozza meg:

σ = ±K ∙ √∑ Pa 2- b 2

A szórás főbb tulajdonságai i.e. (σ) a következők:

1. A szigma mindig megnevezett érték, és kifejezve (kg, g, méter, cm, db).

2. A szigma mindig pozitív érték.

3. Minél nagyobb a σ értéke, annál nagyobb a tulajdonság változékonysága.

4. A variációs sorozatban minden frekvencia benne van ±3σ-ben.

A szórás segítségével meghatározható, hogy egy adott egyed melyik variációs sorozatba tartozik. A jellemző variabilitásának határértékekkel és szórással történő meghatározásának megvannak a maga hátrányai, mivel a variabilitás nagysága alapján nem lehet összehasonlítani a különböző jellemzőket. Ismerni kell ugyanabban az állatban vagy ugyanazon állatcsoportban a különböző tulajdonságok változékonyságát, például: a tejhozam variabilitása, a tej zsírtartalma, élősúlya, tejzsír mennyisége. Ezért az ellentétes jellemzők változékonyságának összehasonlításával és változékonyságuk mértékének meghatározásával a variabilitási együtthatót a következő képlet segítségével számítjuk ki:

Így a főbb módszerek a jellemzők variabilitásának felmérésére a populáció tagjai között a következők: határértékek; szórás (σ) és variációs együttható vagy variabilitás.

Az állattenyésztési gyakorlatban és a kísérleti kutatásokban gyakran kell kis mintákkal foglalkozni. Kis minta a 30-at meg nem haladó vagy 30-nál kisebb egyedek vagy állatok számát nevezik. A kis minta felhasználásával kialakult minták átkerülnek a teljes populációra. Kis mintára ugyanazokat a statisztikai paramétereket határozzuk meg, mint nagy mintánál (X, σ, Cv, Mx). Képleteik és számításaik azonban eltérnek egy nagy mintától (azaz egy variációs sorozat képleteitől és számításaitól).

1. Számtani középérték X = ∑V

V - az opció vagy jellemző abszolút értéke;

n a változatok száma vagy az egyedek száma.

2. Szórás σ = ± √ ∑α 2

α = x-¯x, ez az opció értéke és a számtani átlag különbsége. Ez az α különbség négyzetes, α 2 n-1 pedig a szabadsági fokok száma, azaz. az összes változat vagy egyed száma eggyel csökkentve (1).

Ellenőrző kérdések:

1.Mi az a biometrikus adat?

2.Milyen statisztikai paraméterek jellemzik a sokaságot?

3.Milyen mutatók jellemzik a változékonyságot?

4.Mi az a kis minta

5. Mi az a mód és a medián?

12. sz. előadás

Biotechnológia és embrióátültetés

1. A biotechnológia fogalma.

2. Donor és recipiens tehenek kiválasztása, embrióátültetés.

3. A transzplantáció jelentősége az állattenyésztésben.

A statisztikai kutatás gyakorlatában gyakran találkozunk kis minták , amelyek térfogata 30 egységnél kisebb. A nagy minták általában több mint 100 egységet tartalmaznak.

Általában kis mintákat használnak olyan esetekben, amikor lehetetlen vagy nem célszerű nagy mintát használni. Ilyen mintákkal kell számolni például turisták és szállodalátogatók felmérésekor.

Egy kis minta hibájának nagyságát olyan képletekkel határozzuk meg, amelyek eltérnek a viszonylag nagy minta méretétől ().

Kis mintamérettel n figyelembe kell venni a minta és a populáció varianciája közötti kapcsolatot:

Mivel kis mintában a tört szignifikáns, ezért a szórást az ún szabadsági fokok száma . Ez azon opciók számát jelenti, amelyek tetszőleges értékeket vehetnek fel az átlag értékének megváltoztatása nélkül.

Egy kis minta átlagos hibáját a következő képlet határozza meg:

Az átlag és az arány maximális mintavételi hibája hasonlóan nagy minta esetén található:

ahol t a konfidencia együttható, az adott szignifikanciaszinttől és a szabadságfokok számától függően (5. melléklet).

Az együttható értékek nemcsak az adott megbízhatósági valószínűségtől, hanem a minta méretétől is függenek n. A t és n egyedi értékek esetén a megbízhatósági valószínűséget a Student-eloszlás határozza meg, amely a szabványos eltérések eloszlását tartalmazza:

Megjegyzés. A minta méretének növekedésével a Student-eloszlás megközelíti a normál eloszlást: mikor n=20 alig tér el a normál eloszlástól. Kis mintás felmérések végzésekor figyelembe kell venni, hogy minél kisebb a mintanagyság n, annál nagyobb a különbség a Student-eloszlás és a normál eloszlás között. Például mikor p min. = 4 ez a különbség meglehetősen jelentős, ami egy kis minta eredményeinek pontosságának csökkenését jelzi.