Parametri fondamentali di un piccolo campione. Piccolo campione

Metodo del piccolo campione

Il vantaggio principale del metodo dei piccoli campioni è la capacità di valutare la dinamica del processo nel tempo, riducendo i tempi delle procedure computazionali.

I campioni istantanei vengono selezionati casualmente in determinati periodi di tempo che vanno da 5 a 20 unità. Il periodo di campionamento è stabilito empiricamente e dipende dalla stabilità del processo, determinata analizzando informazioni a priori.

Per ciascun campione istantaneo vengono determinate le principali caratteristiche statistiche. I campioni istantanei e le loro principali caratteristiche statistiche sono presentati nell'Appendice B.

Un’ipotesi sull’omogeneità della dispersione del campione viene avanzata e testata utilizzando uno dei possibili criteri (criterio di Fisher).

Testare l'ipotesi sull'omogeneità delle caratteristiche del campione.

Per verificare la significatività della differenza tra le medie aritmetiche in 2 serie di misurazioni, la misura G viene introdotta nell'Appendice B

La regola decisionale è formulata come segue:

dove tr è il valore del quantile della distribuzione normalizzata ad una data probabilità di confidenza P, ? = 0,095, n = 10, tр =2,78.

Quando la disuguaglianza è soddisfatta, viene confermata l’ipotesi che la differenza tra le medie campionarie non sia significativa.

Poiché la disuguaglianza è soddisfatta in tutti i casi, viene confermata l’ipotesi che la differenza tra le medie campionarie non sia significativa.

Per verificare l'ipotesi sull'omogeneità delle varianze campionarie, la misura F0 viene introdotta come il rapporto tra le stime imparziali delle varianze dei risultati di 2 serie di misurazioni. Inoltre, si prende come numeratore la maggiore delle 2 stime e se Sx1>Sx2, allora

I risultati del calcolo sono riportati nell'Appendice B.

Successivamente si specificano i valori della probabilità di confidenza P e si determinano i valori di F(K1; K2; ?/2) con K1 = n1 - 1 e K2 = n2 - 1.

Con P = 0,025 e K1 = 10-1 = 4 e K2 = 10-1 = 4 F (9;9;0,025/2) =4,1.

Regola decisionale: se F(K1; K2; ?/2)>F0, allora è accettata l'ipotesi sull'omogeneità delle varianze nei due campioni.

Poiché la condizione F(K1; K2; ?/2) > F0 è soddisfatta in tutti i casi, è accettata l'ipotesi di omogeneità delle varianze.

Viene così confermata l'ipotesi sull'omogeneità delle varianze del campione, che indica la stabilità del processo; l'ipotesi sull'omogeneità delle medie campionarie utilizzando il metodo del confronto delle medie è confermata, ciò significa che il centro di dispersione non è cambiato e il processo è in uno stato stabile.

Metodo dei grafici a dispersione e di precisione

Durante un certo periodo di tempo vengono prelevati campioni istantanei da 3 a 10 prodotti e vengono determinate le caratteristiche statistiche di ciascun campione.

I dati ottenuti vengono tracciati su diagrammi con il tempo sull'asse delle ascisse? o numeri k di campioni e sull'asse delle ordinate - valori individuali di xk o il valore di una delle caratteristiche statistiche (media aritmetica del campione, deviazione standard del campione). Inoltre, sul diagramma sono disegnate due linee orizzontali Тв e Тн, che limitano l'intervallo di tolleranza del prodotto.

I campioni istantanei sono riportati nell'Appendice B.


Figura 1 grafico di precisione

Il diagramma mostra chiaramente l'avanzamento del processo produttivo. Può essere utilizzato per indicare che il processo produttivo è instabile

L’estensione delle caratteristiche campionarie alla popolazione generale, basata sulla legge dei grandi numeri, richiede una dimensione campionaria sufficientemente ampia. Tuttavia, nella pratica della ricerca statistica, ci si trova spesso di fronte all'impossibilità, per un motivo o per l'altro, di aumentare il numero di unità campionarie di piccola dimensione. Ciò vale per lo studio delle attività di imprese, istituti scolastici, banche commerciali, ecc., Il cui numero nelle regioni è, di regola, insignificante e talvolta ammonta a solo 5-10 unità.

Nel caso in cui la popolazione campione sia costituita da un numero ridotto di unità, inferiore a 30, si parla di campione piccolo In questo caso, il teorema di Lyapunov non può essere utilizzato per calcolare l’errore di campionamento, poiché la media campionaria è significativamente influenzata dal valore di ciascuna delle unità selezionate casualmente e la sua distribuzione può differire significativamente da quella normale.

Nel 1908 V.S. Gosset ha dimostrato che la stima della discrepanza tra la media campionaria di un piccolo campione e la media generale ha una legge di distribuzione speciale (vedi Capitolo 4). Affrontando il problema della stima probabilistica della media campionaria con un numero limitato di osservazioni, ha dimostrato che in questo caso è necessario considerare la distribuzione non delle medie campionarie stesse, ma dell'entità delle loro deviazioni dalla media delle medie campionarie. popolazione originaria. In questo caso, le conclusioni possono essere abbastanza affidabili.

La scoperta dello studente si chiama teoria del piccolo campione.

Quando si valutano i risultati di un piccolo campione, il valore della varianza generale non viene utilizzato nei calcoli. Nei campioni di piccole dimensioni, la varianza del campione “corretta” viene utilizzata per calcolare l’errore medio di campionamento:

quelli. a differenza dei campioni di grandi dimensioni invece al denominatore P costi (e - 1). Il calcolo dell'errore medio di campionamento per un piccolo campione è riportato nella tabella. 5.7.

Tabella 5.7

Calcolo dell'errore medio di un piccolo campione

L'errore marginale di un piccolo campione è: dove T- fattore fiducia.

Grandezza T si riferisce in modo diverso alla stima probabile rispetto a un campione ampio. In accordo con la distribuzione di Student, la stima probabile dipende da entrambi i valori T, e sulla dimensione del campione I nel caso in cui l'errore marginale non superi r volte l'errore medio in campioni piccoli. Tuttavia, dipende in gran parte dal numero di unità selezionate.

V.S. Gosset ha compilato una tabella delle distribuzioni di probabilità in piccoli campioni corrispondenti a determinati valori del coefficiente di confidenza T e diversi volumi di un piccolo campione e un estratto da esso è riportato nella tabella. 5.8.

Tabella 5.8

Frammento della tabella delle probabilità di Student (probabilità moltiplicate per 1000)

Dati della tabella 5.8 indicano che con un aumento illimitato della dimensione del campione (i = °°), la distribuzione di Student tende alla legge di distribuzione normale, e per i = 20 differisce poco da essa.

La tabella della distribuzione degli studenti è spesso presentata in una forma diversa, più comoda per l'uso pratico (Tabella 5.9).

Tabella 5.9

Alcuni valori (distribuzioni t di Student

Numero di gradi di libertà

per intervallo di sola andata

per la spaziatura bidirezionale

P= 0,99

Diamo un'occhiata a come utilizzare la tabella di distribuzione. Ogni valore fisso P calcolare il numero di gradi di libertà K, Dove k = n- 1. Per ogni valore del grado di libertà è indicato il valore limite t p (t 095 O t0 99), che con una data probabilità R non verrà superato a causa di fluttuazioni casuali nei risultati del campionamento. In base alla magnitudo t pag i confini della fiducia sono determinati

intervallo

Di norma, viene utilizzato il livello di confidenza per i test bilaterali P = 0,95 o P = 0,99, il che non esclude la scelta di altri valori di probabilità. Il valore di probabilità viene selezionato in base ai requisiti specifici delle attività per le quali viene utilizzato un piccolo campione.

La probabilità che i valori medi generali vadano oltre l’intervallo di confidenza è pari a Q, Dove Q = 1 - R. Questo valore è molto piccolo. Di conseguenza, per le probabilità considerate Rè 0,05 e 0,01.

I piccoli campioni sono molto diffusi nelle scienze tecniche e in biologia, ma nelle ricerche statistiche devono essere utilizzati con grande cautela, solo con adeguato esame teorico e pratico. Un piccolo campione può essere utilizzato solo se la distribuzione della caratteristica nella popolazione è normale o vicina ad essa e il valore medio viene calcolato dai dati campione ottenuti come risultato di osservazioni indipendenti. Inoltre, tenere presente che l'accuratezza dei risultati di un campione di piccole dimensioni è inferiore rispetto a quella di un campione di grandi dimensioni.

statistiche su piccolo campione

È generalmente accettato che l'inizio di S. m.v. o, come spesso viene chiamata, statistica “n piccolo”, nasce nel primo decennio del XX secolo con la pubblicazione del lavoro di W. Gosset, in cui collocava la distribuzione t postulata dallo “studente” che ha guadagnato la fama mondiale poco dopo. A quel tempo, Gossett lavorava come statistico presso i birrifici Guinness. Uno dei suoi compiti era analizzare lotti successivi di barili di porter appena preparato. Per un motivo che non ha mai veramente spiegato, Gossett sperimentò l'idea di ridurre significativamente il numero di campioni prelevati dall'enorme numero di barili presenti nei magazzini del birrificio per controllare in modo casuale la qualità del porter. Ciò lo portò a postulare la distribuzione t. Poiché lo statuto dei birrifici Guinness proibiva ai loro dipendenti di pubblicare i risultati della ricerca, Gossett pubblicò i risultati del suo esperimento confrontando il campionamento del controllo di qualità utilizzando la distribuzione t per piccoli campioni e la tradizionale distribuzione z (distribuzione normale) in modo anonimo, sotto lo pseudonimo di "Student " - da qui il nome distribuzione t di Student).

distribuzione t. La teoria della distribuzione t, come la teoria della distribuzione z, viene utilizzata per verificare l'ipotesi nulla secondo cui due campioni sono semplicemente campioni casuali della stessa popolazione e quindi le statistiche calcolate (ad esempio media e deviazione standard) sono stime imparziali dei parametri della popolazione. Tuttavia, a differenza della teoria della distribuzione normale, la teoria della distribuzione t per piccoli campioni non richiede conoscenze a priori o stime precise del valore atteso e della varianza della popolazione. Inoltre, sebbene testare la significatività statistica della differenza tra le medie di due grandi campioni richieda il presupposto fondamentale che le caratteristiche della popolazione siano distribuite normalmente, la teoria della distribuzione t non richiede ipotesi sui parametri.

È noto che le caratteristiche normalmente distribuite sono descritte da un'unica curva, la curva gaussiana, che soddisfa la seguente equazione:

Con la distribuzione t, l'intera famiglia di curve è rappresentata dalla seguente formula:

Questo è il motivo per cui l'equazione per t include una funzione gamma, che in matematica significa che al variare di n, una curva diversa soddisferà l'equazione data.

Gradi di libertà

Nell'equazione per t, la lettera n indica il numero di gradi di libertà (df) associati alla stima della varianza della popolazione (S2), che rappresenta il secondo momento di qualsiasi funzione generatrice di momenti, come l'equazione per la distribuzione t . In S., il numero di gradi di libertà indica quante caratteristiche rimangono libere dopo il loro utilizzo parziale in un particolare tipo di analisi. In una distribuzione t, una delle deviazioni dalla media campionaria è sempre fissa, poiché la somma di tutte queste deviazioni deve essere uguale a zero. Ciò influisce sulla somma dei quadrati quando si calcola la varianza del campione come stima imparziale del parametro S2 e porta a df uguale al numero di misurazioni meno una per ciascun campione. Pertanto, nelle formule e nelle procedure per il calcolo delle statistiche t per verificare l'ipotesi nulla, df = n - 2.

Divisione F-pac. L'ipotesi nulla testata dal test t è che i due campioni siano stati estratti casualmente dalla stessa popolazione o siano stati estratti casualmente da due popolazioni diverse con la stessa varianza. Ma cosa succede se è necessario analizzare più gruppi? La risposta a questa domanda fu cercata vent'anni dopo che Gosset scoprì la distribuzione t. Due dei più eminenti statistici del XX secolo furono direttamente coinvolti nella sua produzione. Uno è il più grande statistico inglese R. A. Fisher, che propose le prime teorie. formulazioni, il cui sviluppo ha portato alla produzione della distribuzione F; il suo lavoro sulla teoria dei piccoli campioni, che sviluppava le idee di Gosset, fu pubblicato a metà degli anni '20 (Fisher, 1925). Un altro è George Snedecor, uno dei primi statistici americani, che sviluppò un modo per confrontare due campioni indipendenti di qualsiasi dimensione calcolando il rapporto tra due stime della varianza. Chiamò questa relazione rapporto F, dal nome di Fischer. Risultati della ricerca Snedecor portò al fatto che la distribuzione F cominciò a essere specificata come la distribuzione del rapporto di due statistiche c2, ciascuna con i propri gradi di libertà:

Da ciò derivò il classico lavoro di Fisher sull'analisi della varianza, un metodo statistico esplicitamente focalizzato sull'analisi di piccoli campioni.

La distribuzione campionaria F (dove n = df) è rappresentata dalla seguente equazione:

Come per la distribuzione t, la funzione gamma indica che esiste una famiglia di distribuzioni che soddisfano l'equazione per F. In questo caso, però, l'analisi coinvolge due quantità df: il numero di gradi di libertà per il numeratore e per quello denominatore del rapporto F.

Tabelle per la stima delle statistiche t e F. Quando si testa l'ipotesi nulla utilizzando S., in base alla teoria dei campioni di grandi dimensioni, di solito è necessaria solo una tabella di ricerca: una tabella delle deviazioni normali (z), che consente di determinare l'area sotto la curva normale tra due valori z qualsiasi ​​​​sull'asse x. Tuttavia, le tabelle per le distribuzioni t e F sono necessariamente presentate in una serie di tabelle, poiché queste tabelle si basano su una varietà di distribuzioni risultanti dalla variazione del numero di gradi di libertà. Sebbene le distribuzioni t e F siano distribuzioni di densità di probabilità, come la distribuzione normale per campioni di grandi dimensioni, differiscono da quest'ultima in quattro modi utilizzati per descriverle. La distribuzione t, ad esempio, è simmetrica (notare t2 nella sua equazione) per tutti i df, ma raggiunge picchi sempre maggiori man mano che la dimensione del campione diminuisce. Le curve con picco (quelle con curtosi maggiore del normale) tendono ad essere meno asintotiche (cioè meno vicine all'asse x alle estremità della distribuzione) rispetto alle curve con curtosi normale, come la curva gaussiana. Questa differenza si traduce in notevoli discrepanze tra i punti sull'asse x corrispondenti ai valori t e z. Con df = 5 e un livello α a due code di 0,05, t = 2,57, mentre il corrispondente z = 1,96. Pertanto, t = 2,57 indica la significatività statistica al livello del 5%. Tuttavia, nel caso di una curva normale, z = 2,57 (più precisamente 2,58) indicherà già un livello di significatività statistica dell'1%. Confronti simili possono essere fatti con la distribuzione F, poiché t è uguale a F quando il numero di campioni è due.

Cosa costituisce un campione “piccolo”?

Un tempo ci si chiedeva quanto dovesse essere ampio il campione per essere considerato piccolo. Semplicemente non esiste una risposta definitiva a questa domanda. Tuttavia, il confine convenzionale tra un campione piccolo e uno grande è considerato df = 30. La base per questa decisione alquanto arbitraria è il risultato del confronto della distribuzione t con la distribuzione normale. Come notato sopra, la discrepanza tra i valori t e z tende ad aumentare al diminuire di df e a diminuire all’aumentare di df. Infatti, t comincia ad avvicinarsi molto a z molto prima del caso limite in cui t = z per df = ∞. Un semplice esame visivo dei valori della tabella di t mostra che questa approssimazione diventa abbastanza veloce, a partire da df = 30 e oltre. I valori comparativi di t (a df = 30) e z sono uguali, rispettivamente: 2,04 e 1,96 per p = 0,05; 2,75 e 2,58 per p = 0,01; 3,65 e 3,29 per p = 0,001.

Altre statistiche per campioni “piccoli”.

Sebbene le statistiche come t e F siano progettate specificamente per l'uso con campioni piccoli, sono ugualmente applicabili a campioni di grandi dimensioni. Esistono tuttavia molti altri metodi statistici progettati per analizzare piccoli campioni e vengono spesso utilizzati a questo scopo. Questo si riferisce al cosiddetto. metodi non parametrici o privi di distribuzione. Fondamentalmente, le scale che compaiono in questi metodi sono destinate ad essere applicate a misurazioni ottenute utilizzando scale che non soddisfano la definizione di scale di rapporto o di intervallo. Molto spesso si tratta di misurazioni ordinali (rango) o nominali. Le scale non parametriche non richiedono ipotesi sui parametri di distribuzione, in particolare per quanto riguarda le stime di dispersione, perché le scale ordinali e nominali eliminano il concetto stesso di dispersione. Per questo motivo, i metodi non parametrici vengono utilizzati anche per misurazioni ottenute utilizzando scale di intervalli e rapporti quando vengono analizzati campioni piccoli e è probabile che i presupposti di base richiesti per l'uso dei metodi parametrici vengano violati. Questi test, che possono essere ragionevolmente applicati a piccoli campioni, includono: il test di probabilità esatta di Fisher, l'analisi non parametrica della varianza a due fattori (rango) di Friedman, il coefficiente di correlazione t-rank di Kendall, il coefficiente di concordanza (W) di Kendall, il test H di Kruskal - Wallace per l'analisi non parametrica (di rango) unidirezionale della varianza, test U di Mann-Whitney, test della mediana, test dei segni, coefficiente di correlazione dei ranghi di Spearman r e test t di Wilcoxon.

Quando si studia la variabilità, si distinguono caratteristiche quantitative e qualitative, il cui studio viene effettuato mediante la statistica delle variazioni, che si basa sulla teoria della probabilità. La probabilità indica la possibile frequenza con cui un individuo incontra una particolare caratteristica. P=m/n, dove m è il numero di individui con un dato valore di tratto; n è il numero di tutti gli individui del gruppo. La probabilità varia da 0 a 1 (ad esempio, la probabilità è 0,02 - la comparsa di gemelli in una mandria, ovvero appariranno due gemelli ogni 100 parti). Pertanto, l'oggetto di studio della biometria è una caratteristica variabile, il cui studio viene effettuato su un determinato gruppo di oggetti, ad es. totalità. Esistono popolazioni generali e campione. Popolazione Questo è un ampio gruppo di individui che ci interessa in base al tratto studiato. La popolazione generale può includere una specie di animale o una razza della stessa specie. La popolazione generale (razza) comprende diversi milioni di animali. Allo stesso tempo, la razza si divide in molti gruppi, ad es. allevamenti di singoli allevamenti. Poiché la popolazione generale è costituita da un gran numero di individui, è tecnicamente difficile studiarla. Pertanto, non studiano l'intera popolazione, ma solo una parte di essa, come viene chiamata elettivo O popolazione campione.

Sulla base della popolazione campione, viene espresso un giudizio sull'intera popolazione nel suo insieme. Il campionamento deve essere effettuato secondo tutte le regole, che devono includere individui con tutti i valori del tratto variabile. La selezione degli individui dalla popolazione generale viene effettuata secondo il principio del caso o mediante sorteggio. In biometria esistono due tipi di campionamento casuale: grande e piccolo. Grande campioneè chiamato quello che include più di 30 individui o osservazioni, e piccolo campione meno di 30 individui. Esistono diversi metodi di elaborazione dei dati per popolazioni campione grandi e piccole. La fonte delle informazioni statistiche può essere costituita da dati provenienti da registri zootecnici e veterinari, che forniscono informazioni su ciascun animale dalla nascita fino allo smaltimento. Un'altra fonte di informazioni possono essere i dati provenienti da esperimenti scientifici e produttivi condotti su un numero limitato di animali. Una volta ottenuto il campione, inizia la lavorazione. Ciò consente di ottenere sotto forma di quantità matematiche un numero di quantità o coefficienti statistici che caratterizzano le caratteristiche dei gruppi di animali di interesse.

I seguenti parametri o indicatori statistici sono ottenuti utilizzando il metodo biometrico:

1. Valori medi di una caratteristica variabile (media aritmetica, moda, mediana, media geometrica).

2. Coefficienti che misurano la quantità di variazione, ad es. (variabilità) della caratteristica studiata (deviazione standard, coefficiente di variazione).

3. Coefficienti che misurano l'entità della relazione tra caratteristiche (coefficiente di correlazione, coefficiente di regressione e rapporto di correlazione).

4. Errori statistici e affidabilità dei dati statistici ottenuti.

5. La quota di variazione derivante dall'influenza di vari fattori e altri indicatori associati allo studio dei problemi genetici e di selezione.

Quando si elabora statisticamente un campione, i membri della popolazione vengono organizzati sotto forma di serie di variazioni. Una serie di variazioni è un raggruppamento di individui in classi a seconda del valore del tratto studiato. La serie di variazioni è composta da due elementi: classi e una serie di frequenze. La serie di variazioni può essere intermittente o continua. Vengono chiamate le funzionalità che possono accettare solo un numero intero numero intermittente teste, numero di uova, numero di suinetti e altri. Vengono chiamate le caratteristiche che possono essere espresse in numeri frazionari continuo(altezza cm, produzione latte kg, % grasso, peso vivo e altri).

Quando si costruisce una serie di variazioni, vengono rispettati i seguenti principi o regole:

1. Determinare o contare il numero di individui per i quali verrà costruita la serie di variazioni (n).

2. Trova il valore massimo e minimo della caratteristica studiata.

3. Determinare l'intervallo di classi K = max - min / numero di classi, il numero di classi è preso arbitrariamente.

4. Costruisci classi e determina il confine di ciascuna classe, min+K.

5. Distribuiscono i membri della popolazione in classi.

Dopo aver costruito le classi e distribuito gli individui in classi, vengono calcolati i principali indicatori delle serie di variazione (X, σ, Cv, Mх, Мσ, Мcv). Il valore medio dell'attributo ha ricevuto il valore maggiore nella caratterizzazione della popolazione. Nella risoluzione di tutti i problemi zootecnici, veterinari, medici, economici e di altro tipo, viene sempre determinato il valore medio di un carattere (resa media di latte della mandria, % di grasso, fertilità nell'allevamento di suini, produzione di uova nei polli e altri caratteri). I parametri che caratterizzano il valore medio di una caratteristica includono quanto segue:

1. Media aritmetica.

2. Media aritmetica ponderata.

3. Media geometrica.

4. Moda (Mo).

5. Mediana (Me) e altri parametri.

Significato aritmetico ci mostra quale valore dei tratti avrebbero gli individui di un dato gruppo se fosse uguale per tutti, ed è determinato dalla formula X = A + b × K

La proprietà principale della media aritmetica è quella di eliminare la variazione di una caratteristica e di renderla comune a tutta la popolazione. Allo stesso tempo, va notato che la media aritmetica assume un significato astratto, vale a dire calcolandolo si ottengono indicatori frazionari, che in realtà potrebbero non esistere. Ad esempio: la resa dei vitelli per 100 mucche è di 85,3 vitelli, la fertilità delle scrofe è di 11,8 suinetti, la produzione di uova di polli è di 252,4 uova e altri indicatori.

Il valore della media aritmetica è molto elevato nella pratica di allevamento e nelle caratteristiche della popolazione. Nella pratica dell'allevamento degli animali, in particolare nell'allevamento del bestiame, viene utilizzato un valore aritmetico ponderato per determinare il contenuto medio di grassi nel latte durante l'allattamento.

Valore medio geometrico viene calcolato se è necessario caratterizzare il tasso di crescita, il tasso di aumento della popolazione, quando la media aritmetica distorce i dati.

Moda nominare il valore riscontrato più frequentemente di una caratteristica variabile, sia quantitativa che qualitativa. Il numero modale per una mucca è il capezzolo numero-4. Anche se ci sono mucche con cinque o sei capezzoli. In una serie di variazioni, la classe modale sarà la classe in cui è presente il maggior numero di frequenze e la definiamo classe zero.

Mediano si chiama variante che divide tutti i membri della popolazione in due parti uguali. La metà dei membri della popolazione avrà un valore del tratto variabile inferiore alla mediana e l'altra metà avrà un valore superiore alla mediana (ad esempio: standard di razza). La mediana viene spesso utilizzata per caratterizzare le caratteristiche qualitative. Ad esempio: la forma della mammella è a coppa, rotonda, caprina. Con l'opzione di campionamento corretta, tutti e tre gli indicatori dovrebbero essere uguali (vale a dire X, Mo, Me). Pertanto, la prima caratteristica di una popolazione sono i valori medi, ma questi non sono sufficienti per giudicare la popolazione.

Il secondo indicatore importante di qualsiasi popolazione è la variabilità o variabilità del tratto. La variabilità di un tratto è determinata da molti fattori ambientali e interni, ad es. fattori ereditari.

Determinare la variabilità di un carattere è di grande importanza, sia in biologia che nella pratica zootecnica. Pertanto, utilizzando parametri statistici che misurano il grado di variabilità di un tratto, è possibile stabilire differenze di razza nel grado di variabilità di vari tratti economicamente utili, prevedere il livello di selezione in diversi gruppi di animali, nonché la sua efficacia .

Lo stato attuale dell'analisi statistica consente non solo di stabilire il grado di manifestazione della variabilità fenotipica, ma anche di dividere la variabilità fenotipica nei suoi tipi componenti, vale a dire variabilità genotipica e paratipica. Questa scomposizione della variabilità viene effettuata utilizzando l'analisi della varianza.

I principali indicatori di variabilità sono i seguenti valori statistici:

1. Limiti;

2. Deviazione standard (σ);

3. Coefficiente di variabilità o variazione (Cv).

Il modo più semplice per presentare la quantità di variabilità di un tratto è attraverso i limiti. I limiti sono determinati come segue: la differenza tra i valori massimo e minimo dell'attributo. Maggiore è questa differenza, maggiore è la variabilità di questo tratto. Il parametro principale per misurare la variabilità di un tratto è la deviazione standard o (σ) ed è determinato dalla formula:

σ = ±K∙√∑ Pa 2-b2

Le principali proprietà della deviazione standard, ad es. (σ) sono i seguenti:

1. Sigma è sempre un valore denominato ed è espresso (in kg, g, metri, cm, pz.).

2. Sigma è sempre un valore positivo.

3. Maggiore è il valore di σ, maggiore è la variabilità del tratto.

4. Nella serie di variazioni, tutte le frequenze sono comprese in ±3σ.

Utilizzando la deviazione standard, è possibile determinare a quale serie di variazioni appartiene un determinato individuo. I metodi per determinare la variabilità di una caratteristica utilizzando limiti e deviazione standard hanno i loro svantaggi, poiché è impossibile confrontare caratteristiche diverse in base all'entità della variabilità. È necessario conoscere la variabilità dei vari tratti nello stesso animale o nello stesso gruppo di animali, ad esempio: variabilità nella produzione di latte, contenuto di grassi nel latte, peso vivo, quantità di grasso del latte. Pertanto, confrontando la variabilità di caratteristiche opposte e individuando il grado della loro variabilità, il coefficiente di variabilità viene calcolato utilizzando la seguente formula:

Pertanto, i principali metodi per valutare la variabilità delle caratteristiche tra i membri di una popolazione sono: limiti; deviazione standard (σ) e coefficiente di variazione o variabilità.

Nella pratica zootecnica e nella ricerca sperimentale spesso si ha a che fare con campioni di piccole dimensioni. Piccolo campione chiamano il numero di individui o animali non superiore a 30 o inferiore a 30. I modelli stabiliti vengono trasferiti all'intera popolazione utilizzando un piccolo campione. Per un campione piccolo vengono determinati gli stessi parametri statistici di un campione grande (X, σ, Cv, Mx). Tuttavia, le loro formule e i loro calcoli differiscono da un campione ampio (cioè dalle formule e dai calcoli di una serie di variazioni).

1. Valore medio aritmetico X = ∑V

V - valore assoluto dell'opzione o caratteristica;

n è il numero di varianti o il numero di individui.

2. Deviazione standard σ = ± √ ∑α2

α = x-¯x, è la differenza tra il valore dell'opzione e la media aritmetica. Questa differenza α è al quadrato e α 2 n-1 è il numero di gradi di libertà, cioè il numero di tutte le varianti o individui ridotto di uno (1).

Domande di controllo:

1.Che cos'è la biometria?

2.Quali parametri statistici caratterizzano la popolazione?

3.Quali indicatori caratterizzano la variabilità?

4.Che cos'è un piccolo campione

5. Cosa sono la moda e la mediana?

Lezione n. 12

Biotecnologie e trapianto di embrioni

1. Il concetto di biotecnologia.

2. Selezione delle mucche donatrici e riceventi, trapianto di embrioni.

3. L'importanza del trapianto in zootecnia.

Nella pratica della ricerca statistica ci si imbatte spesso piccoli campioni , che hanno un volume inferiore a 30 unità. I campioni di grandi dimensioni solitamente includono campioni di più di 100 unità.

Di solito vengono utilizzati campioni piccoli nei casi in cui è impossibile o poco pratico utilizzare un campione di grandi dimensioni. Con campioni di questo tipo si ha a che fare, ad esempio, quando si effettuano indagini sui turisti e sui visitatori degli alberghi.

L'entità dell'errore di un campione piccolo viene determinata utilizzando formule che differiscono da quelle per un campione di dimensioni relativamente grandi ().

Con un campione di piccole dimensioni N si dovrebbe tenere conto della relazione tra la varianza del campione e quella della popolazione:

Poiché in un piccolo campione la frazione è significativa, la varianza viene calcolata tenendo conto del cosiddetto numero di gradi di libertà . Si intende il numero di opzioni che possono assumere valori arbitrari senza modificare il valore della media.

L'errore medio di un piccolo campione è determinato dalla formula:

L'errore massimo di campionamento per la media e la proporzione si trova in modo simile al caso di un campione ampio:

dove t è il coefficiente di confidenza, che dipende dal livello di significatività dato e dal numero di gradi di libertà (Appendice 5).

I valori dei coefficienti dipendono non solo dalla probabilità di confidenza data, ma anche dalla dimensione del campione N. Per i singoli valori di t e n, la probabilità di confidenza è determinata dalla distribuzione di Student, che contiene distribuzioni di deviazioni standardizzate:

Commento. All’aumentare della dimensione del campione, la distribuzione degli Studenti si avvicina alla distribuzione normale: quando N=20 differisce poco dalla distribuzione normale. Quando si conducono indagini su piccoli campioni, è necessario tenere conto del fatto che quanto più piccola è la dimensione del campione N, maggiore è la differenza tra la distribuzione di Student e la distribuzione normale. Ad esempio, quando p min. = 4 questa differenza è piuttosto significativa, il che indica una diminuzione dell'accuratezza dei risultati di un piccolo campione.