Caratteristiche di dispersione. Caratteristiche dello scattering Dispersione e sue proprietà Disuguaglianza di Chebyshev Caratteristiche di posizione e scattering

Non importa quanto siano importanti le caratteristiche medie, una caratteristica altrettanto importante di un array di dati numerici è il comportamento dei restanti membri dell'array rispetto alla media, quanto differiscono dalla media, quanti membri dell'array differiscono significativamente dalla media. Durante l'allenamento al tiro si parla dell'accuratezza dei risultati; nelle statistiche si studiano le caratteristiche della dispersione (spread).

Viene chiamata la differenza tra qualsiasi valore di x e il valore medio di x deviazione e calcolato come differenza x, - x. In questo caso la deviazione può assumere sia valori positivi se il numero è maggiore della media, sia valori negativi se il numero è inferiore alla media. Tuttavia, in statistica è spesso importante poter operare con un numero che caratterizzi la “precisione” di tutti gli elementi numerici di un array di dati. Qualsiasi somma di tutte le deviazioni dei membri dell'array porterà a zero, poiché le deviazioni positive e negative si annulleranno a vicenda. Per evitare l'azzeramento, per caratterizzare lo scattering vengono utilizzate le differenze al quadrato, o più precisamente, la media aritmetica delle deviazioni al quadrato. Questa caratteristica di dispersione è chiamata varianza di campionamento.

Maggiore è la varianza, maggiore è la dispersione dei valori delle variabili casuali. Per calcolare la dispersione, viene utilizzato un valore approssimativo della media campionaria x con un margine di una cifra rispetto a tutti i membri dell'array di dati. Altrimenti, quando si somma un gran numero di valori approssimativi, si accumulerà un errore significativo. In connessione con la dimensionalità dei valori numerici, va notato uno svantaggio di un indicatore di dispersione come la dispersione del campione: l'unità di misura della dispersione D è il quadrato dell'unità di misura dei valori X, la cui caratteristica è la dispersione. Per eliminare questo inconveniente, le statistiche hanno introdotto una caratteristica di dispersione come deviazione standard del campione , che è indicato dal simbolo UN (leggi “sigma”) e viene calcolato utilizzando la formula

Normalmente, più della metà dei membri dell'array di dati differisce dalla media di meno della deviazione standard, ovvero appartengono al segmento [X - UN; x+a]. Altrimenti dicono: la media, tenendo conto della diffusione dei dati, è pari a x ± a.

L'introduzione di un'altra caratteristica di scattering è associata alla dimensione dei membri della matrice di dati. Tutte le caratteristiche numeriche in statistica vengono introdotte allo scopo di confrontare i risultati dello studio di diversi array numerici che caratterizzano diverse variabili casuali. Tuttavia, il confronto delle deviazioni standard da diversi valori medi di diversi set di dati non è indicativo, soprattutto se anche le dimensioni di queste quantità sono diverse. Ad esempio, se si confrontano la lunghezza e il peso di eventuali oggetti o la dispersione nella produzione di micro e macro prodotti. In connessione con le considerazioni di cui sopra, viene introdotta una caratteristica di dispersione relativa, denominata coefficiente di variazione ed è calcolato dalla formula

Per calcolare le caratteristiche numeriche della dispersione dei valori delle variabili casuali, è conveniente utilizzare una tabella (Tabella 6.9).

Tabella 6.9

Calcolo delle caratteristiche numeriche della dispersione di valori di variabili casuali

Xj- X

(Xj-X)2/

La media campionaria è in fase di compilazione di questa tabella. X, che verrà utilizzato in due forme in futuro. Come caratteristica media finale (ad esempio, nella terza colonna della tabella) media del campione X deve essere arrotondato alla cifra corrispondente alla cifra più piccola di qualsiasi membro dell'array di dati numerici x g Tuttavia, questo indicatore viene utilizzato nella tabella per ulteriori calcoli e in questa situazione, vale a dire quando si calcola nella quarta colonna della tabella, la media del campione X deve essere arrotondato con un margine di una cifra rispetto alla cifra più piccola di qualsiasi membro dell'array di dati numerici X ( .

Il risultato dei calcoli utilizzando una tabella come table. 6.9 si otterrà il valore della dispersione del campione, e per registrare la risposta è necessario, in base al valore della dispersione del campione, calcolare il valore della deviazione standard a.

La risposta indica: a) il risultato medio tenendo conto della diffusione dei dati presenti nel modulo x±o; b) caratteristica di stabilità dei dati V. La risposta dovrebbe valutare la qualità del coefficiente di variazione: buono o cattivo.

Il coefficiente di variazione accettabile come indicatore di omogeneità o stabilità dei risultati nella ricerca sportiva è considerato pari al 10-15%. Il coefficiente di variazione V= 20% in qualsiasi ricerca è considerata una cifra molto elevata. Se la dimensione del campione P>25, quindi V> Il 32% è un pessimo indicatore.

Ad esempio, per una serie di variazioni discrete 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 tavoli 6.9 sarà compilato come segue (Tabella 6.10).

Tabella 6.10

Un esempio di calcolo delle caratteristiche numeriche della dispersione dei valori

*1

fi

1

l P 25 = 2,92 = 2,9

D_S_47.6_ P 25

Risposta: a) la caratteristica media, tenendo conto della diffusione dei dati, è pari a X± a = = 3 ± 1,4; b) la stabilità delle misurazioni ottenute è ad un livello basso, a partire dal coefficiente di variazione V = 48% > 32%.

Analogo del tavolo 6.9 può essere utilizzato anche per calcolare le caratteristiche di scattering di una serie di variazioni di intervalli. Allo stesso tempo, le opzioni x g saranno sostituiti dai rappresentanti delle lacune xv ja opzione frequenze assolute F(- alle frequenze assolute degli intervalli fv

Sulla base di quanto sopra è possibile effettuare quanto segue: conclusioni.

Le conclusioni della statistica matematica sono plausibili se vengono elaborate informazioni sui fenomeni di massa.

In genere, viene studiato un campione dalla popolazione generale di oggetti, che deve essere rappresentativo.

I dati sperimentali ottenuti come risultato dello studio di qualsiasi proprietà degli oggetti campione rappresentano il valore di una variabile casuale, poiché il ricercatore non può prevedere in anticipo quale numero corrisponderà a un particolare oggetto.

Per selezionare l'uno o l'altro algoritmo per la descrizione e l'elaborazione iniziale dei dati sperimentali, è importante essere in grado di determinare il tipo di variabile casuale: discreta, continua o mista.

Le variabili casuali discrete sono descritte da una serie di variazioni discrete e dalla sua forma grafica: un poligono di frequenza.

Le variabili casuali miste e continue sono descritte da una serie di variazioni di intervalli e dalla sua forma grafica: un istogramma.

Quando si confrontano più campioni in base al livello generato di una determinata proprietà, vengono utilizzate le caratteristiche numeriche medie e le caratteristiche numeriche della dispersione di una variabile casuale rispetto alla media.

Quando si calcola la caratteristica media, è importante selezionare correttamente il tipo di caratteristica media adeguata al suo campo di applicazione. I valori medi strutturali, moda e mediana, caratterizzano la struttura della posizione della variante in una serie ordinata di dati sperimentali. La media quantitativa consente di giudicare la dimensione media dell'opzione (media campionaria).

Per calcolare le caratteristiche numeriche dello scattering - varianza campionaria, deviazione standard e coefficiente di variazione - il metodo tabulare è efficace.

Le caratteristiche di posizione descrivono il centro della distribuzione. Allo stesso tempo, i significati dell'opzione possono essere raggruppati attorno ad essa sia in una banda larga che in una banda stretta. Pertanto, per descrivere la distribuzione, è necessario caratterizzare l'intervallo di variazioni nei valori della caratteristica. Le caratteristiche di dispersione vengono utilizzate per descrivere l'intervallo di variazione di una caratteristica. I più utilizzati sono l'intervallo di variazione, la dispersione, la deviazione standard e il coefficiente di variazione.

Gamma di variazioneè definita come la differenza tra il valore massimo e minimo di una caratteristica nella popolazione oggetto di studio:

R=X massimo - X min.

L'ovvio vantaggio dell'indicatore in esame è la semplicità del calcolo. Tuttavia, poiché l'ambito della variazione dipende solo dai valori estremi della caratteristica, l'ambito della sua applicazione è limitato a distribuzioni abbastanza omogenee. In altri casi, il contenuto informativo di questo indicatore è molto ridotto, poiché esistono molte distribuzioni molto diverse nella forma, ma con lo stesso intervallo. Negli studi pratici, l'intervallo di variazione viene talvolta utilizzato con campioni di piccole dimensioni (non più di 10). Ad esempio, dall’intervallo di variazione è facile valutare quanto diversi siano i risultati migliori e quelli peggiori in un gruppo di atleti.

In questo esempio:

R=16,36 – 13,04=3,32 (m).

La seconda caratteristica della dispersione è dispersione. La dispersione è il quadrato medio della deviazione di una variabile casuale dalla sua media. La dispersione è una caratteristica dello scattering, la diffusione dei valori di una quantità attorno al suo valore medio. La stessa parola “dispersione” significa “dispersione”.

Quando si conducono studi campione, è necessario stabilire una stima della varianza. La varianza calcolata dai dati campione è chiamata varianza campionaria ed è indicata con S 2 .

A prima vista, la stima più naturale della varianza è la varianza statistica, calcolata in base alla definizione utilizzando la formula:

In questa formula: la somma delle deviazioni quadrate dei valori degli attributi x io dalla media aritmetica . Per ottenere la deviazione quadratica media, questa somma viene divisa per la dimensione del campione P.

Tuttavia, tale stima non è imparziale. Si può dimostrare che la somma dei quadrati delle deviazioni dei valori degli attributi per una media aritmetica campionaria è inferiore alla somma dei quadrati delle deviazioni da qualsiasi altro valore, inclusa la vera media (aspettativa matematica). Pertanto, il risultato ottenuto dalla formula sopra conterrà un errore sistematico e il valore stimato della varianza risulterà sottostimato. Per eliminare il bias è sufficiente introdurre un fattore di correzione. Il risultato è la seguente relazione per la varianza stimata:

Per valori grandi N Naturalmente, entrambe le stime - distorta e imparziale - differiranno molto poco e l'introduzione di un fattore di correzione perderà di significato. Di norma, la formula per stimare la varianza dovrebbe essere perfezionata quando N<30.

Nel caso di dati raggruppati, l’ultima formula può essere ridotta alla seguente forma per semplificare i calcoli:

Dove K- numero di intervalli di raggruppamento;

no io- frequenza dell'intervallo con numero io;

x io- il valore mediano dell'intervallo con numero io.

Ad esempio, calcoliamo la varianza per i dati raggruppati dell'esempio che stiamo analizzando (vedi Tabella 4.):

S 2 =/ 28=0,5473 (m2).

La varianza di una variabile casuale ha la dimensione del quadrato della dimensione della variabile casuale, il che la rende difficile da interpretare e la rende poco chiara. Per una descrizione più visiva dello scattering, è più conveniente utilizzare una caratteristica la cui dimensione coincide con la dimensione della caratteristica studiata. A questo scopo viene introdotto il concetto deviazione standard(O deviazione standard).

Deviazione standard si chiama radice quadrata positiva della varianza:

Nel nostro esempio, la deviazione standard è uguale a

La deviazione standard ha le stesse unità di misura dei risultati della misurazione della caratteristica in esame e, quindi, caratterizza il grado di deviazione della caratteristica dalla media aritmetica. In altre parole, mostra come si trova la parte principale dell'opzione rispetto alla media aritmetica.

La deviazione standard e la varianza sono le misure di variazione più utilizzate. Ciò è dovuto al fatto che sono inclusi in una parte significativa dei teoremi della teoria della probabilità, che costituisce il fondamento della statistica matematica. Inoltre, la varianza può essere scomposta nei suoi elementi componenti, che consentono di valutare l'influenza di vari fattori sulla variazione del tratto studiato.

Oltre agli indicatori assoluti di variazione, che sono la dispersione e la deviazione standard, nelle statistiche vengono introdotti anche quelli relativi. Il coefficiente di variazione è più spesso utilizzato. Il coefficiente di variazione pari al rapporto tra la deviazione standard e la media aritmetica, espressa in percentuale:

Dalla definizione risulta chiaro che, nel suo significato, il coefficiente di variazione è una misura relativa della dispersione di una caratteristica.

Per l'esempio in questione:

Il coefficiente di variazione è ampiamente utilizzato nella ricerca statistica. Essendo un valore relativo, consente di confrontare la variabilità di entrambe le caratteristiche che hanno unità di misura diverse, nonché la stessa caratteristica in più popolazioni diverse con valori diversi della media aritmetica.

Il coefficiente di variazione viene utilizzato per caratterizzare l'omogeneità dei dati sperimentali ottenuti. Nella pratica della cultura fisica e dello sport, la dispersione dei risultati delle misurazioni in base al valore del coefficiente di variazione è considerata piccola (V<10%), средним (11-20%) и большим (V> 20%).

Le restrizioni sull'uso del coefficiente di variazione sono legate alla sua natura relativa: la definizione contiene la normalizzazione alla media aritmetica. A questo proposito, a piccoli valori assoluti della media aritmetica, il coefficiente di variazione può perdere il suo contenuto informativo. Quanto più la media aritmetica è vicina allo zero, tanto meno informativo diventa questo indicatore. Nel caso limite, la media aritmetica va a zero (ad esempio, la temperatura) e il coefficiente di variazione va all'infinito, indipendentemente dalla diffusione della caratteristica. Per analogia con il caso dell'errore si può formulare la seguente regola. Se il valore della media aritmetica nel campione è maggiore di uno, allora l'uso del coefficiente di variazione è legale, altrimenti si dovrebbero usare la dispersione e la deviazione standard per descrivere la diffusione dei dati sperimentali;

In conclusione di questa parte, prenderemo in considerazione la valutazione delle variazioni nei valori delle caratteristiche di valutazione. Come già notato, i valori delle caratteristiche di distribuzione calcolati dai dati sperimentali non coincidono con i loro valori reali per la popolazione generale. Non è possibile stabilire con precisione quest'ultimo, poiché, di norma, è impossibile censire l'intera popolazione. Se utilizziamo i risultati di campioni diversi della stessa popolazione per stimare i parametri di distribuzione, risulta che queste stime per campioni diversi differiscono l'una dall'altra. I valori stimati oscillano attorno ai loro valori reali.

Le deviazioni delle stime dei parametri generali dai valori reali di questi parametri sono chiamate errori statistici. La ragione della loro comparsa è la dimensione limitata del campione: non tutti gli oggetti della popolazione generale sono inclusi in esso. Per stimare l’entità degli errori statistici, viene utilizzata la deviazione standard delle caratteristiche del campione.

Ad esempio, consideriamo la caratteristica più importante della posizione: la media aritmetica. Si può dimostrare che la deviazione standard della media aritmetica è determinata dalla relazione:

Dove σ - deviazione standard per la popolazione.

Poiché il vero valore della deviazione standard non è noto, viene chiamata una quantità errore standard della media aritmetica e uguale:

Il valore caratterizza l'errore che, in media, si ammette sostituendo la media generale con la sua stima campionaria. Secondo la formula, l’aumento della dimensione del campione durante uno studio porta ad una diminuzione dell’errore standard in proporzione alla radice quadrata della dimensione del campione.

Per l'esempio in esame, l'errore standard della media aritmetica è pari a . Nel nostro caso è risultata essere 5,4 volte inferiore alla deviazione standard.

    SUPERFICIE EFFETTIVA DI DIFFUSIONE (AREA)- caratteristica della riflettività del bersaglio, espressa dal rapporto tra potenza elettrica. mag. energia riflessa dal bersaglio nella direzione del ricevitore verso la densità del flusso di energia superficiale incidente sul bersaglio. Dipende da… … Enciclopedia delle forze missilistiche strategiche

    Meccanica quantistica...Wikipedia

    - (EPR) caratteristica della riflettività di un bersaglio irradiato da onde elettromagnetiche. Il valore EPR è definito come il rapporto tra il flusso (potenza) di energia elettromagnetica riflessa dal bersaglio in direzione dell'apparecchiatura radioelettronica (RES) e... ... Dizionario Marino

    banda di dispersione- Caratteristiche statistiche dei dati sperimentali, che riflettono la loro deviazione dal valore medio. Argomenti: metallurgia in generale EN banda disperata... Guida del traduttore tecnico

    - (funzione di trasferimento della modulazione), funzione, con l'aiuto del taglio vengono valutate le proprietà di "nitidezza" delle lenti ottiche per l'immagine. sistemi e dipartimento elementi di tali sistemi. Ch.k.x. è la cosiddetta trasformata di Fourier. funzione di diffusione della linea che descrive la natura della "diffusione"... ... Enciclopedia fisica

    Funzione di trasferimento della modulazione, una funzione che valuta le proprietà di "nitidezza" dei sistemi ottici di imaging e dei singoli elementi di tali sistemi (vedere, ad esempio, Nitidezza di un'immagine fotografica). Ch.k.x. c'è Fourier... ...

    banda di dispersione- caratteristica statistica dei dati sperimentali, che riflette la loro deviazione dal valore medio. Vedi anche: Listello di scorrimento Listello di scarico Listello di temprabilità... Dizionario Enciclopedico di Metallurgia

    BANDA DI DISPERSIONE- caratteristica statistica dei dati sperimentali, che riflette la loro deviazione dal valore medio... Dizionario metallurgico

    Caratteristiche della dispersione di valori di variabili casuali. M. t. h è correlato alla deviazione quadrata (Vedi Deviazione quadrata) σ dalla formula Questo metodo di misurazione della dispersione è spiegato dal fatto che nel caso di normale ... ... Grande Enciclopedia Sovietica

    STATISTICHE DI VARIAZIONE- STATISTICA DELLE VARIAZIONI, termine che riunisce un gruppo di tecniche di analisi statistica utilizzate principalmente nelle scienze naturali. Nella seconda metà del XIX secolo. Quetelet, “Anthro pometrie ou mesure des differentis facultes de 1... ... Grande Enciclopedia Medica

    Valore atteso- (Media della popolazione) L'aspettativa matematica è la distribuzione di probabilità di una variabile casuale. Aspettativa matematica, definizione, aspettativa matematica di variabili casuali discrete e continue, campione, aspettativa condizionata, calcolo,... ... Enciclopedia degli investitori

Uno dei motivi per condurre analisi statistiche è la necessità di tenere conto dell'influenza di fattori casuali (disturbi) sull'indicatore in studio, che portano alla dispersione (scattering) dei dati. Risolvere problemi in cui sono presenti dati sparsi è associato al rischio, poiché anche se si utilizzano tutte le informazioni disponibili, non è possibile esattamente prevedere cosa accadrà in futuro. Per affrontare adeguatamente tali situazioni è opportuno comprendere la natura del rischio ed essere in grado di determinare il grado di dispersione di un set di dati. Ci sono tre caratteristiche numeriche che descrivono la misura della dispersione: deviazione standard, intervallo e coefficiente di variazione (variabilità). A differenza degli indicatori tipici (media, mediana, moda) che caratterizzano il centro, si mostrano caratteristiche di dispersione come chiudere I singoli valori del set di dati si trovano verso questo centro
Definizione di deviazione standard Deviazione standard(deviazione standard) è una misura delle deviazioni casuali dei valori dei dati dalla media. Nella vita reale, la maggior parte dei dati è caratterizzata da scattering, cioè i valori individuali si trovano ad una certa distanza dalla media.
È impossibile utilizzare la deviazione standard come caratteristica generale della dispersione semplicemente calcolando la media delle deviazioni dei dati, perché parte delle deviazioni sarà positiva e l'altra parte sarà negativa e, di conseguenza, il risultato della media potrebbe essere uguale a zero. Per eliminare il segno negativo, usa la tecnica standard: prima calcola dispersione come la somma delle deviazioni quadrate divisa per ( N–1), quindi dal valore risultante viene ricavata la radice quadrata. La formula per il calcolo della deviazione standard è la seguente: Nota 1: La varianza non fornisce alcuna informazione aggiuntiva rispetto alla deviazione standard, ma è più difficile da interpretare perché è espressa in “unità quadrate”, mentre la deviazione standard è espressa in unità a noi familiari (ad esempio dollari). Nota 2: la formula sopra serve per calcolare la deviazione standard di un campione ed è chiamata più accuratamente deviazione standard del campione. Quando si calcola la deviazione standard popolazione(indicato dal simbolo s) dividere per N. Il valore della deviazione standard del campione è leggermente più grande (poiché è diviso per N–1), che fornisce una correzione per la casualità del campione stesso. Quando il set di dati è distribuito normalmente, la deviazione standard assume un significato speciale. Nella figura seguente, i segni sono tracciati su entrambi i lati della media a distanze rispettivamente di una, due e tre deviazioni standard. La figura mostra che circa il 66,7% (due terzi) di tutti i valori rientra in una deviazione standard su entrambi i lati della media, il 95% dei valori rientra in due deviazioni standard della media e quasi tutti i dati (99,7%) sarà entro tre deviazioni standard dalla media.
66,7%


Questa proprietà della deviazione standard per i dati distribuiti normalmente è chiamata “regola dei due terzi”.

In alcune situazioni, come l'analisi del controllo qualità del prodotto, i limiti vengono spesso fissati in modo tale che quelle osservazioni (0,3%) che sono più di tre deviazioni standard dalla media sono considerate un problema degno di nota.

Sfortunatamente, se i dati non seguono una distribuzione normale, la regola sopra descritta non può essere applicata.

Attualmente esiste un vincolo chiamato regola di Chebyshev che può essere applicato alle distribuzioni asimmetriche (asimmetriche).

Genera dati iniziali Set di SV

La tabella 1 mostra la dinamica delle variazioni degli utili giornalieri di borsa, registrati nei giorni lavorativi per il periodo dal 31 luglio al 9 ottobre 1987.

Tabella 1. Dinamica delle variazioni dell'utile giornaliero in borsa

data Profitto giornaliero data Profitto giornaliero data Profitto giornaliero
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Avvia Excel
Crea file Fare clic sul pulsante Salva sulla barra degli strumenti Standard. Apri la cartella Statistiche nella finestra di dialogo che appare e assegna al file il nome Scattering Characteristics.xls.
Imposta l'etichetta 6. Nel Foglio1, nella cella A1, imposta l'etichetta Profitto giornaliero, 7. e nell'intervallo A2:A49, inserisci i dati della Tabella 1.
Imposta la funzione VALORE MEDIO 8. Nella cella D1, inserisci l'etichetta Media. Nella cella D2, calcola la media utilizzando la funzione statistica MEDIA.
Imposta la funzione STANDARDEV Nella cella D4, inserisci l'etichetta Deviazione standard. Nella cella D5, calcolare la deviazione standard utilizzando la funzione statistica DEV.ST
Ridurre la dimensione in bit del risultato alla quarta cifra decimale.
Interpretazione dei risultati Declino Il profitto medio giornaliero è stato dello 0,04% (il profitto medio giornaliero è stato -0,0004). Ciò significa che il profitto medio giornaliero per il periodo in esame è stato pari a circa zero, vale a dire il mercato ha mantenuto un tasso medio. La deviazione standard è risultata essere 0,0118. Ciò significa che un dollaro ($ 1) investito nel mercato azionario è cambiato in media di $ 0,0118 al giorno, vale a dire il suo investimento potrebbe comportare un guadagno o una perdita di $ 0,0118.
Controlliamo se i valori di profitto giornaliero indicati nella Tabella 1 corrispondono alle regole della distribuzione normale 1. Calcola l'intervallo corrispondente a una deviazione standard su entrambi i lati della media. 2. Nelle celle D7, D8 e F8, impostare rispettivamente le etichette: Una deviazione standard, Limite inferiore, Limite superiore. 3. Nella cella D9, inserisci la formula = -0,0004 – 0,0118 e nella cella F9, inserisci la formula = -0,0004 + 0,0118. 4. Ottieni il risultato accurato alla quarta cifra decimale.

5. Determinare il numero di valori di profitto giornalieri che rientrano in una deviazione standard. Innanzitutto, filtra i dati, lasciando i valori del profitto giornaliero nell'intervallo [-0,0121, 0,0114]. Per fare ciò, seleziona una cella qualsiasi nella colonna A con i valori del profitto giornaliero ed esegui il comando:

Dati®Filtro®Filtro automatico

Apri il menu facendo clic sulla freccia nell'intestazione Profitto giornaliero e selezionare (Condizione...). Nella finestra di dialogo Filtro automatico personalizzato, impostare le opzioni come mostrato di seguito. Fare clic su OK.

Per contare il numero di dati filtrati, seleziona l'intervallo di valori di profitto giornaliero, fai clic con il pulsante destro del mouse su uno spazio vuoto nella barra di stato e seleziona Numero di valori dal menu contestuale. Leggi il risultato. Ora visualizza tutti i dati originali eseguendo il comando: Data®Filter®Visualizza tutto e disattiva il filtro automatico utilizzando il comando: Data®Filter®AutoFilter.

6. Calcola la percentuale dei valori di profitto giornalieri che sono una deviazione standard dalla media. Per fare ciò, inserisci l'etichetta nella cella H8 Per cento e nella cella H9 programma la formula per calcolare la percentuale e ottieni il risultato accurato fino a una cifra decimale.

7. Calcola l'intervallo dei valori del profitto giornaliero entro due deviazioni standard dalla media. Nelle celle D11, D12 e F12, imposta le etichette di conseguenza: Due deviazioni standard, Linea di fondo, Limite superiore. Inserisci le formule di calcolo nelle celle D13 e F13 e ottieni il risultato accurato fino alla quarta cifra decimale.

8. Determinare il numero di valori di profitto giornalieri che si trovano entro due deviazioni standard filtrando prima i dati.

9. Calcola la percentuale dei valori di profitto giornalieri che sono a due deviazioni standard dalla media. Per fare ciò, inserisci l'etichetta nella cella H12 Per cento e nella cella H13 programma la formula di calcolo della percentuale e ottieni il risultato accurato fino a una cifra decimale.

10. Calcola l'intervallo dei valori del profitto giornaliero entro tre deviazioni standard dalla media. Nelle celle D15, D16 e F16, imposta le etichette di conseguenza: Tre deviazioni standard, Linea di fondo, Limite superiore. Inserisci le formule di calcolo nelle celle D17 e F17 e ottieni il risultato accurato fino alla quarta cifra decimale.

11. Determinare il numero di valori di profitto giornalieri compresi entro tre deviazioni standard filtrando prima i dati. Calcola la percentuale dei valori di profitto giornalieri. Per fare ciò, inserisci l'etichetta nella cella H16 Per cento e nella cella H17 programma la formula per calcolare la percentuale e ottieni il risultato accurato fino a una cifra decimale.

13. Costruisci un istogramma dei rendimenti giornalieri delle azioni in borsa e posizionalo insieme alla tabella di distribuzione della frequenza nell'area J1:S20. Mostra sull'istogramma la media approssimativa e gli intervalli corrispondenti rispettivamente a una, due e tre deviazioni standard dalla media.

Caratteristiche di dispersione

Misure di dispersione del campionamento.

Il minimo e il massimo del campione sono, rispettivamente, il valore più piccolo e quello più grande della variabile studiata. Si chiama la differenza tra il massimo e il minimo scopo campioni. Tutti i dati del campione si trovano tra il minimo e il massimo. Questi indicatori sembrano delineare i confini del campione.

R№1= 15,6-10=5,6

R№2 =0,85-0,6=0,25

Varianza di campionamento(Inglese) varianza) E deviazione standard campioni (inglese) deviazione standard) sono una misura della variabilità di una variabile e caratterizzano il grado di dispersione dei dati attorno al centro. In questo caso, la deviazione standard è un indicatore più conveniente perché ha la stessa dimensione dei dati reali oggetto di studio. Pertanto, l'indicatore di deviazione standard viene utilizzato insieme alla media aritmetica del campione per descrivere brevemente i risultati dell'analisi dei dati.

È più opportuno calcolare la varianza campionaria utilizzando la formula:

La deviazione standard si calcola utilizzando la formula:

Il coefficiente di variazione è una misura relativa della dispersione di un tratto.

Il coefficiente di variazione viene utilizzato anche come indicatore dell'omogeneità delle osservazioni del campione. Si ritiene che se il coefficiente di variazione non supera il 10%, il campione può essere considerato omogeneo, cioè ottenuto da un'unica popolazione generale.

Poiché il coefficiente di variazione è presente in entrambi i campioni, essi sono omogenei.

Il campione può essere presentato analiticamente sotto forma di funzione di distribuzione, nonché sotto forma di tabella di frequenza composta da due linee. Nella riga superiore sono presenti gli elementi di selezione (opzioni), disposti in ordine crescente; Le frequenze dell'opzione sono scritte nella riga inferiore.

La frequenza della variante è un numero uguale al numero di ripetizioni di una determinata variante nel campione.

Esempio n. 1 “Madri”

Tipo di curva di distribuzione

Asimmetria o coefficiente di asimmetria (un termine coniato per la prima volta da Pearson, 1895) è una misura dell'asimmetria di una distribuzione. Se l'asimmetria è chiaramente diversa da 0, la distribuzione è asimmetrica, la densità della distribuzione normale è simmetrica rispetto alla media.

Indice asimmetria(Inglese) asimmetria) viene utilizzato per caratterizzare il grado di simmetria della distribuzione dei dati attorno al centro. L'asimmetria può assumere valori sia negativi che positivi. Un valore positivo per questo parametro indica che i dati vengono spostati a sinistra rispetto al centro, mentre un valore negativo indica che i dati vengono spostati a destra. Pertanto, il segno dell’indice di asimmetria indica la direzione della distorsione dei dati, mentre l’entità indica il grado di questa distorsione. Un'asimmetria pari a zero indica che i dati sono concentrati simmetricamente attorno al centro.

Perché l'asimmetria è positiva, quindi la parte superiore della curva si sposta a sinistra del centro.

Coefficiente di curtosi(Inglese) curtosi) è una caratteristica di quanto strettamente la maggior parte dei dati è raggruppata attorno al centro.

Con una curtosi positiva la curva si acuisce, con una curtosi negativa si attenua.

La curva è appiattita;

La curva si accentua.