Streueigenschaften. Eigenschaften der Streuung Dispersion und ihre Eigenschaften Tschebyscheff-Ungleichung Eigenschaften von Ort und Streuung

Egal wie wichtig die Durchschnittseigenschaften sind, ein ebenso wichtiges Merkmal eines Arrays numerischer Daten ist das Verhalten der übrigen Mitglieder des Arrays im Verhältnis zum Durchschnitt, wie stark sie vom Durchschnitt abweichen und wie viele Mitglieder des Arrays sich unterscheiden deutlich vom Durchschnitt ab. Während des Schießtrainings sprechen sie über die Genauigkeit der Ergebnisse; in der Statistik untersuchen sie die Eigenschaften der Streuung (Streuung).

Die Differenz zwischen einem beliebigen Wert von x und dem Durchschnittswert von x wird aufgerufen Abweichung und als Differenz x, - x berechnet. In diesem Fall kann die Abweichung sowohl positive Werte annehmen, wenn die Zahl größer als der Durchschnitt ist, als auch negative Werte, wenn die Zahl kleiner als der Durchschnitt ist. In der Statistik ist es jedoch oft wichtig, mit einer Zahl arbeiten zu können, die die „Genauigkeit“ aller numerischen Elemente eines Datenfeldes charakterisiert. Jede Summierung aller Abweichungen der Array-Mitglieder führt zu Null, da sich positive und negative Abweichungen gegenseitig aufheben. Um eine Nullung zu vermeiden, werden zur Charakterisierung der Streuung die quadrierten Differenzen, genauer gesagt das arithmetische Mittel der quadrierten Abweichungen, herangezogen. Diese Streucharakteristik wird aufgerufen Stichprobenvarianz.

Je größer die Varianz, desto größer die Streuung der Zufallsvariablenwerte. Um die Streuung zu berechnen, wird ein Näherungswert des Stichprobenmittelwerts x mit einem Abstand von einer Ziffer in Bezug auf alle Mitglieder des Datenarrays verwendet. Andernfalls summiert sich beim Summieren einer großen Anzahl von Näherungswerten ein erheblicher Fehler. Im Zusammenhang mit der Dimensionalität numerischer Werte ist ein Nachteil eines solchen Streuungsindikators wie der Probenstreuung zu beachten: die Maßeinheit der Streuung D ist das Quadrat der Maßeinheit der Werte X, deren Charakteristik die Streuung ist. Um diesen Nachteil zu beseitigen, hat die Statistik eine solche Streucharakteristik eingeführt wie Stichprobenstandardabweichung , was durch das Symbol gekennzeichnet ist A (lesen Sie „Sigma“) und wird anhand der Formel berechnet

Normalerweise weichen mehr als die Hälfte der Mitglieder des Datenarrays um weniger als die Standardabweichung vom Durchschnitt ab, d. h. gehören zum Segment [X - A; x + a]. Ansonsten heißt es: Der Durchschnitt unter Berücksichtigung der Datenstreuung ist gleich x ± a.

Die Einführung einer weiteren Streucharakteristik ist mit der Dimension der Datenarray-Mitglieder verbunden. Alle numerischen Merkmale in der Statistik werden eingeführt, um die Ergebnisse der Untersuchung verschiedener numerischer Arrays zu vergleichen, die verschiedene Zufallsvariablen charakterisieren. Der Vergleich von Standardabweichungen verschiedener Durchschnittswerte verschiedener Datensätze ist jedoch nicht aussagekräftig, insbesondere wenn auch die Dimensionen dieser Größen unterschiedlich sind. Beispielsweise wenn Länge und Gewicht beliebiger Gegenstände oder Streuungen bei der Herstellung von Mikro- und Makroprodukten verglichen werden. Im Zusammenhang mit den obigen Überlegungen wird eine relative Streucharakteristik eingeführt, die aufgerufen wird Variationskoeffizient und wird nach der Formel berechnet

Um die numerischen Eigenschaften der Streuung zufälliger Variablenwerte zu berechnen, ist es zweckmäßig, eine Tabelle zu verwenden (Tabelle 6.9).

Tabelle 6.9

Berechnung numerischer Eigenschaften der Streuung zufälliger Variablenwerte

Xj- X

(Xj-X)2/

Der Stichprobenmittelwert wird derzeit in dieser Tabelle ausgefüllt. X, die künftig in zwei Formen zum Einsatz kommen wird. Als abschließendes Durchschnittsmerkmal (z. B. in der dritten Spalte der Tabelle) Stichprobendurchschnitt X muss auf die Ziffer gerundet werden, die der kleinsten Ziffer eines beliebigen Mitglieds des numerischen Datenarrays entspricht x g Dieser Indikator wird jedoch in der Tabelle für weitere Berechnungen verwendet, und zwar in dieser Situation, nämlich bei der Berechnung des Stichprobendurchschnitts in der vierten Spalte der Tabelle X muss mit einem Abstand von einer Ziffer relativ zur kleinsten Ziffer eines beliebigen Mitglieds des numerischen Datenarrays gerundet werden X ( .

Das Ergebnis von Berechnungen unter Verwendung einer Tabelle wie einer Tabelle. 6.9 ermittelt den Wert der Probenstreuung, und um die Antwort aufzuzeichnen, ist es notwendig, basierend auf dem Wert der Probenstreuung den Wert der Standardabweichung a zu berechnen.

Die Antwort gibt an: a) das durchschnittliche Ergebnis unter Berücksichtigung der Datenverteilung im Formular x±o; b) Datenstabilitätsmerkmal V. Die Antwort sollte die Qualität des Variationskoeffizienten bewerten: gut oder schlecht.

Der akzeptable Variationskoeffizient als Indikator für die Homogenität oder Stabilität der Ergebnisse in der Sportforschung wird mit 10-15 % angenommen. Der Variationskoeffizient V= 20 % gelten in jeder Forschung als sehr große Zahl. Wenn die Stichprobengröße P> 25 also V> 32 % sind ein sehr schlechter Indikator.

Zum Beispiel für eine diskrete Variationsreihe 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 Tische 6.9 wird wie folgt ausgefüllt (Tabelle 6.10).

Tabelle 6.10

Ein Beispiel für die Berechnung der numerischen Eigenschaften der Wertestreuung

*1

fi

1

L P 25 = 2,92 = 2,9

D_S_47.6_ P 25

Antwort: a) Das durchschnittliche Merkmal ist unter Berücksichtigung der Datenverteilung gleich X± a = = 3 ± 1,4; b) Die Stabilität der erhaltenen Messungen ist aufgrund des Variationskoeffizienten auf einem niedrigen Niveau V = 48% > 32%.

Analog zur Tabelle 6.9 kann auch zur Berechnung der Streueigenschaften einer Intervallvariationsreihe verwendet werden. Gleichzeitig sind die Optionen x g werden durch Vertreter der Lücken ersetzt x v Ja absolute Frequenzoption F(- zu absoluten Häufigkeiten von Intervallen fv

Basierend auf dem oben Gesagten kann Folgendes getan werden: Schlussfolgerungen.

Die Schlussfolgerungen der mathematischen Statistik sind plausibel, wenn Informationen über Massenphänomene verarbeitet werden.

Typischerweise wird eine Stichprobe aus der allgemeinen Objektpopulation untersucht, die repräsentativ sein muss.

Experimentelle Daten, die als Ergebnis der Untersuchung einer beliebigen Eigenschaft von Beispielobjekten gewonnen werden, stellen den Wert einer Zufallsvariablen dar, da der Forscher nicht im Voraus vorhersagen kann, welche Zahl einem bestimmten Objekt entspricht.

Um den einen oder anderen Algorithmus zur Beschreibung und Erstverarbeitung experimenteller Daten auszuwählen, ist es wichtig, die Art der Zufallsvariablen bestimmen zu können: diskret, kontinuierlich oder gemischt.

Diskrete Zufallsvariablen werden durch eine diskrete Variationsreihe und ihre grafische Form – ein Häufigkeitspolygon – beschrieben.

Gemischte und kontinuierliche Zufallsvariablen werden durch eine Intervallvariationsreihe und ihre grafische Form – ein Histogramm – beschrieben.

Beim Vergleich mehrerer Stichproben nach dem generierten Niveau einer bestimmten Eigenschaft werden die durchschnittlichen numerischen Merkmale und die numerischen Merkmale der Streuung einer Zufallsvariablen im Verhältnis zum Durchschnitt verwendet.

Bei der Berechnung der Durchschnittskennlinie ist es wichtig, die Art der Durchschnittskennlinie richtig auszuwählen, die ihrem Anwendungsbereich angemessen ist. Strukturelle Durchschnittswerte, Modus und Median, charakterisieren die Struktur der Position der Variante in einer geordneten Reihe experimenteller Daten. Der quantitative Durchschnitt ermöglicht die Beurteilung der durchschnittlichen Größe der Option (Stichprobendurchschnitt).

Zur Berechnung der numerischen Streueigenschaften – Stichprobenvarianz, Standardabweichung und Variationskoeffizient – ​​ist die tabellarische Methode wirksam.

Positionsmerkmale beschreiben das Zentrum der Verteilung. Dabei lassen sich die Bedeutungen der Option sowohl in einem breiten als auch in einem schmalen Band um sie herum gruppieren. Um die Verteilung zu beschreiben, ist es daher notwendig, den Bereich der Änderungen der Werte des Merkmals zu charakterisieren. Streumerkmale werden verwendet, um die Variationsbreite eines Merkmals zu beschreiben. Am häufigsten werden Variationsbereich, Streuung, Standardabweichung und Variationskoeffizient verwendet.

Variationsbreite ist definiert als die Differenz zwischen dem Maximal- und Minimalwert eines Merkmals in der untersuchten Population:

R=X max - X Mindest.

Der offensichtliche Vorteil des betrachteten Indikators ist die Einfachheit der Berechnung. Da der Variationsbereich jedoch nur von den Werten der Extremwerte des Merkmals abhängt, ist der Anwendungsbereich auf einigermaßen homogene Verteilungen beschränkt. In anderen Fällen ist der Informationsgehalt dieses Indikators sehr gering, da es viele Verteilungen gibt, die in ihrer Form sehr unterschiedlich sind, aber die gleiche Reichweite haben. In praktischen Studien wird der Variationsbereich manchmal bei kleinen Stichprobengrößen (nicht mehr als 10) verwendet. Anhand der Variationsbreite lässt sich beispielsweise leicht abschätzen, wie unterschiedlich die besten und schlechtesten Ergebnisse in einer Gruppe von Sportlern sind.

In diesem Beispiel:

R=16,36 – 13,04=3,32 (m).

Das zweite Merkmal der Streuung ist Streuung. Die Streuung ist das durchschnittliche Quadrat der Abweichung einer Zufallsvariablen von ihrem Mittelwert. Streuung ist ein Merkmal der Streuung, der Streuung der Werte einer Größe um ihren Durchschnittswert. Das Wort „Dispersion“ selbst bedeutet „Streuung“.

Bei der Durchführung von Stichprobenstudien ist es notwendig, eine Schätzung der Varianz zu erstellen. Die aus Stichprobendaten berechnete Varianz wird Stichprobenvarianz genannt und mit bezeichnet S 2 .

Auf den ersten Blick ist die natürlichste Schätzung der Varianz die statistische Varianz, die auf der Grundlage der Definition mithilfe der Formel berechnet wird:

In dieser Formel - die Summe der quadrierten Abweichungen der Attributwerte x i aus dem arithmetischen Mittel . Um die mittlere quadratische Abweichung zu erhalten, wird diese Summe durch die Stichprobengröße dividiert P.

Allerdings ist eine solche Schätzung nicht unvoreingenommen. Es kann gezeigt werden, dass die Summe der quadrierten Abweichungen von Attributwerten für den arithmetischen Mittelwert einer Stichprobe kleiner ist als die Summe der quadrierten Abweichungen von jedem anderen Wert, einschließlich vom wahren Mittelwert (mathematischer Erwartungswert). Daher enthält das aus der obigen Formel erhaltene Ergebnis einen systematischen Fehler und der geschätzte Wert der Varianz wird unterschätzt. Um die Verzerrung zu beseitigen, reicht es aus, einen Korrekturfaktor einzuführen. Für die geschätzte Varianz ergibt sich folgender Zusammenhang:

Für große Werte N Natürlich weichen beide Schätzungen – voreingenommene und unvoreingenommene – kaum voneinander ab und die Einführung eines Korrekturfaktors wird bedeutungslos. In der Regel sollte die Formel zur Schätzung der Varianz wann verfeinert werden N<30.

Bei gruppierten Daten kann die letzte Formel zur Vereinfachung der Berechnungen auf folgende Form reduziert werden:

Wo k- Anzahl der Gruppierungsintervalle;

n ich- Intervallfrequenz mit Nummer ich;

x i- der Medianwert des Intervalls mit Zahl ich.

Als Beispiel berechnen wir die Varianz für die gruppierten Daten des Beispiels, das wir analysieren (siehe Tabelle 4):

S 2 =/ 28=0,5473 (m2).

Die Varianz einer Zufallsvariablen hat die Dimension des Quadrats der Dimension der Zufallsvariablen, was die Interpretation erschwert und nicht sehr klar macht. Für eine visuellere Beschreibung der Streuung ist es praktischer, ein Merkmal zu verwenden, dessen Dimension mit der Dimension des untersuchten Merkmals übereinstimmt. Zu diesem Zweck wird das Konzept vorgestellt Standardabweichung(oder Standardabweichung).

Standardabweichung heißt die positive Quadratwurzel der Varianz:

In unserem Beispiel ist die Standardabweichung gleich

Die Standardabweichung hat die gleichen Maßeinheiten wie die Ergebnisse der Messung des untersuchten Merkmals und charakterisiert somit den Grad der Abweichung des Merkmals vom arithmetischen Mittel. Mit anderen Worten, es zeigt, wie der Hauptteil der Option relativ zum arithmetischen Mittel liegt.

Standardabweichung und Varianz sind die am häufigsten verwendeten Variationsmaße. Dies liegt daran, dass sie in einem wesentlichen Teil der Theoreme der Wahrscheinlichkeitstheorie enthalten sind, die als Grundlage der mathematischen Statistik dienen. Darüber hinaus lässt sich die Varianz in ihre Bestandteile zerlegen, die es ermöglichen, den Einfluss verschiedener Faktoren auf die Variation des untersuchten Merkmals abzuschätzen.

Zusätzlich zu den absoluten Variationsindikatoren Streuung und Standardabweichung werden in der Statistik auch relative Indikatoren eingeführt. Am häufigsten wird der Variationskoeffizient verwendet. Der Variationskoeffizient gleich dem Verhältnis der Standardabweichung zum arithmetischen Mittel, ausgedrückt als Prozentsatz:

Aus der Definition geht klar hervor, dass der Variationskoeffizient in seiner Bedeutung ein relatives Maß für die Streuung eines Merkmals ist.

Für das betreffende Beispiel:

Der Variationskoeffizient wird häufig in der statistischen Forschung verwendet. Da es sich um einen relativen Wert handelt, können Sie die Variabilität beider Merkmale mit unterschiedlichen Maßeinheiten sowie das gleiche Merkmal in mehreren verschiedenen Populationen mit unterschiedlichen Werten des arithmetischen Mittels vergleichen.

Der Variationskoeffizient wird verwendet, um die Homogenität der erhaltenen experimentellen Daten zu charakterisieren. In der Ausübung von Körperkultur und Sport gilt die Streuung der Messergebnisse in Abhängigkeit vom Wert des Variationskoeffizienten als gering (V<10%), средним (11-20%) и большим (V> 20%).

Einschränkungen bei der Verwendung des Variationskoeffizienten hängen mit seiner relativen Natur zusammen – die Definition enthält eine Normalisierung auf das arithmetische Mittel. Dabei kann es bei kleinen Absolutwerten des arithmetischen Mittels dazu kommen, dass der Variationskoeffizient seinen Informationsgehalt verliert. Je näher das arithmetische Mittel bei Null liegt, desto weniger aussagekräftig ist dieser Indikator. Im Grenzfall geht das arithmetische Mittel gegen Null (z. B. Temperatur) und der Variationskoeffizient gegen Unendlich, unabhängig von der Streuung der Kennlinie. Analog zum Fehlerfall lässt sich folgende Regel formulieren. Wenn der Wert des arithmetischen Mittels in der Stichprobe größer als eins ist, ist die Verwendung des Variationskoeffizienten zulässig, andernfalls sollten Streuung und Standardabweichung zur Beschreibung der Streuung experimenteller Daten verwendet werden.

Zum Abschluss dieses Teils betrachten wir die Bewertung von Variationen in den Werten von Bewertungsmerkmalen. Wie bereits erwähnt, stimmen die aus experimentellen Daten berechneten Werte der Verteilungsmerkmale nicht mit ihren wahren Werten für die Allgemeinbevölkerung überein. Letzteres lässt sich nicht genau ermitteln, da eine Befragung der Gesamtbevölkerung in der Regel nicht möglich ist. Wenn wir die Ergebnisse verschiedener Stichproben aus derselben Grundgesamtheit verwenden, um Verteilungsparameter abzuschätzen, stellt sich heraus, dass diese Schätzungen für verschiedene Stichproben voneinander abweichen. Geschätzte Werte schwanken um ihre wahren Werte.

Abweichungen von Schätzungen allgemeiner Parameter von den wahren Werten dieser Parameter werden als statistische Fehler bezeichnet. Der Grund für ihr Auftreten ist die begrenzte Stichprobengröße – nicht alle Objekte der Allgemeinbevölkerung sind darin enthalten. Um das Ausmaß statistischer Fehler abzuschätzen, wird die Standardabweichung der Stichprobenmerkmale verwendet.

Betrachten Sie als Beispiel das wichtigste Merkmal der Position – das arithmetische Mittel. Es kann gezeigt werden, dass die Standardabweichung des arithmetischen Mittels durch die Beziehung bestimmt wird:

Wo σ - Standardabweichung für die Grundgesamtheit.

Da der wahre Wert der Standardabweichung nicht bekannt ist, wird eine Größe genannt Standardfehler des arithmetischen Mittels und gleich:

Der Wert charakterisiert den Fehler, der im Durchschnitt zulässig ist, wenn der allgemeine Durchschnitt durch seine Stichprobenschätzung ersetzt wird. Der Formel zufolge führt eine Vergrößerung der Stichprobengröße während einer Studie zu einer Verringerung des Standardfehlers proportional zur Quadratwurzel der Stichprobengröße.

Für das betrachtete Beispiel beträgt der Standardfehler des arithmetischen Mittels . In unserem Fall war sie 5,4-mal kleiner als die Standardabweichung.

    EFFEKTIVE STREUFLÄCHE (FLÄCHE)- Charakteristisch für das Reflexionsvermögen des Ziels, ausgedrückt durch das Verhältnis der elektrischen Leistung. mag. Die vom Ziel in Richtung des Empfängers reflektierte Energie entspricht der auf das Ziel einfallenden Oberflächenenergieflussdichte. Hängt von der… … Enzyklopädie der strategischen Raketentruppen

    Quantenmechanik ... Wikipedia

    - (EPR) Charakteristik des Reflexionsvermögens eines mit elektromagnetischen Wellen bestrahlten Ziels. Der EPR-Wert ist definiert als das Verhältnis des Flusses (der Leistung) elektromagnetischer Energie, die vom Ziel in Richtung der radioelektronischen Ausrüstung (RES) reflektiert wird, zu ... ... Meereswörterbuch

    Streuband- Statistische Merkmale experimenteller Daten, die ihre Abweichung vom Durchschnittswert widerspiegeln. Themen: Metallurgie im Allgemeinen EN Desperal Band ... Leitfaden für technische Übersetzer

    - (Modulationsübertragungsfunktion), Funktion, mit Hilfe des Schnitts werden die „Schärfe“-Eigenschaften der abbildenden optischen Linsen beurteilt. Systeme und Abt. Elemente solcher Systeme. Ch.k.x. ist die sogenannte Fourier-Transformation. Linienstreufunktion, die die Art der „Ausbreitung“ beschreibt... ... Physische Enzyklopädie

    Modulationsübertragungsfunktion, eine Funktion, die die „Schärfe“-Eigenschaften abbildender optischer Systeme und einzelner Elemente solcher Systeme bewertet (siehe beispielsweise Schärfe eines fotografischen Bildes). Ch.k.x. es gibt Fourier... ...

    Streuband- statistisches Merkmal experimenteller Daten, das ihre Abweichung vom Durchschnittswert widerspiegelt. Siehe auch: Gleitstreifen Entlastungsstreifen Härtbarkeitsstreifen... Enzyklopädisches Wörterbuch der Metallurgie

    Streuband- statistisches Merkmal experimenteller Daten, das ihre Abweichung vom Durchschnittswert widerspiegelt... Metallurgisches Wörterbuch

    Merkmale der Streuung zufälliger Variablenwerte. M. t. h hängt mit der quadratischen Abweichung (siehe Quadratabweichung) σ durch die Formel zusammen. Diese Methode zur Messung der Streuung wird durch die Tatsache erklärt, dass im Fall normaler ... ... Große sowjetische Enzyklopädie

    VARIATIONSSTATISTIK- VARIATIONSSTATISTIK, ein Begriff, der eine Gruppe statistischer Analysetechniken zusammenfasst, die hauptsächlich in den Naturwissenschaften verwendet werden. In der zweiten Hälfte des 19. Jahrhunderts. Quetelet, „Anthro pometrie ou mesure des differentes facultes de 1... ... Große medizinische Enzyklopädie

    Erwarteter Wert- (Bevölkerungsdurchschnitt) Mathematische Erwartung ist die Wahrscheinlichkeitsverteilung einer Zufallsvariablen. Mathematische Erwartung, Definition, mathematische Erwartung diskreter und kontinuierlicher Zufallsvariablen, Stichprobe, bedingte Erwartung, Berechnung,... ... Investoren-Enzyklopädie

Einer der Gründe für die Durchführung statistischer Analysen ist die Notwendigkeit, den Einfluss zufälliger Faktoren (Störungen) auf den untersuchten Indikator zu berücksichtigen, die zu einer Streuung (Streuung) der Daten führen. Die Lösung von Problemen mit verstreuten Daten ist mit Risiken verbunden, denn selbst wenn Sie alle verfügbaren Informationen nutzen, ist dies nicht möglich genau vorhersagen, was in der Zukunft passieren wird. Um mit solchen Situationen angemessen umgehen zu können, ist es ratsam, die Art des Risikos zu verstehen und den Grad der Streuung eines Datensatzes bestimmen zu können. Es gibt drei numerische Merkmale, die das Maß der Streuung beschreiben: Standardabweichung, Bereich und Variationskoeffizient (Variabilität). Im Gegensatz zu typischen Indikatoren (Mittelwert, Median, Modus), die das Zentrum charakterisieren, zeigen sich Streueigenschaften wie knapp In Richtung dieser Mitte liegen die einzelnen Werte des Datensatzes
Definition der Standardabweichung Standardabweichung(Standardabweichung) ist ein Maß für die zufälligen Abweichungen von Datenwerten vom Mittelwert. Im wirklichen Leben sind die meisten Daten durch Streuung gekennzeichnet, d. h. Einzelwerte liegen in einiger Entfernung vom Durchschnitt.
Es ist unmöglich, die Standardabweichung als allgemeines Merkmal der Streuung zu verwenden, indem einfach Datenabweichungen gemittelt werden, da ein Teil der Abweichungen positiv und der andere Teil negativ sein wird und das Ergebnis der Mittelung daher gleich sein kann null. Um das negative Vorzeichen zu entfernen, verwenden Sie die Standardtechnik: Berechnen Sie zuerst Streuung als Summe der quadratischen Abweichungen dividiert durch ( N–1) und dann wird die Quadratwurzel aus dem resultierenden Wert gezogen. Die Formel zur Berechnung der Standardabweichung lautet wie folgt: Hinweis 1: Die Varianz vermittelt im Vergleich zur Standardabweichung keine zusätzlichen Informationen, ist jedoch schwieriger zu interpretieren, da sie in „Einheiten zum Quadrat“ ausgedrückt wird, während die Standardabweichung ausgedrückt wird in uns bekannten Einheiten (zum Beispiel Dollar). Hinweis 2: Die obige Formel dient zur Berechnung der Standardabweichung einer Stichprobe und wird genauer aufgerufen Stichprobenstandardabweichung. Bei der Berechnung der Standardabweichung Bevölkerung(gekennzeichnet durch das Symbol s) dividieren durch N. Der Wert der Stichprobenstandardabweichung ist etwas größer (da er durch geteilt wird). N–1), was eine Korrektur für die Zufälligkeit der Stichprobe selbst liefert. Wenn der Datensatz normalverteilt ist, kommt der Standardabweichung eine besondere Bedeutung zu. In der folgenden Abbildung sind auf beiden Seiten des Mittelwerts Markierungen im Abstand von einer, zwei bzw. drei Standardabweichungen angebracht. Die Abbildung zeigt, dass etwa 66,7 % (zwei Drittel) aller Werte innerhalb einer Standardabweichung auf beiden Seiten des Mittelwerts liegen, 95 % der Werte innerhalb von zwei Standardabweichungen vom Mittelwert liegen und fast alle Daten (99,7 %) wird innerhalb von drei Standardabweichungen vom Mittelwert liegen.
66,7%


Diese Eigenschaft der Standardabweichung für normalverteilte Daten wird als „Zweidrittelregel“ bezeichnet.

In manchen Situationen, beispielsweise bei der Analyse der Produktqualitätskontrolle, werden Grenzwerte oft so festgelegt, dass diejenigen Beobachtungen (0,3 %), die mehr als drei Standardabweichungen vom Mittelwert betragen, als sinnvolles Problem angesehen werden.

Wenn die Daten keiner Normalverteilung folgen, kann die oben beschriebene Regel leider nicht angewendet werden.

Derzeit gibt es eine Einschränkung namens Tschebyscheff-Regel, die auf asymmetrische (schiefe) Verteilungen angewendet werden kann.

Generieren Sie den anfänglichen Datensatz von SV

Tabelle 1 zeigt die Dynamik der Veränderungen der täglichen Gewinne an der Börse, aufgezeichnet an Werktagen für den Zeitraum vom 31. Juli bis 9. Oktober 1987.

Tabelle 1. Dynamik der Veränderungen des täglichen Gewinns an der Börse

Datum Täglicher Gewinn Datum Täglicher Gewinn Datum Täglicher Gewinn
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Starten Sie Excel
Erstelle Datei Klicken Sie in der Standardsymbolleiste auf die Schaltfläche „Speichern“. Öffnen Sie im angezeigten Dialogfeld den Ordner „Statistik“ und benennen Sie die Datei „Scattering Characteristics.xls“.
Bezeichnung setzen 6. Legen Sie in Tabelle 1 in Zelle A1 die Bezeichnung „Tagesgewinn“ fest. 7. Geben Sie im Bereich A2:A49 die Daten aus Tabelle 1 ein.
Stellen Sie die Funktion MITTELWERT ein 8. Geben Sie in Zelle D1 die Bezeichnung Durchschnitt ein. Berechnen Sie in Zelle D2 den Durchschnitt mithilfe der Statistikfunktion AVERAGE.
Stellen Sie die STANDARDEV-Funktion ein Geben Sie in Zelle D4 die Bezeichnung Standardabweichung ein. Berechnen Sie in Zelle D5 die Standardabweichung mithilfe der statistischen Funktion STDEV
Reduzieren Sie die Bitgröße des Ergebnisses auf die vierte Dezimalstelle.
Interpretation der Ergebnisse Abfall Der durchschnittliche Tagesgewinn betrug 0,04 % (der durchschnittliche Tagesgewinn betrug -0,0004). Dies bedeutet, dass der durchschnittliche Tagesgewinn für den betrachteten Zeitraum ungefähr Null betrug, d. h. Der Markt behielt einen Durchschnittskurs bei. Die Standardabweichung betrug 0,0118. Das bedeutet, dass sich ein an der Börse investierter Dollar (1 US-Dollar) durchschnittlich um 0,0118 US-Dollar pro Tag veränderte, d. h. seine Investition könnte zu einem Gewinn oder Verlust von 0,0118 $ führen.
Prüfen wir, ob die in Tabelle 1 angegebenen Tagesgewinnwerte den Regeln der Normalverteilung entsprechen 1. Berechnen Sie das Intervall, das einer Standardabweichung auf beiden Seiten des Mittelwerts entspricht. 2. Legen Sie in den Zellen D7, D8 und F8 die jeweiligen Beschriftungen fest: Eine Standardabweichung, Untergrenze, Obergrenze. 3. Geben Sie in Zelle D9 die Formel = -0,0004 – 0,0118 und in Zelle F9 die Formel = -0,0004 + 0,0118 ein. 4. Ermitteln Sie das Ergebnis auf die vierte Dezimalstelle genau.

5. Bestimmen Sie die Anzahl der täglichen Gewinnwerte, die innerhalb einer Standardabweichung liegen. Filtern Sie zunächst die Daten und lassen Sie die täglichen Gewinnwerte im Bereich [-0,0121, 0,0114]. Wählen Sie dazu eine beliebige Zelle in Spalte A mit täglichen Gewinnwerten aus und führen Sie den Befehl aus:

Daten®Filter®AutoFilter

Öffnen Sie das Menü, indem Sie auf den Pfeil in der Kopfzeile klicken Täglicher Gewinn und wählen Sie (Bedingung...). Legen Sie im Dialogfeld „Benutzerdefinierter AutoFilter“ die Optionen wie unten gezeigt fest. OK klicken.

Um die Anzahl der gefilterten Daten zu zählen, wählen Sie den Bereich der täglichen Gewinnwerte aus, klicken Sie mit der rechten Maustaste auf eine leere Stelle in der Statusleiste und wählen Sie im Kontextmenü die Option „Anzahl der Werte“. Lesen Sie das Ergebnis. Zeigen Sie nun alle Originaldaten an, indem Sie den Befehl ausführen: Data®Filter®Display All und deaktivieren Sie den Autofilter mit dem Befehl: Data®Filter®AutoFilter.

6. Berechnen Sie den Prozentsatz der täglichen Gewinnwerte, die eine Standardabweichung vom Mittelwert entfernt sind. Tragen Sie dazu die Beschriftung in Zelle H8 ein Prozent, und programmieren Sie in Zelle H9 die Formel zur Berechnung des Prozentsatzes und erhalten Sie das Ergebnis mit einer Genauigkeit von einer Dezimalstelle.

7. Berechnen Sie den Bereich der täglichen Gewinnwerte innerhalb von zwei Standardabweichungen vom Mittelwert. Legen Sie in den Zellen D11, D12 und F12 die Beschriftungen entsprechend fest: Zwei Standardabweichungen, Endeffekt, Höchstgrenze. Geben Sie die Berechnungsformeln in die Zellen D13 und F13 ein und erhalten Sie das Ergebnis auf die vierte Dezimalstelle genau.

8. Bestimmen Sie die Anzahl der täglichen Gewinnwerte, die innerhalb von zwei Standardabweichungen liegen, indem Sie zunächst die Daten filtern.

9. Berechnen Sie den Prozentsatz der täglichen Gewinnwerte, die zwei Standardabweichungen vom Mittelwert entfernt sind. Tragen Sie dazu die Beschriftung in Zelle H12 ein Prozent, und programmieren Sie in Zelle H13 die Prozentberechnungsformel und erhalten Sie das Ergebnis mit einer Genauigkeit von einer Dezimalstelle.

10. Berechnen Sie den Bereich der täglichen Gewinnwerte innerhalb von drei Standardabweichungen vom Mittelwert. Legen Sie in den Zellen D15, D16 und F16 die Beschriftungen entsprechend fest: Drei Standardabweichungen, Endeffekt, Höchstgrenze. Geben Sie die Berechnungsformeln in die Zellen D17 und F17 ein und erhalten Sie das Ergebnis auf die vierte Dezimalstelle genau.

11. Bestimmen Sie die Anzahl der täglichen Gewinnwerte, die innerhalb von drei Standardabweichungen liegen, indem Sie zunächst die Daten filtern. Berechnen Sie den Prozentsatz der täglichen Gewinnwerte. Tragen Sie dazu die Beschriftung in Zelle H16 ein Prozent, und programmieren Sie in Zelle H17 die Formel zur Berechnung des Prozentsatzes und erhalten Sie das Ergebnis mit einer Genauigkeit von einer Dezimalstelle.

13. Erstellen Sie ein Histogramm der täglichen Aktienrenditen an der Börse und platzieren Sie es zusammen mit der Häufigkeitsverteilungstabelle im Bereich J1:S20. Zeigen Sie im Histogramm den ungefähren Mittelwert und die Intervalle an, die jeweils einer, zwei bzw. drei Standardabweichungen vom Mittelwert entsprechen.

Streueigenschaften

Maße der Probenstreuung.

Das Minimum und das Maximum der Stichprobe sind jeweils der kleinste und größte Wert der untersuchten Variablen. Man nennt die Differenz zwischen Maximum und Minimum Umfang Proben. Alle Beispieldaten liegen zwischen Minimum und Maximum. Diese Indikatoren scheinen die Grenzen der Stichprobe abzugrenzen.

R№1= 15,6-10=5,6

R №2 =0,85-0,6=0,25

Stichprobenvarianz(Englisch) Varianz) Und Standardabweichung Proben (Englisch) Standardabweichung) sind ein Maß für die Variabilität einer Variablen und charakterisieren den Grad der Streuung von Daten um das Zentrum. In diesem Fall ist die Standardabweichung ein bequemerer Indikator, da sie dieselbe Dimension wie die tatsächlich untersuchten Daten hat. Daher wird der Standardabweichungsindikator zusammen mit dem arithmetischen Mittel der Stichprobe verwendet, um die Ergebnisse der Datenanalyse kurz zu beschreiben.

Sinnvoller ist es, die Stichprobenvarianz nach folgender Formel zu berechnen:

Die Standardabweichung wird nach folgender Formel berechnet:

Der Variationskoeffizient ist ein relatives Maß für die Streuung eines Merkmals.

Der Variationskoeffizient wird auch als Indikator für die Homogenität von Stichprobenbeobachtungen verwendet. Es wird davon ausgegangen, dass die Stichprobe als homogen betrachtet werden kann, d. h. als aus einer Gesamtpopulation stammend, wenn der Variationskoeffizient 10 % nicht überschreitet.

Da der Variationskoeffizient in beiden Stichproben vorhanden ist, sind sie homogen.

Die Stichprobe kann analytisch sowohl in Form einer Verteilungsfunktion als auch in Form einer aus zwei Zeilen bestehenden Häufigkeitstabelle dargestellt werden. In der obersten Zeile sind die Auswahlelemente (Optionen) aufsteigend angeordnet; Die Häufigkeiten der Option stehen in der unteren Zeile.

Die Variantenhäufigkeit ist eine Zahl, die der Anzahl der Wiederholungen einer bestimmten Variante in der Stichprobe entspricht.

Probe Nr. 1 „Mütter“

Art der Verteilungskurve

Asymmetrie oder Schiefekoeffizient (ein Begriff, der erstmals 1895 von Pearson geprägt wurde) ist ein Maß für die Schiefe einer Verteilung. Wenn die Schiefe deutlich von 0 abweicht, ist die Verteilung asymmetrisch, die Dichte der Normalverteilung ist symmetrisch zum Mittelwert.

Index Asymmetrie(Englisch) Schiefe) wird verwendet, um den Grad der Symmetrie der Datenverteilung um das Zentrum zu charakterisieren. Asymmetrie kann sowohl negative als auch positive Werte annehmen. Ein positiver Wert für diesen Parameter gibt an, dass die Daten nach links von der Mitte verschoben werden, und ein negativer Wert gibt an, dass die Daten nach rechts verschoben werden. Somit gibt das Vorzeichen des Schiefeindex die Richtung der Datenverzerrung an, während die Größe den Grad dieser Verzerrung angibt. Eine Schiefe von Null zeigt an, dass die Daten symmetrisch um die Mitte konzentriert sind.

Weil Die Asymmetrie ist positiv, daher bewegt sich die Spitze der Kurve nach links von der Mitte.

Kurtosis-Koeffizient(Englisch) Kurtosis) ist ein Merkmal dafür, wie eng der Großteil der Daten um das Zentrum herum gruppiert ist.

Bei einer positiven Kurtosis wird die Kurve schärfer, bei einer negativen Kurtosis wird sie glatter.

Die Kurve ist abgeflacht;

Die Kurve wird schärfer.