Charakterystyka rozpraszania. Charakterystyka rozpraszania Dyspersja i jej właściwości Nierówność Czebyszewa Charakterystyka położenia i rozpraszania

Nieważne jak ważne są cechy średnie, równie ważną cechą tablicy danych liczbowych jest zachowanie pozostałych członków tablicy w stosunku do średniej, jak bardzo różnią się one od średniej, ile członków tablicy się różni znacząco od średniej. Podczas szkolenia strzeleckiego mówią o dokładności wyników, w statystyce badają charakterystykę dyspersji (rozrzutu).

Nazywa się różnicę między dowolną wartością x a średnią wartością x odchylenie i obliczane jako różnica x, - x. W takim przypadku odchylenie może przyjmować zarówno wartości dodatnie, jeśli liczba jest większa od średniej, jak i wartości ujemne, jeśli liczba jest mniejsza od średniej. Jednak w statystyce często istotna jest możliwość operowania jedną liczbą, która charakteryzuje „dokładność” wszystkich elementów liczbowych tablicy danych. Wszelkie sumowanie wszystkich odchyleń elementów tablicy doprowadzi do zera, ponieważ odchylenia dodatnie i ujemne znoszą się wzajemnie. Aby uniknąć zerowania, do scharakteryzowania rozpraszania stosuje się kwadraty różnic, a dokładniej średnią arytmetyczną kwadratów odchyleń. Ta cecha rozpraszania nazywa się wariancja próbki.

Im większa wariancja, tym większe rozproszenie wartości zmiennej losowej. Aby obliczyć rozproszenie, stosuje się przybliżoną wartość średniej próbki x z marginesem jednej cyfry w odniesieniu do wszystkich elementów tablicy danych. W przeciwnym razie przy sumowaniu dużej liczby wartości przybliżonych narosnie znaczny błąd. W związku z wymiarowością wartości liczbowych należy zwrócić uwagę na jedną wadę takiego wskaźnika dyspersji, jakim jest dyspersja próbki: jednostka miary dyspersji D jest kwadratem jednostki miary wartości X, którego cechą charakterystyczną jest dyspersja. Aby pozbyć się tej wady, statystyki wprowadziły taką charakterystykę rozpraszania jak Odchylenie standardowe próbki , co jest oznaczone symbolem A (czytaj „sigma”) i jest obliczana przy użyciu wzoru

Zwykle ponad połowa elementów tablicy danych różni się od średniej o mniej niż odchylenie standardowe, tj. należą do segmentu [X - A; x + a]. W przeciwnym razie mówią: średnia, biorąc pod uwagę rozrzut danych, jest równa x ± a.

Wprowadzenie kolejnej charakterystyki rozpraszania jest związane z wymiarem elementów tablicy danych. Wszystkie charakterystyki liczbowe w statystyce wprowadzane są w celu porównania wyników badania różnych tablic numerycznych charakteryzujących różne zmienne losowe. Jednak porównywanie odchyleń standardowych od różnych wartości średnich z różnych zbiorów danych nie ma charakteru orientacyjnego, zwłaszcza jeśli wymiary tych wielkości również są różne. Na przykład, jeśli porównuje się długość i wagę dowolnych przedmiotów lub rozproszenie przy wytwarzaniu mikro- i makroproduktów. W związku z powyższymi rozważaniami wprowadzono charakterystykę rozpraszania względnego, tzw Współczynnik zmienności i oblicza się według wzoru

Do obliczenia numerycznych charakterystyk rozproszenia wartości zmiennych losowych wygodnie jest posłużyć się tabelą (tabela 6.9).

Tabela 6.9

Obliczanie charakterystyk numerycznych rozproszenia wartości zmiennych losowych

Xj- X

(Xj-X)2/

Średnia z próbki jest w trakcie wypełniania tej tabeli. X, które w przyszłości będą stosowane w dwóch formach. Jako końcową średnią charakterystykę (na przykład w trzeciej kolumnie tabeli) średnia próbki X należy zaokrąglić do cyfry odpowiadającej najmniejszej cyfrze dowolnego elementu tablicy danych liczbowych x gł Jednakże wskaźnik ten wykorzystywany jest w tabeli do dalszych obliczeń i w tej sytuacji, a mianowicie przy obliczaniu w czwartej kolumnie tabeli, średnia z próby X należy zaokrąglić z marginesem jednej cyfry względem najmniejszej cyfry dowolnego elementu tablicy danych liczbowych X ( .

Wynik obliczeń przy użyciu tabeli podobnej do tabeli. 6.9 uzyska wartość rozproszenia próbki, a do zapisania odpowiedzi należy na podstawie wartości rozproszenia próbki obliczyć wartość odchylenia standardowego a.

Odpowiedź wskazuje: a) średni wynik uwzględniający rozproszenie danych w formularzu x±o; b) charakterystyka stabilności danych V. Odpowiedź powinna ocenić jakość współczynnika zmienności: dobra lub zła.

Za dopuszczalny współczynnik zmienności jako wskaźnik jednorodności lub stabilności wyników w badaniach sportowych uważa się 10-15%. Współczynnik zmienności V= 20% w każdym badaniu jest uważane za bardzo dużą liczbę. Jeśli wielkość próbki P> 25, więc V> 32% to bardzo zły wskaźnik.

Na przykład dla dyskretnej serii zmian 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 stoły 6.9 zostanie wypełniony w następujący sposób (Tabela 6.10).

Tabela 6.10

Przykład obliczenia liczbowych charakterystyk rozproszenia wartości

*1

fi

1

L P 25 = 2,92 = 2,9

D_S_47,6_ P 25

Odpowiedź: a) średnia charakterystyka, biorąc pod uwagę rozrzut danych, jest równa X± a = = 3 ± 1,4; b) stabilność uzyskanych pomiarów jest na niskim poziomie, ponieważ współczynnik zmienności V = 48% > 32%.

Analog stołu 6.9 można również wykorzystać do obliczenia charakterystyki rozpraszania szeregu zmian przedziałowych. Jednocześnie opcje x gł zostaną zastąpieni przez przedstawicieli luk x w ja opcja częstotliwości bezwzględnych F(- do częstotliwości bezwzględnych interwałów fv

Na podstawie powyższego można wykonać następujące czynności: wnioski.

Wnioski statystyki matematycznej są wiarygodne, jeśli przetworzy się informacje o zjawiskach masowych.

Zazwyczaj bada się próbę z ogólnej populacji obiektów, która musi być reprezentatywna.

Dane eksperymentalne uzyskane w wyniku badania dowolnej właściwości próbek obiektów reprezentują wartość zmiennej losowej, ponieważ badacz nie jest w stanie z góry przewidzieć, która liczba będzie odpowiadać danemu obiektowi.

Aby wybrać taki lub inny algorytm opisu i wstępnego przetwarzania danych eksperymentalnych, ważna jest umiejętność określenia rodzaju zmiennej losowej: dyskretna, ciągła lub mieszana.

Dyskretne zmienne losowe opisuje się dyskretnym szeregiem zmienności i jego graficzną formą – wielokątem częstości.

Mieszane i ciągłe zmienne losowe opisuje się za pomocą szeregu zmienności przedziałowej i jego postaci graficznej – histogramu.

Porównując kilka próbek według wygenerowanego poziomu określonej właściwości, wykorzystuje się średnią charakterystykę liczbową oraz liczbową charakterystykę rozproszenia zmiennej losowej w stosunku do średniej.

Przy obliczaniu cechy średniej ważne jest, aby prawidłowo wybrać rodzaj cechy średniej, adekwatny do obszaru jej zastosowania. Strukturalne wartości średnie, tryb i mediana, charakteryzują strukturę lokalizacji wariantu w uporządkowanej tablicy danych eksperymentalnych. Średnia ilościowa pozwala ocenić średnią wielkość opcji (średnia z próby).

Do obliczenia numerycznych charakterystyk rozpraszania – wariancji próbki, odchylenia standardowego i współczynnika zmienności – skuteczna jest metoda tabelaryczna.

Charakterystyka pozycji opisuje środek rozkładu. Jednocześnie znaczenia opcji można wokół niej pogrupować zarówno w szerokim, jak i wąskim paśmie. Dlatego do opisu rozkładu konieczne jest scharakteryzowanie zakresu zmian wartości cechy. Charakterystyki rozproszenia służą do opisania zakresu zmienności cechy. Do najpowszechniej stosowanych należą zakres zmienności, rozproszenie, odchylenie standardowe i współczynnik zmienności.

Zakres zmienności definiuje się jako różnicę pomiędzy maksymalną i minimalną wartością cechy w badanej populacji:

R=X maks. - X min.

Oczywistą zaletą rozważanego wskaźnika jest prostota obliczeń. Ponieważ jednak zakres zmienności zależy od wartości tylko skrajnych wartości cechy, zakres jej zastosowania ogranicza się do rozkładów dość jednorodnych. W innych przypadkach zawartość informacyjna tego wskaźnika jest bardzo mała, ponieważ istnieje wiele rozkładów o bardzo różnym kształcie, ale o tym samym zakresie. W badaniach praktycznych zakres zmienności jest czasami stosowany w przypadku małych próbek (nie więcej niż 10). Przykładowo, na podstawie zakresu zmienności łatwo ocenić, jak bardzo różnią się najlepsze i najgorsze wyniki w danej grupie sportowców.

W tym przykładzie:

R=16,36 – 13,04=3,32 (m).

Drugą cechą rozpraszania jest dyspersja. Dyspersja to średni kwadrat odchylenia zmiennej losowej od jej średniej. Dyspersja jest cechą rozpraszania, rozproszenia wartości wielkości wokół jej wartości średniej. Samo słowo „rozproszenie” oznacza „rozproszenie”.

Podczas przeprowadzania badań reprezentacyjnych konieczne jest ustalenie oszacowania wariancji. Wariancja obliczona na podstawie danych próbki nazywana jest wariancją próbki i jest oznaczana S 2 .

Na pierwszy rzut oka najbardziej naturalnym oszacowaniem wariancji jest wariancja statystyczna, obliczona na podstawie definicji za pomocą wzoru:

We wzorze tym - suma kwadratów odchyleń wartości atrybutów x ja od średniej arytmetycznej . Aby otrzymać średnie odchylenie kwadratowe, sumę tę dzieli się przez wielkość próby P.

Jednakże takie oszacowanie nie jest bezstronne. Można wykazać, że suma kwadratów odchyleń wartości atrybutów dla przykładowej średniej arytmetycznej jest mniejsza niż suma kwadratów odchyleń od dowolnej innej wartości, w tym od średniej prawdziwej (oczekiwania matematycznego). Zatem wynik uzyskany z powyższego wzoru będzie obarczony błędem systematycznym, a oszacowana wartość wariancji będzie zaniżona. Aby wyeliminować błąd, wystarczy wprowadzić współczynnik korygujący. Wynikiem jest następująca zależność dla szacowanej wariancji:

Dla dużych wartości N Naturalnie oba szacunki – obciążony i nieobciążony – będą się od siebie bardzo nieznacznie różnić, a wprowadzenie współczynnika korygującego straci sens. Co do zasady, wzór na szacowanie wariancji należy doprecyzować, gdy N<30.

W przypadku danych zgrupowanych ostatni wzór można sprowadzić do następującej postaci, aby uprościć obliczenia:

Gdzie k- liczba przedziałów grupujących;

n ja- częstotliwość interwału z liczbą I;

x ja- średnia wartość przedziału z liczbą I.

Dla przykładu obliczmy wariancję dla pogrupowanych danych analizowanego przez nas przykładu (patrz tabela 4.):

S 2 =/ 28=0,5473 (m2).

Wariancja zmiennej losowej ma wymiar kwadratu wymiaru zmiennej losowej, co utrudnia jej interpretację i czyni ją mało oczywistą. Aby uzyskać bardziej wizualny opis rozpraszania, wygodniej jest użyć cechy, której wymiar pokrywa się z wymiarem badanej cechy. W tym celu wprowadzono pojęcie odchylenie standardowe(Lub odchylenie standardowe).

Odchylenie standardowe nazywa się dodatnim pierwiastkiem kwadratowym wariancji:

W naszym przykładzie odchylenie standardowe jest równe

Odchylenie standardowe ma te same jednostki miary, co wyniki pomiaru badanej cechy, a zatem charakteryzuje stopień odchylenia cechy od średniej arytmetycznej. Inaczej mówiąc, pokazuje, jak główna część opcji jest umiejscowiona względem średniej arytmetycznej.

Odchylenie standardowe i wariancja są najczęściej stosowanymi miarami zmienności. Wynika to z faktu, że są one uwzględnione w znacznej części twierdzeń teorii prawdopodobieństwa, która stanowi podstawę statystyki matematycznej. Dodatkowo wariancję można rozłożyć na elementy składowe, co pozwala ocenić wpływ różnych czynników na zmienność badanej cechy.

Oprócz bezwzględnych wskaźników zmienności, którymi są dyspersja i odchylenie standardowe, w statystyce wprowadza się wskaźniki względne. Najczęściej stosuje się współczynnik zmienności. Współczynnik zmienności równy stosunkowi odchylenia standardowego do średniej arytmetycznej, wyrażony w procentach:

Z definicji jasno wynika, że ​​w swoim znaczeniu współczynnik zmienności jest względną miarą rozproszenia cechy.

Dla omawianego przykładu:

Współczynnik zmienności jest szeroko stosowany w badaniach statystycznych. Będąc wartością względną, pozwala porównać zmienność zarówno cech, które mają różne jednostki miary, jak i tej samej cechy w kilku różnych populacjach o różnych wartościach średniej arytmetycznej.

Współczynnik zmienności służy do scharakteryzowania jednorodności uzyskanych danych eksperymentalnych. W praktyce kultury fizycznej i sportu rozrzut wyników pomiarów w zależności od wartości współczynnika zmienności uważa się za niewielki (V<10%), средним (11-20%) и большим (V> 20%).

Ograniczenia w stosowaniu współczynnika zmienności związane są z jego względnym charakterem – definicja zawiera normalizację do średniej arytmetycznej. W związku z tym przy małych wartościach bezwzględnych średniej arytmetycznej współczynnik zmienności może stracić swoją treść informacyjną. Im średnia arytmetyczna jest bliższa zeru, tym mniej informacyjny staje się ten wskaźnik. W przypadku granicznym średnia arytmetyczna dąży do zera (na przykład temperatura), a współczynnik zmienności dąży do nieskończoności, niezależnie od rozrzutu cechy. Analogicznie do przypadku błędu można sformułować następującą regułę. Jeżeli wartość średniej arytmetycznej w próbie jest większa od jedności, wówczas zastosowanie współczynnika zmienności jest dopuszczalne; w przeciwnym razie do opisu rozrzutu danych eksperymentalnych należy zastosować rozproszenie i odchylenie standardowe.

Na zakończenie tej części rozważymy ocenę zmian wartości cech oceny. Jak już wspomniano, wartości charakterystyk rozkładu obliczone na podstawie danych eksperymentalnych nie pokrywają się z ich prawdziwymi wartościami dla populacji ogólnej. Nie jest możliwe dokładne ustalenie tego ostatniego, ponieważ z reguły nie da się zbadać całej populacji. Jeśli do oszacowania parametrów rozkładu wykorzystamy wyniki różnych próbek z tej samej populacji, okaże się, że te szacunki dla różnych próbek różnią się od siebie. Szacowane wartości oscylują wokół ich prawdziwych wartości.

Odchylenia szacunków parametrów ogólnych od prawdziwych wartości tych parametrów nazywane są błędami statystycznymi. Powodem ich występowania jest ograniczona liczebność próby – nie wszystkie obiekty z populacji ogólnej są w niej uwzględnione. Do oszacowania wielkości błędów statystycznych wykorzystuje się odchylenie standardowe charakterystyki próby.

Jako przykład rozważ najważniejszą cechę pozycji - średnią arytmetyczną. Można wykazać, że odchylenie standardowe średniej arytmetycznej wyznacza zależność:

Gdzie σ - odchylenie standardowe dla populacji.

Ponieważ nie jest znana prawdziwa wartość odchylenia standardowego, przyjmuje się wielkość tzw błąd standardowy średniej arytmetycznej i równe:

Wartość charakteryzuje błąd, który średnio jest dopuszczalny przy zastąpieniu średniej ogólnej jej oszacowaniem z próby. Zgodnie ze wzorem zwiększenie liczebności próby w trakcie badania prowadzi do zmniejszenia błędu standardowego proporcjonalnie do pierwiastka kwadratowego liczebności próby.

Dla rozważanego przykładu błąd standardowy średniej arytmetycznej wynosi . W naszym przypadku okazało się, że jest ono 5,4 razy mniejsze od odchylenia standardowego.

    EFEKTYWNA POWIERZCHNIA ROZPROSZENIA (POWIERZCHNIA)- charakterystyka odbicia celu, wyrażona stosunkiem mocy elektrycznej. mag. energia odbita przez cel w kierunku odbiornika do gęstości strumienia energii powierzchniowej padającej na cel. Zależy od… … Encyklopedia strategicznych sił rakietowych

    Mechanika kwantowa… Wikipedia

    - (EPR) charakterystyka współczynnika odbicia celu napromienianego falami elektromagnetycznymi. Wartość EPR definiuje się jako stosunek przepływu (mocy) energii elektromagnetycznej odbitej przez cel w kierunku urządzenia radioelektronicznego (OZE) do... ...Słownika Morskiego

    pasmo rozproszone- Charakterystyka statystyczna danych eksperymentalnych odzwierciedlająca ich odchylenie od wartości średniej. Tematyka: metalurgia ogólnie EN zespół desperacki... Przewodnik tłumacza technicznego

    - (funkcja przenoszenia modulacji), funkcja, za pomocą cięcia ocenia się właściwości „ostrości” obrazujących soczewek optycznych. systemy i dział elementy takich systemów. Ch.k.x. jest tak zwaną transformatą Fouriera. funkcja rozproszenia liniowego opisująca naturę „rozproszenia”... ... Encyklopedia fizyczna

    Funkcja przenoszenia modulacji, funkcja oceniająca właściwości „ostrości” obrazujących układów optycznych i poszczególnych elementów takich układów (patrz np. Ostrość obrazu fotograficznego). Ch.k.x. jest Fourier... ...

    pasmo rozproszone- charakterystyka statystyczna danych doświadczalnych, odzwierciedlająca ich odchylenie od wartości średniej. Zobacz też: Listwa ślizgowa Listwa odciążająca Listwa hartownicza... Encyklopedyczny słownik metalurgii

    PASKO ROZPRASZAJĄCE- charakterystyka statystyczna danych eksperymentalnych, odzwierciedlająca ich odchylenie od wartości średniej... Słownik metalurgiczny

    Charakterystyka rozproszenia wartości zmiennych losowych. M. t. h jest powiązany z odchyleniem kwadratowym (patrz odchylenie kwadratowe) σ za pomocą wzoru. Tę metodę pomiaru rozproszenia wyjaśnia fakt, że w przypadku normalnego ... ... Wielka encyklopedia radziecka

    STATYSTYKA ZMIAN- STATYSTYKA ZMIAN, termin łączący grupę technik analizy statystycznej stosowanych przede wszystkim w naukach przyrodniczych. W drugiej połowie XIX w. Quetelet, „Anthro pometrie ou mesure des Differentes Facultes de 1... ... Wielka encyklopedia medyczna

    Wartość oczekiwana- (Średnia populacji) Oczekiwanie matematyczne to rozkład prawdopodobieństwa zmiennej losowej. Oczekiwanie matematyczne, definicja, oczekiwanie matematyczne dyskretnych i ciągłych zmiennych losowych, próba, oczekiwanie warunkowe, obliczenia,... ... Encyklopedia inwestorów

Jednym z powodów prowadzenia analiz statystycznych jest konieczność uwzględnienia wpływu czynników losowych (zakłóceń) na badany wskaźnik, które prowadzą do rozproszenia (rozproszenia) danych. Rozwiązywanie problemów, w których dane są rozproszone, wiąże się z ryzykiem, ponieważ nawet jeśli wykorzystasz wszystkie dostępne informacje, nie będziesz w stanie tego zrobić Dokładnie przewidzieć, co wydarzy się w przyszłości. Aby odpowiednio sobie poradzić z takimi sytuacjami, wskazane jest zrozumienie charakteru ryzyka i umiejętność określenia stopnia rozproszenia zbioru danych. Istnieją trzy charakterystyki liczbowe opisujące miarę dyspersji: odchylenie standardowe, zakres i współczynnik zmienności (zmienność). W odróżnieniu od typowych wskaźników (średnia, mediana, tryb) charakteryzujących centrum, widoczne są cechy rozproszenia jak blisko Poszczególne wartości zbioru danych zlokalizowane są w stronę tego centrum
Definicja odchylenia standardowego Odchylenie standardowe(odchylenie standardowe) jest miarą losowych odchyleń wartości danych od średniej. W prawdziwym życiu większość danych charakteryzuje się rozproszeniem, tj. poszczególne wartości znajdują się w pewnej odległości od średniej.
Nie da się zastosować odchylenia standardowego jako ogólnej charakterystyki rozproszenia, po prostu uśredniając odchylenia danych, gdyż część odchyleń będzie dodatnia, a część ujemna, w rezultacie wynik uśredniania może być równy zero. Aby pozbyć się znaku ujemnego, użyj standardowej techniki: najpierw oblicz dyspersja jako suma kwadratów odchyleń podzielona przez ( N–1), a następnie z otrzymanej wartości wyciągany jest pierwiastek kwadratowy. Wzór na obliczenie odchylenia standardowego jest następujący: Uwaga 1: Wariancja nie niesie ze sobą żadnych dodatkowych informacji w porównaniu do odchylenia standardowego, ale jest trudniejsza w interpretacji, ponieważ wyrażana jest w „jednostkach do kwadratu”, natomiast odchylenie standardowe wyraża się w znanych nam jednostkach (na przykład dolarach). Uwaga 2: Powyższy wzór służy do obliczania odchylenia standardowego próbki i jest dokładniej nazywany Odchylenie standardowe próbki. Przy obliczaniu odchylenia standardowego populacja(oznaczone symbolem s) podzielić przez N. Wartość odchylenia standardowego próbki jest nieco większa (ponieważ jest podzielona przez N–1), co zapewnia korekcję losowości samej próbki. Gdy zbiór danych ma rozkład normalny, odchylenie standardowe nabiera szczególnego znaczenia. Na poniższym rysunku zaznaczono po obu stronach średniej w odległościach odpowiednio jednego, dwóch i trzech odchyleń standardowych. Rysunek pokazuje, że około 66,7% (dwie trzecie) wszystkich wartości mieści się w granicach jednego odchylenia standardowego po obu stronach średniej, 95% wartości mieści się w granicach dwóch odchyleń standardowych od średniej, a prawie wszystkie dane (99,7%) będzie mieścić się w granicach trzech odchyleń standardowych od średniej.
66,7%


Ta właściwość odchylenia standardowego dla danych o rozkładzie normalnym nazywana jest „regułą dwóch trzecich”.

W niektórych sytuacjach, takich jak analiza kontroli jakości produktu, limity są często ustalane w taki sposób, że obserwacje (0,3%), które różnią się od średniej o więcej niż trzy odchylenia standardowe, są uznawane za istotny problem.

Niestety, jeśli dane nie mają rozkładu normalnego, nie można zastosować opisanej powyżej reguły.

Obecnie istnieje ograniczenie zwane regułą Czebyszewa, które można zastosować do rozkładów asymetrycznych (skośnych).

Wygeneruj zestaw danych początkowych SV

W tabeli 1 przedstawiono dynamikę zmian dziennych zysków na giełdzie, rejestrowanych w dni robocze, za okres od 31 lipca do 9 października 1987 r.

Tabela 1. Dynamika zmian dziennych zysków na giełdzie

data Dzienny zysk data Dzienny zysk data Dzienny zysk
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Uruchom Excela
Utwórz plik Kliknij przycisk Zapisz na pasku narzędzi Standard. Otwórz folder Statistics w wyświetlonym oknie dialogowym i nazwij plik Scattering Characteristics.xls.
Ustaw etykietę 6. Na Arkuszu 1 w komórce A1 ustaw etykietę Dzienny zysk, 7. i w zakresie A2:A49 wprowadź dane z Tabeli 1.
Ustaw funkcję WARTOŚĆ ŚREDNIA 8. W komórce D1 wprowadź etykietę Średnia. W komórce D2 oblicz średnią, korzystając z funkcji statystycznej ŚREDNIA.
Ustaw funkcję STANDARDEV W komórce D4 wprowadź etykietę Odchylenie standardowe. W komórce D5 oblicz odchylenie standardowe, korzystając z funkcji statystycznej STDEV
Zmniejsz rozmiar bitu wyniku do czwartego miejsca po przecinku.
Interpretacja wyników SpadekŚredni dzienny zysk wyniósł 0,04% (średni dzienny zysk wyniósł -0,0004). Oznacza to, że średni dzienny zysk za rozpatrywany okres wyniósł w przybliżeniu zero, tj. rynek utrzymał średnie tempo. Odchylenie standardowe okazało się równe 0,0118. Oznacza to, że jeden dolar (1 dolar) zainwestowany na giełdzie zmieniał się średnio o 0,0118 dolara dziennie, tj. jego inwestycja może skutkować zyskiem lub stratą w wysokości 0,0118 USD.
Sprawdźmy, czy wartości zysków dziennych podane w tabeli 1 odpowiadają regułom rozkładu normalnego 1. Oblicz przedział odpowiadający jednemu odchyleniu standardowemu po obu stronach średniej. 2. W komórkach D7, D8 i F8 ustaw odpowiednio etykiety: Jedno odchylenie standardowe, Dolna granica, Górna granica. 3. W komórce D9 wpisz formułę = -0,0004 – 0,0118, a w komórce F9 wpisz formułę = -0,0004 + 0,0118. 4. Uzyskaj wynik z dokładnością do czwartego miejsca po przecinku.

5. Określ liczbę dziennych wartości zysku mieszczących się w jednym odchyleniu standardowym. Najpierw przefiltruj dane, pozostawiając wartości dziennego zysku w przedziale [-0,0121, 0,0114]. W tym celu zaznacz w kolumnie A dowolną komórkę zawierającą wartości dziennego zysku i uruchom komendę:

Data®Filter®AutoFilter

Otwórz menu klikając strzałkę w nagłówku Dzienny zysk i wybierz (Warunek...). W oknie dialogowym Niestandardowy autofiltr ustaw opcje jak pokazano poniżej. Kliknij OK.

Aby policzyć ilość przefiltrowanych danych należy zaznaczyć zakres wartości dziennego zysku, kliknąć prawym przyciskiem myszy puste miejsce w pasku stanu i z menu kontekstowego wybrać opcję Liczba wartości. Przeczytaj wynik. Teraz wyświetl wszystkie oryginalne dane, uruchamiając polecenie: Data®Filter®Display All i wyłącz autofiltr za pomocą polecenia: Data®Filter®AutoFilter.

6. Oblicz procent wartości dziennych zysków oddalonych o jedno odchylenie standardowe od średniej. Aby to zrobić, umieść etykietę w komórce H8 Procent, a w komórce H9 zaprogramuj wzór na obliczenie procentu i uzyskaj wynik z dokładnością do jednego miejsca po przecinku.

7. Oblicz zakres wartości dziennego zysku w granicach dwóch odchyleń standardowych od średniej. W komórkach D11, D12 i F12 ustaw odpowiednio etykiety: Dwa odchylenia standardowe, Konkluzja, Górna granica. Wprowadź formuły obliczeniowe w komórkach D13 i F13 i uzyskaj wynik z dokładnością do czwartego miejsca po przecinku.

8. Określ liczbę dziennych wartości zysku mieszczących się w granicach dwóch odchyleń standardowych, najpierw filtrując dane.

9. Oblicz procent dziennych wartości zysku oddalony o dwa odchylenia standardowe od średniej. W tym celu należy umieścić etykietę w komórce H12 Procent, a w komórce H13 zaprogramuj wzór na obliczenie procentu i uzyskaj wynik z dokładnością do jednego miejsca po przecinku.

10. Oblicz zakres wartości dziennego zysku w granicach trzech odchyleń standardowych od średniej. W komórkach D15, D16 i F16 ustaw odpowiednio etykiety: Trzy odchylenia standardowe, Konkluzja, Górna granica. Wprowadź formuły obliczeniowe w komórkach D17 i F17 i uzyskaj wynik z dokładnością do czwartego miejsca po przecinku.

11. Określ liczbę dziennych wartości zysków mieszczących się w trzech odchyleniach standardowych, najpierw filtrując dane. Oblicz procent wartości dziennego zysku. W tym celu należy umieścić etykietę w komórce H16 Procent, a w komórce H17 zaprogramuj wzór na obliczenie procentu i uzyskaj wynik z dokładnością do jednego miejsca po przecinku.

13. Skonstruuj histogram dziennych stóp zwrotu akcji na giełdzie i umieść go wraz z tablicą rozkładu częstotliwości w obszarze J1:S20. Pokaż na histogramie przybliżoną średnią i przedziały odpowiadające odpowiednio jednemu, dwóm i trzem odchyleniom standardowym od średniej.

Charakterystyka rozpraszania

Miary rozproszenia próbek.

Minimum i maksimum próbki to odpowiednio najmniejsza i największa wartość badanej zmiennej. Nazywa się różnicę między maksimum i minimum zakres próbki. Wszystkie przykładowe dane znajdują się pomiędzy minimum i maksimum. Wskaźniki te wydają się wyznaczać granice próby.

R№1= 15,6-10=5,6

R№2 =0,85-0,6=0,25

Odchylenie próbki(Język angielski) zmienność) I odchylenie standardowe próbki (angielski) odchylenie standardowe) są miarą zmienności zmiennej i charakteryzują stopień rozproszenia danych wokół centrum. W tym przypadku odchylenie standardowe jest wygodniejszym wskaźnikiem, ponieważ ma ten sam wymiar, co aktualnie badane dane. Dlatego do krótkiego opisu wyników analizy danych stosuje się wskaźnik odchylenia standardowego wraz ze średnią arytmetyczną próby.

Bardziej celowe jest obliczenie wariancji próbki za pomocą wzoru:

Odchylenie standardowe oblicza się ze wzoru:

Współczynnik zmienności jest względną miarą rozproszenia cechy.

Współczynnik zmienności służy również jako wskaźnik jednorodności obserwacji próbki. Uważa się, że jeśli współczynnik zmienności nie przekracza 10%, wówczas próbę można uznać za jednorodną, ​​tj. uzyskaną z jednej populacji ogólnej.

Ponieważ współczynnik zmienności występuje w obu próbkach, są one jednorodne.

Próbę można przedstawić analitycznie w postaci funkcji rozkładu, a także w postaci tabeli częstości składającej się z dwóch linii. W górnej linii znajdują się elementy wyboru (opcje) ułożone w kolejności rosnącej; Częstotliwości opcji są zapisane w dolnym wierszu.

Częstość wariantów to liczba równa liczbie powtórzeń danego wariantu w próbie.

Próbka nr 1 „Matki”

Rodzaj krzywej rozkładu

Asymetria lub współczynnik skośności (termin ukuty przez Pearsona, 1895) jest miarą skośności rozkładu. Jeśli skośność jest wyraźnie różna od 0, rozkład jest asymetryczny, a gęstość rozkładu normalnego jest symetryczna względem średniej.

Indeks asymetria(Język angielski) skośność) służy do scharakteryzowania stopnia symetrii rozkładu danych wokół centrum. Asymetria może przyjmować zarówno wartości ujemne, jak i dodatnie. Dodatnia wartość tego parametru oznacza, że ​​dane zostaną przesunięte w lewo od środka, a wartość ujemna oznacza, że ​​dane zostaną przesunięte w prawo. Zatem znak wskaźnika skośności wskazuje kierunek błędu systematycznego danych, natomiast wielkość wskazuje stopień tego błędu systematycznego. Skośność równa zero wskazuje, że dane są symetrycznie skoncentrowane wokół środka.

Ponieważ asymetria jest dodatnia, dlatego góra krzywej przesuwa się na lewo od środka.

Współczynnik Kurtozy(Język angielski) kurtoza) jest cechą tego, jak blisko większość danych jest zgrupowana wokół środka.

Przy dodatniej kurtozie krzywa zaostrza się, przy ujemnej kurtozie wygładza się.

Krzywa jest spłaszczona;

Krzywa się zaostrza.