Характеристика розсіювання. Характеристики розсіювання Дисперсія та її властивості Нерівність Чебишева Характеристики положення та розсіювання

Як не важливі середні характеристики, але не менш важливою характеристикою масиву числових даних є поведінка інших членів масиву по відношенню до середнього показника, наскільки вони відрізняються від середніх показників, скільки членів масиву значно відрізняються від середнього. На тренуваннях зі стрільби говорять про купчастість результатів, у статистиці досліджують характеристики розсіювання (розкидання).

Відмінність будь-якого значення х, від середнього значення х називають відхиленням і обчислюють як різницю х, - х. При цьому відхилення може набувати як позитивних значень, якщо число більше середнього, так і негативні значення, якщо число менше середнього. Однак у статистиці часто важливо мати можливість оперувати одним числом, що характеризує «купність» всіх числових елементів масиву даних. Будь-яке підсумовування всіх відхилень членів масиву призведе до нуля, оскільки позитивні та негативні відхилення взаємно знищаться. Щоб уникнути обнулення, використовують для характеристики розсіювання квадрати різниць, точніше середнє арифметичне квадратів відхилень. Таку характеристику розсіювання називають вибіркова дисперсія.

Що більше дисперсія, то більше вписувалося розсіювання значень випадкової величини. Для обчислення дисперсії використовують наближене значення вибіркового середнього x із запасом на один розряд по відношенню до всіх членів масиву даних. В іншому випадку при підсумовуванні великої кількості наближених значень накопичуватиметься суттєва помилка. У зв'язку з розмірністю числових значень слід відзначити один недолік такого показника розсіювання, як вибіркова дисперсія: одиниця виміру дисперсії D є квадратом одиниці виміру значень х, характеристикою яких є дисперсія. Щоб позбутися цього недоліку, у статистиці введено таку характеристику розсіювання, як вибіркове середнє квадратичне відхилення , що позначається символом а (читається «сигма») та обчислюється за формулою

У нормі понад половина членів масиву даних від середнього показника менше, ніж величину середнього квадратичного відхилення, тобто. належать відрізку - а; х + а]. Інакше кажуть: середній показник з урахуванням розкиду даних дорівнює х±а.

Введення ще однієї характеристики розсіювання пов'язане із розмірністю членів масиву даних. Усі числові показники у статистиці вводяться з порівняння результатів дослідження різних числових масивів, характеризуючих різні випадкові величини. Однак порівнювати середні квадратичні відхилення від різних середніх величин різних масивів даних не показово, особливо якщо ще розмірність цих величин відрізняється. Наприклад, якщо порівнюється довжина і вага будь-яких об'єктів або розсіювання при виготовленні мікро- та макровиробів. У зв'язку з вищевикладеними міркуваннями вводиться характеристика відносного розсіювання, що називається коефіцієнтом варіаціїта обчислюється за формулою

Для підрахунку числових характеристик розсіювання значень випадкової величини зручно використати таблицю (табл. 6.9).

Таблиця 6.9

Підрахунок числових характеристик розсіювання значень випадкової величини

Xj- X

(Xj-X) 2 /

У процесі заповнення таблиці знаходиться вибіркове середнє х,яке надалі використовуватиметься у двох видах. Як підсумкова середня характеристика (наприклад, у третьому стовпці таблиці) середнє вибіркове хмає бути округлено до розряду, що відповідає найменшому розряду будь-якого члена масиву числових даних х гОднак цей показник використовується в таблиці при подальших обчисленнях, і в цій ситуації, а саме при обчисленнях у четвертому стовпці таблиці, середнє вибіркове хмає бути округлено із запасом на один розряд по відношенню до найменшого розряду будь-якого члена масиву числових даних х ( .

Результатом обчислень з допомогою таблиці типу табл. 6.9 буде отримання значення вибіркової дисперсії, а запису відповіді треба з урахуванням значення вибіркової дисперсії порахувати значення середнього квадратичного відхилення а.

У відповіді зазначається: а) середній результат з урахуванням розкиду даних як х±о; б) характеристика стабільності даних V.У відповіді слід оцінити якість коефіцієнта варіації: поганий чи добрий.

Допустимим коефіцієнтом варіації як показником однорідності чи стабільності результатів у спортивних дослідженнях вважається 10-15%. Коефіцієнт варіації V= 20% у будь-яких дослідженнях вважається дуже великим показником. Якщо обсяг вибірки п> 25, то V> 32% – дуже поганий показник.

Наприклад, дискретного варіаційного ряду 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 табл. 6.9 буде заповнена в такий спосіб (табл. 6.10).

Таблиця 6.10

Приклад підрахунку числових характеристик розсіювання значень

*1

fi

1

Л п 25 = 2,92 = 2,9

D _S_47,6_ п 25

Відповідь: а) середня характеристика з урахуванням розкиду даних дорівнює х± а = = 3 ± 1,4; б) стабільність отриманих вимірів знаходиться на низькому рівні, оскільки коефіцієнт варіації V = 48% > 32%.

Аналог табл. 6.9 може бути використаний для обчислення характеристик розсіювання інтервального варіаційного ряду. При цьому варіанти х гбудуть замінені представниками проміжків x v ja абсолютні частоти варіант f (-на абсолютні частоти проміжків f v

На підставі вищевикладеного можна зробити такі висновки.

Висновки математичної статистики є правдоподібними, якщо обробляється інформація про масові явища.

Зазвичай досліджується вибірка з генеральної сукупності об'єктів, що має бути репрезентативна.

Досвідчені дані, отримані в результаті дослідження будь-якої властивості об'єктів вибірки, є значенням випадкової величини, оскільки дослідник заздалегідь не може передбачити, яке саме число буде відповідати певному об'єкту.

Для вибору того чи іншого алгоритму опису та первинної обробки дослідних даних важливо вміти визначати тип випадкової величини: дискретна, безперервна чи змішана.

Дискретні випадкові величини описуються дискретним варіаційним рядом та її графічної формою - полігоном частот.

Змішані та безперервні випадкові величини описуються інтервальним варіаційним рядом та його графічною формою - гістограмою.

При порівнянні кількох вибірок за рівнем сформоване деякої властивості використовують середні числові характеристики і числові характеристики розсіювання випадкової величини по відношенню до середніх.

При обчисленні середньої характеристики важливо правильно вибрати вид середньої характеристики, адекватний галузі її застосування. Структурні середні значення мода і медіана характеризують структуру розташування варіанта в упорядкованому масиві досвідчених даних. Кількісне середнє значення дає можливість судити про середній розмір варіанта (вибіркова середня).

Для обчислення числових характеристик розсіювання – вибіркової дисперсії, середнього квадратичного відхилення та коефіцієнта варіації – ефективний табличний спосіб.

Показники положення описують центр розподілу. У той же час значення варіант можуть групуватися навколо нього як у широкій, так і вузькій смузі. Тому для опису розподілу необхідно охарактеризувати діапазон зміни значень ознаки. Для опису діапазону варіювання ознаки використовуються характеристики розсіювання. Найбільш широке застосування знайшли розмах варіації, дисперсія, стандартне відхилення та коефіцієнт варіації.

Розмах варіаціївизначається як різницю між максимальним і мінімальним значенням ознаки в досліджуваній сукупності:

R=x max - x min.

Очевидною перевагою аналізованого показника є простота розрахунку. Однак оскільки розмах варіації залежить від величин тільки крайніх значень ознаки, область його застосування обмежена досить однорідними розподілами. В інших випадках інформативність цього показника дуже невелика, оскільки існує дуже багато розподілів, що сильно відрізняються за формою, але мають однаковий розмах. У практичних дослідженнях розмах варіації використовується іноді за малих (не більше 10) обсягів вибірки. Так, наприклад, за розмахом варіації легко оцінити, наскільки розрізняються кращі та найгірші результати в групі спортсменів.

У цьому прикладі:

R= 16,36 - 13,04 = 3,32 (м).

Другою характеристикою розсіювання є дисперсія.Дисперсія є середній квадрат відхилення значення випадкової величини від її середнього значення. Дисперсія є характеристикою розсіювання, розкиданості значень величини біля її середнього значення. Саме слово "дисперсія" означає "розсіяння".

Під час проведення вибіркових досліджень необхідно встановити оцінку дисперсії. Дисперсія, що обчислюється за вибірковими даними, називається вибірковою дисперсією та позначається S 2 .

На перший погляд, найбільш природною оцінкою для дисперсії є статистична дисперсія, обчислена, виходячи з визначення, за формулою:

У цій формулі - сума квадратів відхилень значень ознаки х iвід середнього арифметичного . Для отримання середнього квадрата відхилень ця сума поділена на обсяг вибірки п.

Однак така оцінка не є незміщеною. Можна показати, що сума квадратів відхилень значень ознаки для вибіркового середнього арифметичного менше, ніж сума квадратів відхилень від будь-якої іншої величини, у тому числі від середнього (математичного очікування). Тому результат, який отримується за наведеною вище формулою, міститиме систематичну помилку, і оцінне значення дисперсії виявиться заниженим. Для ліквідації усунення достатньо ввести поправочний коефіцієнт. В результаті виходить наступне співвідношення для оцінної дисперсії:

При великих значеннях n, природно, обидві оцінки - зміщена і незміщена - відрізнятимуться дуже мало і введення поправного множника втрачає сенс. Як правило, уточнення формули для оцінки дисперсії слід проводити при n<30.

У разі згрупованих даних останню формулу для спрощення обчислень можна привести до такого вигляду:

де k- Число інтервалів угруповання;

n i- Частота інтервалу з номером i;

x i- серединне значення інтервалу з номером i.

Як приклад проведемо обчислення дисперсії для згрупованих даних прикладу, що розбирається нами (див. табл. 4.):

S 2 =/ 28 = 0,5473 (м 2).

Дисперсія випадкової величини має розмірність квадрата розмірності випадкової величини, що ускладнює її інтерпретацію та робить не дуже наочною. Для наочнішого опису розсіювання зручніше користуватися характеристикою, розмірність якої збігається з розмірністю досліджуваного ознаки. З цією метою вводиться поняття стандартного відхилення(або середнього квадратичного відхилення).

Стандартним відхиленнямназивається позитивний корінь квадратний з дисперсії:

У прикладі, що розбирається, стандартне відхилення дорівнює

Стандартне відхилення має самі одиниці виміру, як і результати виміру досліджуваного ознаки і, отже, воно характеризує ступінь відхилення ознаки від середнього арифметичного. Іншими словами, воно показує, як розташована основна частина варіанта щодо середнього арифметичного.

Стандартне відхилення та дисперсія є найбільш широко застосовуваними показниками варіації. Пов'язано це з тим, що вони входять до значної частини теорем теорії ймовірностей, що є фундаментом математичної статистики. Крім цього, дисперсія може бути розкладена на складові елементи, що дозволяють оцінити вплив різних факторів на варіацію ознаки, що досліджується.

Крім абсолютних показників варіації, якими є дисперсія та стандартне відхилення, у статистиці вводяться відносні. Найчастіше застосовується коефіцієнт варіації. Коефіцієнт варіаціїдорівнює відношенню стандартного відхилення до середнього арифметичного, вираженого у відсотках:

З визначення ясно, що за своїм змістом коефіцієнт варіації є відносним мірою розсіювання ознаки.

Для прикладу, що розглядається:

Коефіцієнт варіації широко використовується під час проведення статистичних досліджень. Будучи величиною відносною, він дозволяє порівнювати коливання як ознак, що мають різні одиниці виміру, так однієї і тієї ж ознаки в декількох різних сукупностях з різними значеннями середнього арифметичного.

Коефіцієнт варіації використовується характеристики однорідності отриманих експериментальних даних. У практиці фізичної культури та спорту розкид результатів вимірів залежно від значення коефіцієнта варіації прийнято вважати невеликим (V<10%), средним (11-20%) и большим (V> 20%).

Обмеження використання коефіцієнта варіації пов'язані з його відносним характером – визначення містить нормування на середнє арифметичне. У зв'язку з цим при малих абсолютних значеннях середнього арифметичного коефіцієнт варіації може втратити свою інформативність. Чим ближче значення середнього арифметичного нанівець, тим менш інформативним стає цей показник. У граничному випадку середнє арифметичне перетворюється на нуль (наприклад, температура) і коефіцієнт варіації перетворюється на нескінченність незалежно від розкиду ознаки. За аналогією з випадком похибки можна сформулювати таке правило. Якщо значення середнього арифметичного у вибірці більше одиниці, то використання коефіцієнта варіації правомірно, інакше для опису розкиду досвідчених даних слід використовувати дисперсію та стандартне відхилення.

На закінчення цієї частини розглянемо оцінку варіювання значень оціночних показників. Як було зазначено, значення показників розподілу, розраховані за даними експерименту, не збігаються зі своїми істинними значеннями для генеральної сукупності. Точно встановити останні неможливо, оскільки, зазвичай, неможливо обстежити всю генеральну сукупність. Якщо використовуватиме оцінки параметрів розподілу результати різних вибірок з однієї й тієї генеральної сукупності, то виявиться, що ці оцінки різних вибірок відрізняються друг від друга. Оціночні значення флуктують біля своїх істинних значень.

Відхилення оцінок генеральних властивостей від справжніх значень цих властивостей називаються статистичними помилками. Причиною виникнення є обмежений обсяг вибірки - в повному обсязі об'єкти генеральної сукупності входять у неї. Для оцінки величини статистичних помилок використовують стандартне відхилення вибіркових характеристик.

Як приклад розглянемо найважливішу характеристику становища - середнє арифметичне. Можна показати, що стандартне відхилення середнього арифметичного визначається співвідношенням:

де σ - Стандартне відхилення для генеральної сукупності.

Оскільки справжнє значення стандартного відхилення не відоме, то для оцінки стандартного відхилення вибіркового середнього використовується величина, яка називається стандартною помилкою середнього арифметичногоі рівна:

Величина характеризує помилку, яка в середньому допускається при заміні генерального середнього його вибіркової оцінки. Відповідно до формули, збільшення обсягу вибірки при проведенні дослідження призводить до зменшення стандартної помилки пропорційно до кореня квадратного з обсягу вибірки.

Для прикладу значення стандартної помилки середнього арифметичного дорівнює . У нашому випадку вона виявилася в 5,4 рази меншою за значення стандартного відхилення.

    ЕФЕКТИВНА ПОВЕРХНЯ (МАЙНА) РОЗСІЯ- Характеристика відбиває здатності мети, що виражається ставленням потужності ел. магн. енергії, що відображається метою у напрямку приймача, до поверхневої щільності потоку енергії, що падає на ціль. Залежить від… … Енциклопедія РВСП

    Квантова механіка … Вікіпедія

    - (ЕПР) характеристика відбиває здатності мети, опроміненої електромагнітними хвилями. Значення ЕПР визначається як відношення потоку (потужності) електромагнітної енергії, що відображається метою в напрямку радіоелектронного засобу (РЕМ), до ...

    смуга розсіювання- Статистична характеристика експериментальних даних, що відображає їхнє відхилення від середніх значення. Тематики металургія загалом EN desperal band … Довідник технічного перекладача

    - (функція передачі модуляції), фція, за допомогою якої оцінюють «різкісні» свва зображуючих оптич. систем та отд. елементів таких систем. Ч. к. х. є перетворення Фур'є т.з. функції розсіювання лінії, що описує характер «розпливання». Фізична енциклопедія

    Функція передачі модуляції, функція, за допомогою якої оцінюють «різкісні» властивості оптичних систем, що зображають, і окремих елементів таких систем (див., наприклад, Різкість фотографічного зображення). Ч. к. х. є Фур'є.

    смуга розсіювання- Статистична характеристика експериментальних даних, що відображає їх відхилення від середнього значення. Дивись також: Смуга ковзання смуга скидання смуга прожарювання смуга … Енциклопедичний словник з металургії

    СМУГА РОЗСІЯ- Статистична характеристика експериментальних даних, що відображає їх відхилення від середніх значення … Металургійний словник

    Характеристика розсіювання значень випадкової величини. М. т. h пов'язана з квадратичним відхиленням формулою Цей спосіб вимірювання розсіювання пояснюється тим, що у випадку нормального… Велика Радянська Енциклопедія

    ВАРІАЦІЙНА СТАТИСТИКА- ВАРІАЦІЙНА СТАТИСТИКА, термін, що поєднує групу прийомів статистичного аналізу, що застосовуються переважно у природничих науках. У другій половині ХІХ ст. Кетле (Quetelet, Anthro pometrie ou mesure des differentes facultes de 1… … Велика медична енциклопедія

    Математичне очікування- (Population mean) Математичне очікування – це розподіл ймовірностей випадкової величини. Енциклопедія інвестора

Одна з причин проведення статистичного аналізу полягає у необхідності враховувати вплив на досліджуваний показник випадкових факторів (обурень), що призводять до розкидання (розсіювання) даних. Розв'язання задач, у яких є розкид даних, пов'язане з ризиком, оскільки навіть при використанні всієї доступної інформації не можна точнопередбачити, що станеться у майбутньому. Для адекватної роботи у таких ситуаціях доцільно розуміти природу ризику та вміти визначати ступінь розсіювання набору даних. Існують три числові характеристики, що описують міру розсіювання: стандартне відхилення, розмах та коефіцієнт варіації (мінливості). На відміну від типових показників (середнє, медіана, мода), що характеризують центр, характеристики розсіювання показують, наскільки близькодо цього центру розташовуються окремі значення набору даних
Визначення стандартного відхилення Стандартне відхилення(Середнє квадратичне відхилення) є мірою випадкових відхилень значень даних від середнього. У житті більшість даних характеризується розсіюванням, тобто. окремі значення розташовуються певній відстані від середнього.
Використовувати стандартне відхилення як узагальнюючу характеристику розсіювання, просто усереднивши відхилення даних не можна, тому що частина відхилень виявиться позитивною, а інша частина негативною, і, внаслідок цього, результат усереднення може бути рівним нулю. Щоб позбавитися від негативного знака, застосовують стандартний прийом: спочатку обчислюють дисперсіюяк суму квадратів відхилень, поділену на ( n-1), А потім з отриманого значення витягують квадратний корінь. Формула для обчислення стандартного відхилення виглядає наступним чином: Примітка 1. Дисперсія не несе ніякої додаткової інформації в порівнянні зі стандартним відхиленням, проте її складніше інтерпретувати, тому що вона виражається в «одиницях у квадраті», в той час як стандартне відхилення виражено в звичних нам одиницях (наприклад, у доларах). Примітка 2. Наведена вище формула призначена для розрахунку стандартного відхилення за вибіркою і точніше називається вибіркове стандартне відхилення. При розрахунку стандартного відхилення генеральної сукупності(позначається символом s) роблять поділ на n. Величина вибіркового стандартного відхилення виходить дещо більше (бо ділять на n-1), Що забезпечує виправлення на випадковість самої вибірки. У випадку, коли набір даних має нормальний розподіл, стандартне відхилення набуває особливого значення. На малюнку, представленому нижче, по обидва боки від середнього зроблено позначки з відривом одного, двох і трьох стандартних відхилень відповідно. З малюнка видно, що приблизно 66,7% (дві третини) всіх значень знаходяться в межах одного стандартного відхилення по обидва боки від середнього значення, 95% значень виявляться в межах двох стандартних відхилень від середнього та майже всі дані (99,7%) будуть у межах трьох стандартних відхилень від середнього значення.
66,7%


Ця властивість стандартного відхилення для нормально розподілених даних називається "правилом двох третин".

У деяких ситуаціях, наприклад при аналізі контролю якості продукції, часто встановлюють такі межі, щоб як заслуговує на увагу проблеми розглядалися ті результати спостережень (0,3%), які відстоять від середнього на відстані більшій, ніж три стандартні відхилення.

На жаль, якщо дані не підпорядковуються нормальному розподілу, описане вище правило застосовувати не можна.

В даний час існує обмеження, яке називається правилом Чебишева, яке можна застосовувати до асиметричних (скошених) розподілів.

Сформувати вихідні дані Сукупність СВ

У таблиці 1 подано динаміку змін денного прибутку на біржі, зафіксованої в робочі дні за період від 31 липня до 9 жовтня 1987 року.

Таблиця 1. Динаміка зміни денного прибутку на біржі

Дата Денний прибуток Дата Денний прибуток Дата Денний прибуток
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
Запустити Excel
Створити файл Натисніть кнопку Зберегти на панелі інструментів Стандартна. відкрийте У діалоговому вікні папку Статистика і задайте ім'я файлу Характеристики рассеяния.xls.
Задати мітку 6. На аркуші1 в осередку A1 задайте мітку Денний прибуток, 7. а в діапазон A2:A49 введіть дані з Таблиці 1.
Задати функцію СЕРЕДНИЙ ЗНАЧЕННЯ 8. Введіть позначку Середнє в комірку D1. У осередку D2 обчисліть середнє, використовуючи статистичну функцію СРЗНАЧ.
Задати функцію СТАНДОТКЛОН У комірку D4 введіть позначку Стандартне відхилення. У комірці D5 обчисліть стандартне відхилення, використовуючи статистичну функцію СТАНДОТКЛОН
Зменшіть розрядність отриманого результату до четвертого символу після коми.
Інтерпретація результатів Зниженняденний прибуток у середньому становило 0,04% (значення середньої добової прибутку вийшло рівним –0,0004). Це означає, що середня денна прибуток за аналізований період була приблизно дорівнює нулю, тобто. над ринком тримався середній курс. Стандартне відхилення вийшло рівним 0,0118. Це означає, що вкладений у фондовий ринок один долар ($1) за добу змінювався загалом на $0,0118, тобто. його вкладення могло призвести до прибутку чи втрати у розмірі $0,0118.
Перевіримо, чи відповідають наведені у Таблиці 1 значення денного прибутку правилам нормального розподілу 1. Розрахуйте інтервал, що відповідає одному стандартному відхиленню по обидва боки від середнього. 2. У осередках D7, D8 і F8 задайте відповідно позначки: Одне стандартне відхилення, Нижня межа, Верхня границя. 3. У комірку D9 введіть формулу = -0,0004 – 0,0118, а в комірку F9 введіть формулу = -0,0004 + 0,0118. 4. Отримайте результат із точністю до четвертого знака після коми.

5. Визначте кількість значень денного прибутку, що знаходяться в межах одного стандартного відхилення. Спочатку відфільтруйте дані, залишивши значення денного прибутку в інтервалі [-0,0121, 0,0114]. Для цього виділіть будь-яку комірку в стовпці A зі значеннями денного прибутку та виконайте команду:

Дані®Фільтр®Автофільтр

Відкрийте меню, клацнувши на стрілці в заголовку Денний прибуток, та виберіть (Умова…). У діалоговому вікні Автофільтр користувача встановіть параметри як показано нижче. Натисніть кнопку ОК.

Щоб підрахувати кількість відфільтрованих даних, виділіть діапазон значень денного прибутку, клацніть правою кнопкою на вільному місці в рядку стану та в контекстному меню виберіть команду Кількість значень. Прочитайте результат. Тепер відобразіть усі вихідні дані, виконавши команду: Дані®Фільтр®Відобразити все та вимкніть автофільтр за допомогою команди: Дані®Фільтр®Автофільтр.

6. Обчисліть відсоток значень денного прибутку віддалених від середнього на відстані одного стандартного відхилення. Для цього в осередок H8 занесіть мітку Відсоток, а в осередку H9 запрограмуйте формулу обчислення відсотка та отримайте результат з точністю до одного знака після коми.

7. Розрахуйте інтервал значень денного прибутку в межах двох стандартних відхилень від середнього. У осередках D11, D12 і F12 задайте відповідно мітки: Два стандартні відхилення, Нижня границя, Верхня межа. У комірки D13 та F13 введіть розрахункові формули та отримайте результат з точністю до четвертого знака після коми.

8. Визначте кількість значень денного прибутку, що знаходяться в межах двох стандартних відхилень, попередньо відфільтрувавши дані.

9. Обчисліть відсоток значень денного прибутку віддалених від середнього на відстані двох стандартних відхилень. Для цього в осередок H12 занесіть мітку Відсоток, а в осередку H13 запрограмуйте формулу обчислення відсотка та отримайте результат з точністю до одного знака після коми.

10. Розрахуйте інтервал значень денного прибутку у межах трьох стандартних відхилень від середнього. У осередках D15, D16 і F16 задайте відповідно мітки: Три стандартні відхилення, Нижня границя, Верхня межа. У комірки D17 та F17 введіть розрахункові формули та отримайте результат з точністю до четвертого знака після коми.

11. Визначте кількість значень денного прибутку, що знаходяться в межах трьох стандартних відхилень, попередньо відфільтрувавши дані. Обчисліть відсоток значень денного прибутку. Для цього в осередок H16 занесіть мітку Відсоток, а в осередку H17 запрограмуйте формулу обчислення відсотка та отримайте результат з точністю до одного знака після коми.

13. Побудуйте гістограму денного прибутку акцій на біржі та помістіть її разом із таблицею розподілу частот в області J1:S20. Покажіть на гістограмі приблизно середнє значення та інтервали, що відповідають одному, двом та трьом стандартним відхиленням від середнього відповідно.

Характеристики розсіювання

Заходи розкидання вибірки.

Мінімум і максимум вибірки - це відповідно найменше і найбільше значення змінної, що вивчається. Різниця між максимумом та мінімумом називається розмахомвибірки. Всі ці вибірки розташовані в проміжку між мінімумом і максимумом. Ці показники начебто окреслюють межі вибірки.

R № 1 = 15,6-10 = 5,6

R №2 = 0,85-0,6 = 0,25

Дисперсія вибірки(англ. variance) та середнє квадратичне відхиленнявибірки (англ. standard deviation) являють собою міру мінливості змінної та характеризують ступінь розкиду даних навколо центру. При цьому середнє квадратичне відхилення є більш зручним показником через те, що має ту ж розмірність, що і власне досліджувані дані. Тому показник середнього квадратичного відхилення використовується поряд із значенням середньої арифметичної вибірки для короткого опису результатів аналізу даних.

Вибіркову дисперсію за доцільніше вважати за формулою:

Стандартне відхилення вважається за формулою:

Коефіцієнт варіації є відносною мірою розсіювання ознаки.

Коефіцієнт варіації використовується як показник однорідності вибіркових спостережень. Вважається, що й коефіцієнт варіації вбирається у 10 %, то вибірку вважатимуться однорідної, т. е. отриманої з однієї генеральної сукупності.

Коефіцієнт варіації в обох вибірках, то вони є однорідними.

Вибірку можна подати аналітично у вигляді функції розподілу, а також у вигляді таблиці частот, що складається з двох рядків. У верхньому рядку-елементи вибірки (варіанти), розташовані в порядку зростання; у нижньому рядку записуються частоти варіант.

Частота варіанти - число, що дорівнює кількості повторень цієї варіанти у вибірці.

Вибірка №1 «Матері»

Вид кривої розподілу

Асиметріяабо коефіцієнт асиметрії (термін був уперше введений Пірсоном, 1895) є мірою несиметричності розподілу. Якщо асиметрія чітко відрізняється від 0, розподіл асиметричний, щільність нормального розподілу симетрична щодо середнього.

Показник асиметрії(англ. skewness) використовується для того, щоб охарактеризувати ступінь симетричності розподілу даних навколо центру. Асиметрія може приймати як негативні, і позитивні значення. Позитивне значення даного параметра свідчить про те, що дані зміщені вліво від центру, негативне - вправо. Отже, знак показника асиметрії свідчить про напрям зміщення даних, тоді як величина - ступінь цього зміщення. Асиметрія дорівнює нулю свідчить, що дані симетрично сконцентровані навколо центру.

Т.к. асиметрія позитивна, отже вершина кривої зсувається вліво від центру.

Коефіцієнт ексцесу(англ. kurtosis) є характеристикою того, наскільки кучно основна маса даних групується біля центру.

При позитивному ексцесі – крива загострюється, при негативному – згладжується.

Крива згладжується;

Крива загострюється.