Основные параметры малой выборки. Малая выборка

Метод малых выборок

Основным достоинством метода малых выборок является возможность оценить динамику процесса во времени с сокращением времени на вычислительные процедуры.

Случайным образом отбирают мгновенные выборки в определенные периоды времени объемом от 5 до 20 единиц. Период отбора проб устанавливается опытным путем и зависит от устойчивости процесса, определенной при анализе априорной информации.

Для каждой мгновенной выборки определяют основные статистические характеристики. Мгновенные выборки и их основные статистические характеристики представлены в приложении Б.

Выдвигается и проверяется гипотеза об однородности дисперсии выборок при помощи одного из возможного критерия (критерий Фишера).

Проверка гипотезы об однородности выборочных характеристик.

Для проверки значимости различия между средними арифметическими в 2-х сериях измерений вводят меру G. Расчеты приведены в приложении В

Правило принятия решения формулируется следующим образом:

где tр - значение квантиля нормированного распределения при заданной доверительной вероятности Р, ? = 0,095, n = 10, tр =2,78.

При выполнении неравенства подтверждается гипотеза о том, что разница между выборочными средними не значима.

Поскольку неравенство выполняется во всех случаях, то гипотеза о том, что разница между выборочными средними не значима подтверждается.

Для проверки гипотезы об однородности выборочных дисперсий вводят меру F0 как отношение несмещенных оценок дисперсий результатов 2-х серий измерений. Причем большую из 2-х оценок принимают за числитель и если Sx1>Sx2, то

Результаты расчетов приведены в приложении В.

Затем задаются значениями доверительной вероятности Р и определяют значения F(K1; K2; ?/2) при К1 =n1 - 1 и K2=n2 - 1.

При Р=0,025 и К1=10-1=4 и К2=10-1=4 F (9;9;0,025/2) =4,1.

Правило принятия решения: если F(K1; K2; ?/2)>F0, то гипотеза об однородности дисперсий в двух выборках принимается.

Поскольку условие F(K1; K2; ?/2) > F0 выполняется во всех случаях, то гипотеза об однородности дисперсий принимается.

Таким образом, гипотеза об однородности дисперсий выборок подтверждается, что свидетельствует о стабильности процесса; гипотеза об однородности выборочных средних по методу сравнения средних подтверждается, это означает, что центр рассеивания не изменился и процесс находится в стабильном состоянии.

Метод точечных и точностных диаграмм

В течение определенного времени берут мгновенные выборки, объемом от 3 до 10 изделий и определяют статистические характеристики каждой выборки.

Полученные данные наносят на диаграммы, по оси абсцисс которых отложено время? или номера k выборок, а по оси ординат - индивидуальные значения хк или значение одной из статистических характеристик (выборочное среднее арифметическое, выборочное среднее квадратическое отклонение). Кроме того, на диаграмме проводят две горизонтальные линии Тв и Тн, ограничивающие поле допуска изделия.

Мгновенные выборки приведены в приложении В.


Рисунок 1 точностная диаграмма

Диаграмма наглядно отображает ход производственного процесса. По ней можно судить о том, что производственный процесс является нестабильным

Распространение выборочных характеристик на генеральную совокупность, основанное на действии закона больших чисел, предполагает достаточно большой объем выборки. Однако в практике статистического исследования часто приходится сталкиваться с невозможностью по тем или иным причинам увеличить численность единиц выборки, имеющей небольшой объем. Это касается изучения деятельности предприятий, учебных заведений, коммерческих банков и т.д., число которых в регионах, как правило, незначительно, а иногда составляет всего 5-10 единиц.

В том случае когда выборочная совокупность состоит из небольшого числа единиц, менее 30, выборку называют малой. В этом случае для расчета ошибки выборки нельзя пользоваться теоремой Ляпунова, так как на выборочную среднюю значительное влияние оказывает величина каждой из случайно отобранных единиц и ее распределение может существенно отличаться от нормального.

В 1908 году В.С. Госсет доказал, что оценка расхождения между выборочной средней малой выборки и генеральной средней имеет особый закон распределения (см. главу 4). Занимаясь проблемой вероятностной оценки выборочной средней при небольшом числе наблюдений, он показал, что в этом случае нужно рассматривать распределение не самих выборочных средних, а величин их отклонений от средней исходной совокупности. В этом случае заключения могут быть достаточно надежными.

Открытие Стьюдента называют теорией малых выборок.

При оценке результатов малой выборки величина генеральной дисперсии в расчетах не используется. В малых выборках для расчета средней ошибки выборки применяют «исправленную» выборочную дисперсию:

т.е. в отличие от больших выборок в знаменателе вместо п стоит (и - 1). Расчет средней ошибки выборки для малой выборки приведен в табл. 5.7.

Таблица 5.7

Расчет средней ошибки малой выборки

Предельная ошибка малой выборки равна: где t - коэффициент доверия.

Величина t иначе связана с вероятной оценкой, чем при большой выборке. В соответствии с распределением Стьюдента вероятная оценка зависит как от величины t, так и от объема выборки я в случае, если предельная ошибка не превысит г-кратную среднюю ошибку в малых выборках. Однако в большей степени она зависит от числа отобранных единиц.

В.С. Госсет составил таблицу распределения вероятностей в малых выборках, соответствующих данным значениям коэффициента доверия t и разным объемам малой выборки и, выдержка из нее приведена в табл. 5.8.

Таблица 5.8

Фрагмент таблицы вероятностей Стьюдента (вероятности умножены на 1000)

Данные табл. 5.8 свидетельствуют о том, что при неограниченном возрастании объема выборки (я = °°) распределение Стьюдента стремится к нормальному закону распределения, а при я = 20 уже мало от него отличается.

Таблица распределения Стьюдента часто приводится в другой форме, более удобной для практического применения (табл. 5.9).

Таблица 5.9

Некоторые значения (-распределения Стьюдента

Число степеней свободы

для одностороннего интервала

для двустороннего интервала

Р= 0,99

Рассмотрим, как пользоваться таблицей ^распределения. Каждому фиксированному значению п вычисляют число степеней свободы k , где k = п - 1. Для каждого значения степени свободы указана предельная величина t p (t 095 или t 0 99), которая с данной вероятностью Р не будет превышена в силу случайных колебаний результатов выборки. На основе величины t p определяются границы доверительного

интервала

В качестве доверительной вероятности при двусторонней проверке, как правило, используют Р = 0,95 или Р = 0,99, что не исключает выбора и других значений вероятностей. Значение вероятности выбирается исходя из конкретных требований задач, для решения которых применяется малая выборка.

Вероятность выхода значений генеральной средней за пределы доверительного интервала равна q, где q = 1 - р. Это значение весьма мало. Соответственно для рассмотренных вероятностей р оно составляет 0,05 и 0,01.

Малые выборки имеют широкое распространение в технических науках, в биологии, но применять их в статистических исследованиях нужно с большой осторожностью, только при соответствующем теоретическом и практическом обследовании. Использовать малую выборку можно только в том случае, если распределение признака в генеральной совокупности является нормальным или близким к нему, а средняя величина вычисляется по выборочным данным, полученным в результате независимых наблюдений. Кроме того, следует иметь в виду, что точность результатов выборки малого объема ниже, чем при большой выборке.

Статистика малых выборок (small-sample statistics)

Принято считать, что начало С. м. в. или, как ее часто называют, статистике «малых п», было положено в первом десятилетии XX века публикацией работы У. Госсета, в к-рой он поместил t-распределение, постулированное получившим чуть позже мировую известность «студентом». В то время Госсет работал статистиком на пивоваренных заводах Гиннесса. Одна из его обязанностей заключалась в том, чтобы анализировать поступающие друг за другом партии бочонков только что сваренного портера. По причине, к-рую он никогда толком не объяснял, Госсет экспериментировал с идеей существенного сокращения числа проб, отбираемых из очень большого количества бочек, находящихся на складах пивоварни, для выборочного контроля качества портера. Это и привело его к постулированию t-распределения. Так как устав пивоваренных заводов Гиннесса запрещал публикацию их работниками результатов исслед., Госсет опубликовал результаты своего эксперимента по сравнению выборочного контроля качества с использованием t-распределения для малых выборок и традиционного z-распределения (нормального распределения) анонимно, под псевдонимом «Студент» (Student - откуда и пошло название t -распределение Стьюдента).

t-распределение. Теория t-распределения, подобно теории z-распределения, используется для проверки нулевой гипотезы о том, что две выборки представляют собой просто случайные выборки из одной генеральной совокупности и, следовательно, вычисленные статистики (напр., среднее и стандартное отклонение) яв-ся несмещенными оценками параметров генеральной совокупности. Однако, в отличие от теории нормального распределения, теория t-распределения для малых выборок не требует априорного знания или точных оценок математического ожидания и дисперсии генеральной совокупности. Более того, хотя проверка различия между средними двух больших выборок на статистическую значимость требует принципиального допущения о нормальном распределении характеристик генеральной совокупности, теория t-распределения не требует допущений относительно параметров.

Общеизвестно, что нормально распределенные характеристики описываются одной единственной кривой - кривой Гаусса, к-рая удовлетворяет следующему уравнению:

При t-распределении целое семейство кривых представлено следующей формулой:

Вот почему уравнение для t включает гамма-функцию, которая в математике означает, что при изменении п данному уравнению будет удовлетворять другая кривая.

Степени свободы

В уравнении для t буквой п обозначается число степеней свободы (df), сопряженных с оценкой дисперсии генеральной совокупности (S2), к-рая представляет собой второй момент любой производящей функции моментов, такой, напр., как уравнение для t-распределения. В С. число степеней свободы указывает на то, сколько характеристик осталось свободным после их частичного использования в конкретном виде анализа. В t-распределении одно из отклонений от выборочного среднего всегда фиксировано, так как сумма всех таких отклонений должна равняться нулю. Это сказывается на сумме квадратов при вычислении выборочной дисперсии как несмещенной оценки параметра S2 и ведет к тому, что df получается равным числу измерений минус единица для каждой выборки. Отсюда, в формулах и процедурах вычисления t-статистики для проверки нулевой гипотезы df = n - 2.

F-pacnpeделение. Проверяемая с помощью t-критерия нулевая гипотеза состоит в том, что две выборки были случайным образом извлечены из одной генеральной совокупности или же были случайно извлечены из двух разных совокупностей с одинаковой дисперсией. А что делать, если нужно провести анализ большего числа групп? Ответ на этот вопрос искали в течение двадцати лет после того, как Госсет открыл t-распределение. Два самых выдающихся статистика XX столетия непосредственно причастны к его получению. Один - крупнейший английский статистик Р. А. Фишер, предложивший первые теорет. формулировки, развитие к-рых привело к получению F-распределения; его работы по теории малых выборок, развивающие идеи Госсета, были опубликованы в середине 20-х годов (Fisher, 1925). Другой - Джордж Снедекор, один из плеяды первых американских статистиков, разработавший способ сравнения двух независимых выборок любого объема посредством вычисления отношения двух оценок дисперсии. Он назвал это отношение F-отношением, в честь Фишера. Результаты исслед. Снедекора привели к тому, что F-распределение стало задаваться как распределение отношения двух статистик с2, каждой со своими степенями свободы:

Из этого вышли классические работы Фишера по дисперсионному анализу - статистическому методу, явно ориентированному на анализ малых выборок.

Выборочное распределение F (где п = df) представлено следующим уравнением:

Как и в случае t-распределения, гамма-функция указывает на то, что существует семейство распределений, удовлетворяющих уравнению для F. В этом случае, однако, анализ включает два величины df: число степеней свободы для числителя и для знаменателя F-отношения.

Таблицы для оценивания t- и F-статистик. При проверке нулевой гипотезы с помощью С., основанных на теории больших выборок, обычно требуется только одна справочная таблица - таблица нормальных отклонений (z), позволяющая определить площадь под нормальной кривой между любыми двумя значениями z на оси абсцисс. Однако таблицы для t- и F-распределений по необходимости представлены комплектом таблиц, поскольку эти таблицы основаны на множестве распределений, полученных вследствие варьирования числа степеней свободы. Хотя t- и F-распределения представляют собой распределения плотности вероятности, как и нормальное распределение для больших выборок, они отличаются от последнего в отношении четырех моментов, используемых для их описания. t-распределение, напр., является симметричным (обратите внимание на t2 в его уравнении) при всех df, но становится все более островершинным по мере уменьшения объема выборки. Островершинные кривые (с эксцессом больше нормального) имеют тенденцию быть менее асимптотическими (т. е. меньше приближаться к оси абсцисс на концах распределения), чем кривые с нормальным эксцессом, такие как кривая Гаусса. Это различие приводит к заметным расхождениям между точками на оси абсцисс, соответствующими значениям t и z. При df = 5 и двустороннем уровне а, равном 0,05, t = 2,57, тогда как соответствующее z = 1,96. Следовательно, t = 2,57 свидетельствует о статистической значимости на 5% уровне. Однако в случае нормальной кривой z = 2,57 (точнее 2,58) будет уже указывать на 1% уровень статистической значимости. Аналогичные сравнения можно провести и с F-распределением, поскольку t равно F в случае, когда число выборок равно двум.

Что составляет «малую» выборку?

В свое время был поднят вопрос о том, какой объем должна иметь выборка, чтобы ее можно было считать малой. Определенного ответа на этот вопрос просто не существует. Однако условной границей между малой и большой выборкой принято считать df = 30. Основанием для этого в какой-то мере произвольного решения служит результат сравнения t-распределения с нормальным распределением. Как уже отмечалось выше, расхождение значений t и z имеет тенденцию возрастать с уменьшением и снижаться с увеличением df. Фактически, t начинает тесно приближаться к z задолго до предельного случая, когда t = z при df = ∞. Простое визуальное изучение табличных значений t позволяет увидеть, что это приближение становиться довольно быстрым, начиная с df = 30 и выше. Сравнительные величины t (при df = 30) и z равны соответственно: 2,04 и 1,96 для р = 0,05; 2,75 и 2,58 для р = 0,01; 3,65 и 3,29 для р = 0,001.

Другие статистики для «малых» выборок

Хотя такие статистические критерии, как t и F, специально разработаны для применения к малым выборкам, они в равной степени применимы и к большим выборкам. Существует, однако, множество др. статистических методов, предназначенных для анализа малых выборок и часто используемых именно для этой цели. Имеются в виду т. н. непараметрические или свободные от распределения методы. В основном, фигурирующие в этих методах С. предназначены для применения к измерениям, полученным с помощью шкал, не удовлетворяющих определению шкал отношений или интервалов. Чаще всего это порядковые (ранговые) или номинальные измерения. Непараметрические С. не требуют предположений в отношении параметров распределения, в частности, в отношении оценок дисперсии, потому что порядковые и номинальные шкалы исключают само понятие дисперсии. По этой причине непараметрические методы используются также для измерений, полученных с помощью интервальных шкал и шкал отношений, когда анализируются малые выборки и существует вероятность того, что нарушаются основные предположения, необходимые для применения параметрических методов. К числу таких С., к-рые можно обоснованно применять к малым выборкам, относятся: критерий точной вероятности Фишера, двухфакторный непараметрический (ранговый) дисперсионный анализ Фридмана, коэффициент ранговой корреляции t Кендалла, коэффициент конкордации (W) Кендалла, H-критерий Краскела - Уоллеса для непараметрического (рангового) однофакторного дисперсионного анализа, U-критерий Манна-Уитни, медианный критерий, критерий знаков, коэффициент ранговой корреляции r Спирмена и t-критерий Уилкоксона.

При изучении изменчивости выделяют признаки количественные и качественные, изучением которых занимается вариационная статистика в основе которой лежит теория вероятности. Вероятность указывает возможную частоту встречи особи с тем или иным признаком. P=m/n, где m-число особей с данной величиной признака; n-число всех особей в группе. Вероятность колеблется от 0 до 1 (например вероятность равна 0,02- появление двойни в стаде, т.е. значит на 100 отёлов появится две двойни). Таким образом объектом изучения биометрии является варьирующий признак, изучение которого осуществляется на определённой группе объектов т.е. совокупности. Различают генеральную и выборочную совокупность. Генеральная совокупность это многочисленная группа особей, которая нас интересует по изучаемому признаку. В генеральную совокупность может входить вид животных, породы одного и того же вида. В генеральную совокупность (породу) входит несколько миллионов животных. В тоже время порода расходится на много совокупностей т.е. стада отдельных хозяйств. Так как генеральная совокупность состоит из большого числа особей, то изучить её технически сложно. Поэтому изучают не всю генеральную совокупность, а только её часть, которая называется выборной или выборочной совокупностью .

По выборочной совокупности делают суждение о всей генеральной совокупности в целом. Выборка должна осуществляться по всем правилам, куда должны входить особи со всеми значениями варьирующего признака. Отбор особей из генеральной совокупности осуществляется по принципу случайности или методом жеребьёвки. В биометрии выделяют два типа случайной выборки: большая и малая. Большой выборкой называют такую, куда входит больше 30 особей или наблюдений, а малой выборкой меньше 30 особей. Для большой и малой выборочной совокупности существуют различные методы обработки данных. Источником статистической информации могут служить данные зоотехнического и ветеринарного учёта, где даётся информация о каждом животном от рождения до его выбытия. Другим источником информации могут служить данные научно-производственных опытов, проводимые на ограниченном числе животных. После того как получена выборочная совокупность приступают к её обработке. Это позволяет получить в виде математических величин ряд статистических величин или коэффициентов, которые характеризуют признаки интересующих групп животных.

Биометрическим методом получают следующие статистические параметры или показатели:

1. Средние величины варьирующего признака (средняя арифметическая величина, мода, медиана, средняя геометрическая величина).

2. Коэффициенты, измеряющие величину варьирования т.е. (изменчивости) изучаемого признака (среднее квадратическое отклонение, коэффициент вариации).

3. Коэффициенты, измеряющие величину связи между признаками (коэффициент корреляции, регрессии и корреляционное отношение).

4. Статистические ошибки и достоверность получаемых статистических данных.

5. Долю варьирования возникающая под действием различных факторов и другие показатели, которые связаны с изучением генетических и селекционных проблем.

При статистической обработке выборки члены совокупности организуются в виде вариационного ряда. Вариационным рядом называется группировка особей на классы в зависимости от величины изучаемого признака. Вариационный ряд состоит из двух элементов: из классов и ряда частот. Вариационный ряд может быть прерывистым и непрерывным. Признаки, которые могут принимать только целое число называют прерывистым числом голов, число яиц, число поросят и другие. Признаки, которые могут выражаться дробными числами называются непрерывистыми (рост см, удой кг, % жира, живая масса и другие).

При построении вариационного ряда придерживаются следующих принципов или правил:

1. Определяют или подсчитывают количество особей для которых будет построен вариационный ряд (n).

2. Находят мах и min величину изучаемого признака.

3. Определяют классный промежуток К=мах - min/ к-во классов, количество классов берётся произвольно.

4. Строят классы и определяют границу каждого класса, min+К.

5. Делают разноску членов совокупности по классам.

После построения классов и распределения особей по классам вычисляют основные показатели вариационного ряда (Х, σ, Cv, Mх, Мσ, Мcv). Наибольшее значение при характеристике совокупности получила средняя величина признака. При решении всех зоотехнических, ветеринарных, медицинских, экономических и других задач всегда определяют среднюю величину признака (средний удой по стаду, % жира, плодовитость в свиноводстве, яйценоскость у кур и другие признаки). В число параметров, характеризующих среднее значение признака входят следующие:

1. Средняя арифметическая величина.

2. Средне взвешенная арифметическая.

3. Средняя геометрическая.

4. Мода (Мо).

5. Медиана (Ме) и другие параметры.

Средняя арифметическая величина показывает нам какую величину признаков имели особи данной группы, если он был одинаков для всех, и определяется по формуле Х=А+в× К

Основным свойством средней арифметической величины является то, что она как бы устраняет варьирование признака и делает его общим для всей совокупности. В тоже время необходимо отметить, что средняя арифметическая величина принимает абстрактное значение, т.е. при её вычислении получают дробные показатели, в действительности которых может и не быть. Например: выход телят на 100 коров-85,3 телёнка, плодовитость свиноматок 11,8 поросят, яйценоскость кур 252,4 яйца и другие показатели.

Значение средней арифметической величины очень велико в практике животноводства и характеристики популяции. В практике животноводства в частности скотоводства используют средне взвешенную арифметическую величину при определении среднего содержания жира в молоке за лактацию.

Средняя геометрическая величина вычисляется в том случае, если необходимо характеризовать темп роста, темп увеличения популяции, когда средняя арифметическая величина искажает данные.

Модой называют чаще всего встречающуюся величину варьирующего признака, как количественного, так и качественного. Модальным числом у коровы является число сосков-4. Хотя встречаются коровы с пятью, шестью сосками. В вариационном ряду модальным классом будет тот класс, где имеется наибольшее количество частот и мы его определяем как нулевой класс.

Медианой называется варианта, которая делит всех членов совокупности на две равные части. Половина членов совокупности будет иметь величину варьирующего признака меньше медианы, а другая больше медианы (например: стандарт породы). Медиана чаще всего используется для характеристики качественных признаков. Например: форма вымени чашеобразная, округлая, козье. При правильной выборке вариант все три показателя должны быть одинаковы (т.е. Х, Мо, Ме). Таким образом первой характеристикой совокупности служат средние величины, однако для суждения о совокупности их недостаточно.

Вторым важным показателем любой совокупности является изменчивость или вариабильность признака. Изменчивость признака обуславливается многими факторами внешней среды и внутренними факторами т.е. наследственными факторами.

Определение изменчивости признака имеет большое значение, как в биологии, так и в практике животноводства. Так с помощью статистических параметров измеряющих степень изменчивости признака можно установить породные различия в степени изменчивости различных хозяйственно-полезных признаков, прогнозировать уровень отбора в различных группах животных, а также его эффективность.

Современное состояние статистического анализа позволяет не только устанавливать степень проявления фенотипической изменчивости, но и разделить фенотипическую изменчивость на составляющие её типы, а именно на генотипическую и паратипическую изменчивость. Это разложение изменчивости делается с помощью дисперсионного анализа.

Основными показателями изменчивости служат следующие статистические величины:

1. Лимиты;

2. Среднее квадратическое отклонение (σ);

3. Коэффициент изменчивости или вариации (Сv).

Наиболее простой способ представить величину изменчивости признака помогают нам лимиты. Лимиты определяются следующим образом: разница между мах и min значением признака. Чем больше эта разница, тем больше изменчивость этого признака. Основным параметром измерения изменчивости признака служит среднее квадратическое отклонение или (σ) и определяется по формуле:

σ = ±К ∙ √∑Pa 2 - b 2

Основными свойствами среднего квадратического отклонения т.е. (σ) являются следующие:

1. Сигма всегда величина именованная и выражается (в кг, г, метрах, см, шт.).

2. Сигма всегда величина положительная.

3. Чем больше величина σ, тем больше изменчивость признака.

4. В вариационном ряду все частоты вкладываются в ±3σ.

С помощью среднего квадратического отклонения можно определить к какому вариационному ряду относится данная особь. Методы определения изменчивости признака с помощью лимитов и среднего квадратического отклонения имеют свои недостатки, так как сопоставить разноимённые признаки по величине изменчивости невозможно. Необходимо знать изменчивость разных признаков у одного и того же животного или одной и той же группы животных, например: изменчивость удоя, содержания жира в молоке, живой массы, количества молочного жира. Поэтому сопоставляя изменчивость разноимённых признаков и выявляя степень их изменчивости рассчитывают коэффициент изменчивости по следующей формуле:

Таким образом, основными методами оценки изменчивости признаков у членов совокупности являются: лимиты; среднее квадратическое отклонение (σ) и коэффициент вариации или изменчивости.

В практике животноводства и экспериментальных исследованиях очень часто приходится иметь дело с малыми выборками. Малой выборкой называют число особей или животных не превышающее 30 или меньше 30. Установленные закономерности с помощью малой выборки переносятся на всю генеральную совокупность. У малой выборки определяют те же самые статистические параметры, что и у большой выборочной совокупности (Х, σ, Cv, Mx). Однако формулы и расчёты их отличаются от большой выборки (т.е. от формул и расчётов вариационного ряда).

1. Средняя арифметическая величина Х = ∑V

V- абсолютное значение варианты или признака;

n- число вариант или число особей.

2. Среднее квадратическое отклонение σ = ± √∑α 2

α = х-¯х, это разность между значением варианты и средней арифметической величиной. Эту разность α возводят в квадрат и получают α 2 n-1 число степеней свободы, т.е. количество всех вариант или особей уменьшенное на единицу (1).

Контрольные вопросы :

1.Что такое биометрия?

2.Какие статистические параметры характеризуют совокупность?

3.Какие показатели характеризуют изменчивость?

4.Что такое малая выборка

5. Что такое мода и медиана?

Лекция № 12

Биотехнология и трансплантация эмбрионов

1. Понятие о биотехнологии.

2. Отбор коров- доноров и реципиентов, трансплантация эмбрионов.

3. Значение трансплантации в животноводстве.

В практике статистических исследований часто приходится сталкиваться с малыми выборками , которые имеют объем менее 30 единиц. К большим же обычно относят выборки объемом свыше 100 единиц.

Обычно малые выборки применяются в случаях, когда невозможно или нецелесообразно использовать большую выборку. Иметь дело с такими выборками приходится, например, при опросах туристов и посетителей гостиниц.

Величина ошибки малой выборки определяется по формулам, отличающимся от формул для сравнительно большого объема выборки ().

При малом объеме выборки n следует учитывать взаимосвязь между выборочной и генеральной дисперсией :

Так как при малой выборке дробь имеет существенное значение, то вычисление дисперсии производится с учетом, так называемого числа степеней свободы . Оно понимается как число вариантов , которые могут принимать произвольные значения, не меняя величины средней .

Средняя ошибка малой выборки определяется по формуле:

Предельная ошибка выборки для средней и доли находится аналогично случаю большой выборки:

где t – коэффициент доверия, зависящий от заданного уровня значимости и числа степеней свободы (Приложение 5).

Значения коэффициента зависят не только от заданной доверительной вероятности , но и от объема выборки n . Для отдельных значений t и n доверительная вероятность определяется по распределению Стьюдента, которое содержит распределения стандартизованных отклонений:

Замечание. По мере увеличения объема выбор­ки распределение Стьюдента приближается к нормальному распределению: при n =20 оно уже мало отличается от нормального распределе­ния. При проведении малых выборочных обследований следует учесть, что чем меньше объем выборки n , тем больше раз­личие между распределением Стьюдента и нормальным рас­пределением. Например, при п min . = 4 это различие весьма существенно, что говорит об уменьшении точности результатов малой выборки.