მცირე ნიმუშის ძირითადი პარამეტრები. მცირე ნიმუში

მცირე ნიმუშის მეთოდი

მცირე ნიმუშის მეთოდის მთავარი უპირატესობა არის პროცესის დინამიკის დროთა განმავლობაში შეფასების შესაძლებლობა, გამოთვლითი პროცედურების დროის შემცირება.

მყისიერი ნიმუშები შემთხვევითად არის შერჩეული დროის გარკვეულ პერიოდებში 5-დან 20 ერთეულამდე. შერჩევის პერიოდი დადგენილია ემპირიულად და დამოკიდებულია პროცესის სტაბილურობაზე, რომელიც განისაზღვრება აპრიორი ინფორმაციის ანალიზით.

ყოველი მყისიერი ნიმუშისთვის განისაზღვრება ძირითადი სტატისტიკური მახასიათებლები. მყისიერი ნიმუშები და მათი ძირითადი სტატისტიკური მახასიათებლები წარმოდგენილია დანართ B-ში.

ჰიპოთეზა ნიმუშის დისპერსიის ჰომოგენურობის შესახებ წამოაყენეს და შემოწმებულია ერთ-ერთი შესაძლო კრიტერიუმის გამოყენებით (ფიშერის კრიტერიუმი).

ნიმუშის მახასიათებლების ჰომოგენურობის შესახებ ჰიპოთეზის შემოწმება.

გაზომვების 2 სერიაში არითმეტიკული საშუალებების სხვაობის მნიშვნელობის შესამოწმებლად, გაზომვები მოცემულია B დანართში

გადაწყვეტილების წესი ჩამოყალიბებულია შემდეგნაირად:

სადაც tr არის ნორმალიზებული განაწილების კვანტილის მნიშვნელობა მოცემული ნდობის ალბათობით P, ? = 0.095, n = 10, tр =2.78.

როდესაც უთანასწორობა დაკმაყოფილებულია, დადასტურებულია ჰიპოთეზა, რომ სხვაობა შერჩევის საშუალებებს შორის არ არის მნიშვნელოვანი.

ვინაიდან უთანასწორობა ყველა შემთხვევაში დაკმაყოფილებულია, დადასტურებულია ჰიპოთეზა, რომ სხვაობა შერჩევის საშუალებებს შორის არ არის მნიშვნელოვანი.

ნიმუშის დისპერსიების ჰომოგენურობის შესახებ ჰიპოთეზის შესამოწმებლად, F0 საზომი შემოღებულია, როგორც გაზომვების 2 სერიის შედეგების დისპერსიების მიუკერძოებელი შეფასებების თანაფარდობა. უფრო მეტიც, 2 შეფასებიდან უფრო დიდი მიიღება მრიცხველად და თუ Sx1>Sx2, მაშინ

გაანგარიშების შედეგები მოცემულია დანართ B-ში.

შემდეგ მითითებულია ნდობის ალბათობის P მნიშვნელობები და F(K1; K2; ?/2) მნიშვნელობები განისაზღვრება K1 = n1 - 1 და K2 = n2 - 1.

P = 0,025 და K1 = 10-1 = 4 და K2 = 10-1 = 4 F (9;9;0,025/2) =4,1.

გადაწყვეტილების წესი: თუ F(K1; K2; ?/2)>F0, მაშინ მიღებულია ჰიპოთეზა ორ ნიმუშში განსხვავებების ერთგვაროვნების შესახებ.

ვინაიდან პირობა F(K1; K2; ?/2) > F0 დაკმაყოფილებულია ყველა შემთხვევაში, მიღებულია ვარიაციების ჰომოგენურობის ჰიპოთეზა.

ამრიგად, დასტურდება ჰიპოთეზა სინჯის ვარიაციების ჰომოგენურობის შესახებ, რაც მიუთითებს პროცესის სტაბილურობაზე; დადასტურებულია ჰიპოთეზა სანიმუშო საშუალებების ჰომოგენურობის შესახებ საშუალებების შედარების მეთოდის გამოყენებით, რაც ნიშნავს, რომ დისპერსიის ცენტრი არ შეცვლილა და პროცესი სტაბილურ მდგომარეობაშია.

სკატერისა და სიზუსტის ნახაზების მეთოდი

გარკვეული პერიოდის განმავლობაში აღებულია 3-დან 10 პროდუქტის მყისიერი ნიმუშები და განისაზღვრება თითოეული ნიმუშის სტატისტიკური მახასიათებლები.

მიღებული მონაცემები გამოსახულია დიაგრამებზე დროის მიხედვით აბსცისის ღერძზე? ან ნიმუშების k რიცხვები, ხოლო ორდინატთა ღერძზე - xk-ის ინდივიდუალური მნიშვნელობები ან ერთ-ერთი სტატისტიკური მახასიათებლის მნიშვნელობა (საშუალო არითმეტიკული ნიმუში, ნიმუშის სტანდარტული გადახრა). გარდა ამისა, დიაგრამაზე დახაზულია ორი ჰორიზონტალური ხაზი Тв და Тн, რაც ზღუდავს პროდუქტის ტოლერანტობის დიაპაზონს.

მყისიერი ნიმუშები მოცემულია დანართ B-ში.


სურათი 1 სიზუსტის სქემა

დიაგრამა ნათლად აჩვენებს წარმოების პროცესის პროგრესს. ის შეიძლება გამოყენებულ იქნას იმის აღსანიშნავად, რომ წარმოების პროცესი არასტაბილურია

ნიმუშის მახასიათებლების გაფართოება ზოგად პოპულაციაზე, დიდი რიცხვების კანონის საფუძველზე, მოითხოვს საკმარისად დიდ შერჩევის ზომას. თუმცა, სტატისტიკური კვლევის პრაქტიკაში ხშირად აწყდება შეუძლებლობა, ამა თუ იმ მიზეზის გამო, მცირე ზომის ნიმუშის ერთეულების რაოდენობის გაზრდა. ეს ეხება საწარმოების, საგანმანათლებლო დაწესებულებების, კომერციული ბანკების და სხვა საქმიანობის შესწავლას, რომელთა რაოდენობა რეგიონებში, როგორც წესი, უმნიშვნელოა და ზოგჯერ მხოლოდ 5-10 ერთეულს შეადგენს.

იმ შემთხვევაში, როდესაც შერჩევის პოპულაცია შედგება მცირე რაოდენობის ერთეულებისგან, 30-ზე ნაკლები, ნიმუში ეწოდება პატარაამ შემთხვევაში, ლიაპუნოვის თეორემა არ შეიძლება გამოყენებულ იქნას შერჩევის შეცდომის გამოსათვლელად, რადგან შერჩევის საშუალო მნიშვნელობა მნიშვნელოვნად არის დამოკიდებული შემთხვევით შერჩეული თითოეული ერთეულის მნიშვნელობაზე და მისი განაწილება შეიძლება მნიშვნელოვნად განსხვავდებოდეს ნორმალურისგან.

1908 წელს ვ.ს. გოსეტმა დაამტკიცა, რომ მცირე ნიმუშის შერჩევის საშუალოსა და ზოგად საშუალოს შორის შეუსაბამობის შეფასებას აქვს სპეციალური განაწილების კანონი (იხ. თავი 4). მცირე რაოდენობის დაკვირვებით შერჩეული საშუალოს ალბათური შეფასების პრობლემასთან დაკავშირებით, მან აჩვენა, რომ ამ შემთხვევაში აუცილებელია გავითვალისწინოთ არა თავად ნიმუშის საშუალებების განაწილება, არამედ მათი გადახრების სიდიდე საშუალოდან. ორიგინალური მოსახლეობა. ამ შემთხვევაში, დასკვნები შეიძლება იყოს საკმაოდ სანდო.

სტუდენტის აღმოჩენა ე.წ მცირე ნიმუშის თეორია.

მცირე ნიმუშის შედეგების შეფასებისას, ზოგადი დისპერსიის მნიშვნელობა არ გამოიყენება გამოთვლებში. მცირე ნიმუშებში, "შესწორებული" ნიმუშის ვარიაცია გამოიყენება შერჩევის საშუალო შეცდომის გამოსათვლელად:

იმათ. მნიშვნელში დიდი ნიმუშებისგან განსხვავებით ხარჯები (და - 1). შერჩევის საშუალო შეცდომის გამოთვლა მცირე ნიმუშისთვის მოცემულია ცხრილში. 5.7.

ცხრილი 5.7

მცირე ნიმუშის საშუალო ცდომილების გაანგარიშება

მცირე ნიმუშის ზღვრული შეცდომაა: სად - ნდობის ფაქტორი.

მაგნიტუდა განსხვავებულად ეხება სავარაუდო შეფასებას, ვიდრე დიდ ნიმუშს. სტუდენტური განაწილების შესაბამისად, სავარაუდო შეფასება დამოკიდებულია ორივე მნიშვნელობაზე ტ,ხოლო ნიმუშის ზომაზე I იმ შემთხვევაში, თუ ზღვრული ცდომილება არ აღემატება r-ჯერ საშუალო ცდომილებას მცირე ნიმუშებში. თუმცა, ეს დიდწილად დამოკიდებულია არჩეული ერთეულების რაოდენობაზე.

ვ.ს. გოსეტმა შეადგინა ალბათობის განაწილების ცხრილი მცირე ნიმუშებში, რომლებიც შეესაბამება ნდობის კოეფიციენტის მოცემულ მნიშვნელობებს და მცირე ნიმუშის სხვადასხვა ტომი და, მისგან ამონაწერი მოცემულია ცხრილში. 5.8.

ცხრილი 5.8

სტუდენტის ალბათობის ცხრილის ფრაგმენტი (ალბათობა გამრავლებული 1000-ზე)

ცხრილის მონაცემები 5.8 მიუთითებს, რომ ნიმუშის ზომის შეუზღუდავი ზრდით (i = °°), სტუდენტური განაწილება მიდრეკილია ნორმალური განაწილების კანონისკენ, და i = 20-ზე იგი ცოტათი განსხვავდება მისგან.

სტუდენტური განაწილების ცხრილი ხშირად მოცემულია სხვა ფორმით, უფრო მოსახერხებელი პრაქტიკული გამოყენებისთვის (ცხრილი 5.9).

ცხრილი 5.9

ზოგიერთი მნიშვნელობა (სტუდენტის t-განაწილება

თავისუფლების ხარისხების რაოდენობა

ცალმხრივი ინტერვალისთვის

ორმხრივი დაშორებისთვის

P= 0,99

მოდით შევხედოთ როგორ გამოვიყენოთ განაწილების ცხრილი. თითოეული ფიქსირებული ღირებულება გამოთვალეთ თავისუფლების გრადუსების რაოდენობა , სად k = n - 1. თავისუფლების ხარისხის თითოეული სიდიდეზე მითითებულია ზღვრული მნიშვნელობა t p (t 095ან t 0 99), რომელიც მოცემული ალბათობით არ იქნება გადაჭარბებული შერჩევის შედეგების შემთხვევითი რყევების გამო. სიდიდის მიხედვით t გვგანსაზღვრულია ნდობის საზღვრები

ინტერვალი

როგორც წესი, გამოიყენება ორმხრივი ტესტირების ნდობის დონე P = 0,95 ან P = 0.99, რაც არ გამორიცხავს სხვა ალბათობის მნიშვნელობების არჩევანს. ალბათობის მნიშვნელობა შეირჩევა იმ ამოცანების სპეციფიკური მოთხოვნების საფუძველზე, რომლებისთვისაც გამოიყენება მცირე ნიმუში.

საერთო საშუალო მნიშვნელობების ალბათობა, რომელიც სცილდება ნდობის ინტერვალს, უდრის q,სად = 1 - რ.ეს ღირებულება ძალიან მცირეა. შესაბამისად განხილული ალბათობებისთვის ეს არის 0.05 და 0.01.

მცირე ნიმუშები ფართოდ არის გავრცელებული ტექნიკურ მეცნიერებებში და ბიოლოგიაში, მაგრამ ისინი უნდა იქნას გამოყენებული სტატისტიკურ კვლევებში დიდი სიფრთხილით, მხოლოდ შესაბამისი თეორიული და პრაქტიკული გამოკვლევით. მცირე ნიმუშის გამოყენება შესაძლებელია მხოლოდ იმ შემთხვევაში, თუ პოპულაციაში მახასიათებლის განაწილება ნორმალურია ან მასთან ახლოს, ხოლო საშუალო მნიშვნელობა გამოითვლება დამოუკიდებელი დაკვირვების შედეგად მიღებული ნიმუშის მონაცემებით. გარდა ამისა, გახსოვდეთ, რომ მცირე ზომის ნიმუშის შედეგების სიზუსტე უფრო დაბალია, ვიდრე დიდი ნიმუშის ზომიდან.

მცირე ნიმუშის სტატისტიკა

ზოგადად მიღებულია, რომ დასაწყისი S. m.v. ან, როგორც მას ხშირად უწოდებენ, "მცირე n" სტატისტიკა, დაარსდა მე-20 საუკუნის პირველ ათწლეულში, W. Gosset-ის ნაშრომის გამოქვეყნებით, რომელშიც მან მოათავსა "სტუდენტის" მიერ პოსტულირებული t-განაწილება. მსოფლიო პოპულარობა ცოტა მოგვიანებით მოიპოვა. იმ დროს გოსეტი გინესის ლუდსახარშში სტატისტიკოსად მუშაობდა. მისი ერთ-ერთი მოვალეობა იყო ახლად მოხარშული პორტერის კასრების თანმიმდევრული პარტიების ანალიზი. იმ მიზეზის გამო, რის გამოც მას ნამდვილად არასოდეს განუმარტა, გოსეტმა ექსპერიმენტი ჩაატარა ლუდსახარშის საწყობებში კასრებიდან მიღებული ნიმუშების რაოდენობის საგრძნობლად შემცირების იდეით, რათა შემთხვევით აკონტროლოს პორტერის ხარისხი. ამან აიძულა იგი პოსტულაციური t-განაწილება. იმის გამო, რომ გინესის ლუდსახარშების წესდება კრძალავდა თანამშრომლებს კვლევის შედეგების გამოქვეყნებას, გოსეტმა გამოაქვეყნა თავისი ექსპერიმენტის შედეგები, რომელიც ადარებდა ხარისხის კონტროლის ნიმუშებს t-დისტრიბუციის გამოყენებით მცირე ნიმუშებისთვის და ტრადიციული z-დისტრიბუცია (ნორმალური განაწილება) ანონიმურად, ფსევდონიმით "სტუდენტი". " - აქედან მომდინარეობს სახელწოდება Student's t-distribution).

t-განაწილება. t-განაწილების თეორია, ისევე როგორც z-განაწილების თეორია, გამოიყენება ნულოვანი ჰიპოთეზის შესამოწმებლად, რომ ორი ნიმუში არის უბრალოდ შემთხვევითი ნიმუშები ერთი და იგივე პოპულაციისგან და, შესაბამისად, გამოთვლილი სტატისტიკა (მაგ. საშუალო და სტანდარტული გადახრა) არის პოპულაციის პარამეტრების მიუკერძოებელი შეფასება. თუმცა, ნორმალური განაწილების თეორიისგან განსხვავებით, t-განაწილების თეორია მცირე ნიმუშებისთვის არ საჭიროებს აპრიორულ ცოდნას ან ზუსტ შეფასებას მოსალოდნელი მნიშვნელობისა და პოპულაციის ვარიაციის შესახებ. უფრო მეტიც, მიუხედავად იმისა, რომ სტატისტიკური მნიშვნელობისთვის ორი დიდი ნიმუშის საშუალებებს შორის სხვაობის ტესტირება მოითხოვს ფუნდამენტურ დაშვებას, რომ პოპულაციის მახასიათებლები ნორმალურად არის განაწილებული, t განაწილების თეორია არ საჭიროებს ვარაუდებს პარამეტრების შესახებ.

ცნობილია, რომ ნორმალურად განაწილებული მახასიათებლები აღწერილია ერთი მრუდით - გაუსის მრუდით, რომელიც აკმაყოფილებს შემდეგ განტოლებას:

t-განაწილებით, მრუდების მთელი ოჯახი წარმოდგენილია შემდეგი ფორმულით:

ამიტომაც t-ის განტოლება მოიცავს გამა ფუნქციას, რაც მათემატიკაში ნიშნავს, რომ n-ის ცვლილებისას განსხვავებული მრუდი დააკმაყოფილებს მოცემულ განტოლებას.

Თავისუფლების ხარისხები

t-ის განტოლებაში ასო n აღნიშნავს თავისუფლების ხარისხების რაოდენობას (df), რომელიც დაკავშირებულია პოპულაციის ვარიაციის შეფასებასთან (S2), რომელიც წარმოადგენს ნებისმიერი მომენტის გენერირების ფუნქციის მეორე მომენტს, როგორიცაა t განაწილების განტოლება. . ს.-ში თავისუფლების ხარისხების რაოდენობა მიუთითებს იმაზე, თუ რამდენი მახასიათებელი რჩება თავისუფალი კონკრეტული ტიპის ანალიზში მათი ნაწილობრივი გამოყენების შემდეგ. t-განაწილებაში, ერთ-ერთი გადახრები ნიმუშის საშუალოდან ყოველთვის ფიქსირდება, რადგან ყველა ასეთი გადახრის ჯამი უნდა იყოს ნულის ტოლი. ეს გავლენას ახდენს კვადრატების ჯამზე ნიმუშის დისპერსიის გაანგარიშებისას, როგორც პარამეტრის S2 მიუკერძოებელი შეფასება და იწვევს df გაზომვების რაოდენობის ტოლს მინუს ერთი თითოეული ნიმუშისთვის. აქედან გამომდინარე, t-სტატისტიკის გამოთვლის ფორმულებში და პროცედურებში ნულოვანი ჰიპოთეზის შესამოწმებლად, df = n - 2.

F-pacndivision. t ტესტით შემოწმებული ნულოვანი ჰიპოთეზა არის ის, რომ ორი ნიმუში შემთხვევით იქნა შედგენილი ერთი და იგივე პოპულაციისგან ან შემთხვევით იქნა შედგენილი ორი განსხვავებული პოპულაციიდან ერთი და იგივე დისპერსიით. მაგრამ რა მოხდება, თუ მეტი ჯგუფის ანალიზი გჭირდებათ? ამ კითხვაზე პასუხს ოცი წლის განმავლობაში ეძებდნენ მას შემდეგ, რაც გოსეტმა აღმოაჩინა t-განაწილება. მის წარმოებაში უშუალოდ მონაწილეობდა მე-20 საუკუნის ორი ყველაზე გამოჩენილი სტატისტიკოსი. ერთ-ერთი ყველაზე დიდი ინგლისელი სტატისტიკოსი რ.ა. ფიშერია, რომელმაც შემოგვთავაზა პირველი თეორიები. ფორმულირებები, რომელთა განვითარებამ გამოიწვია F-დისტრიბუციის წარმოება; მისი ნაშრომი მცირე ნიმუშის თეორიაზე, გოსეს იდეების განვითარების შესახებ, გამოქვეყნდა 20-იანი წლების შუა ხანებში (ფიშერი, 1925). მეორე არის ჯორჯ სნედეკორი, ადრეული ამერიკელი სტატისტიკოსების ერთ-ერთი გალაქტიკა, რომელმაც შეიმუშავა გზა შეადაროს ნებისმიერი ზომის ორი დამოუკიდებელი ნიმუში დისპერსიის ორი შეფასების თანაფარდობის გამოთვლით. მან ამ ურთიერთობას უწოდა F- თანაფარდობა, ფიშერის სახელით. კვლევის შედეგები Snedecor-მა განაპირობა ის, რომ F- განაწილება დაიწყო დაზუსტება, როგორც ორი სტატისტიკის თანაფარდობის განაწილება c2, თითოეულს აქვს თავისუფლების საკუთარი ხარისხი:

აქედან მომდინარეობს ფიშერის კლასიკური ნაშრომი დისპერსიის ანალიზზე, სტატისტიკური მეთოდი, რომელიც აშკარად ორიენტირებულია მცირე ნიმუშების ანალიზზე.

შერჩევის განაწილება F (სადაც n = df) წარმოდგენილია შემდეგი განტოლებით:

როგორც t-განაწილების შემთხვევაში, გამა ფუნქცია მიუთითებს, რომ არსებობს განაწილებათა ოჯახი, რომელიც აკმაყოფილებს F-ის განტოლებას. თუმცა, ამ შემთხვევაში, ანალიზი მოიცავს ორ df სიდიდეს: თავისუფლების გრადუსების რაოდენობას მრიცხველისა და მრიცხველისათვის. F-ფარდობის მნიშვნელი.

t- და F- სტატისტიკის შეფასების ცხრილები. ნულოვანი ჰიპოთეზის ტესტირებისას S.-ს გამოყენებით, დიდი ნიმუშების თეორიაზე დაფუძნებული, ჩვეულებრივ საჭიროა მხოლოდ ერთი საძიებო ცხრილი - ნორმალური გადახრების ცხრილი (z), რომელიც საშუალებას გაძლევთ განსაზღვროთ ფართობი ნორმალური მრუდის ქვეშ ნებისმიერ z მნიშვნელობას შორის. x-ღერძზე. თუმცა, t- და F- განაწილების ცხრილები აუცილებლად წარმოდგენილია ცხრილების ერთობლიობაში, ვინაიდან ეს ცხრილები დაფუძნებულია სხვადასხვა განაწილებაზე, რომელიც გამოწვეულია თავისუფლების ხარისხის ცვალებადობის შედეგად. მიუხედავად იმისა, რომ t- და F- განაწილებები არის ალბათობის სიმკვრივის განაწილება, ისევე როგორც ნორმალური განაწილება დიდი ნიმუშებისთვის, ისინი განსხვავდებიან ამ უკანასკნელისგან ოთხი გზით, რომლებიც გამოიყენება მათი აღწერისთვის. t განაწილება, მაგალითად, არის სიმეტრიული (შენიშვნა t2 მის განტოლებაში) ყველა df-სთვის, მაგრამ სულ უფრო პიკს აღწევს, როგორც ნიმუშის ზომა მცირდება. მწვერვალის მრუდები (ისინი, რომლებსაც აქვთ ნორმაზე მეტი ქურტოზი) ნაკლებად ასიმპტომურია (ანუ, ნაკლებად ახლოს არის x-ღერძთან განაწილების ბოლოებში), ვიდრე ნორმალური ქურტოზის მქონე მრუდები, როგორიცაა გაუსის მრუდი. ეს განსხვავება იწვევს შესამჩნევ შეუსაბამობებს x ღერძის წერტილებს შორის, რომლებიც შეესაბამება t და z მნიშვნელობებს. df = 5 და ორკუდიანი α დონით 0,05, t = 2,57, ხოლო შესაბამისი z = 1,96. აქედან გამომდინარე, t = 2.57 მიუთითებს სტატისტიკურ მნიშვნელობაზე 5%-იან დონეზე. თუმცა, ნორმალური მრუდის შემთხვევაში, z = 2.57 (უფრო ზუსტად 2.58) უკვე მიუთითებს სტატისტიკური მნიშვნელობის 1%-იან დონეს. მსგავსი შედარება შეიძლება გაკეთდეს F განაწილებასთან, რადგან t უდრის F-ს, როდესაც ნიმუშების რაოდენობა ორია.

რას წარმოადგენს "პატარა" ნიმუში?

ერთ დროს დაისვა კითხვა, რამდენად დიდი უნდა იყოს ნიმუში, რომ მცირედ ჩაითვალოს. ამ კითხვაზე ცალსახა პასუხი უბრალოდ არ არსებობს. თუმცა, ჩვეულებრივი საზღვარი მცირე და დიდ ნიმუშს შორის ითვლება df = 30. ამ გარკვეულწილად თვითნებური გადაწყვეტილების საფუძველი არის t-განაწილების ნორმალურ განაწილებასთან შედარების შედეგი. როგორც ზემოთ აღინიშნა, t და z მნიშვნელობებს შორის შეუსაბამობა იზრდება როგორც df მცირდება და მცირდება, როგორც df იზრდება. ფაქტობრივად, t იწყებს z-ს მჭიდროდ მიახლოებას შეზღუდულ შემთხვევამდე დიდი ხნით ადრე, სადაც t = z df = ∞-ისთვის. t-ის ცხრილის მნიშვნელობების მარტივი ვიზუალური გამოკვლევა აჩვენებს, რომ ეს მიახლოება ხდება საკმაოდ სწრაფი, დაწყებული df = 30 და ზემოთ. t (df = 30-ზე) და z-ის შედარებითი მნიშვნელობები ტოლია, შესაბამისად: 2.04 და 1.96 p = 0.05-ისთვის; 2.75 და 2.58 p = 0.01-ისთვის; 3.65 და 3.29 p = 0.001-ისთვის.

სხვა სტატისტიკა "პატარა" ნიმუშებისთვის

მიუხედავად იმისა, რომ სტატისტიკა, როგორიცაა t და F სპეციალურად შექმნილია მცირე ნიმუშების გამოსაყენებლად, ისინი თანაბრად გამოიყენება დიდ ნიმუშებზე. თუმცა, არსებობს მრავალი სხვა სტატისტიკური მეთოდი, რომელიც შექმნილია მცირე ნიმუშების გასაანალიზებლად და ხშირად გამოიყენება ამ მიზნით. ეს ეხება ე.წ. არაპარამეტრული ან განაწილების გარეშე მეთოდები. ძირითადად, ამ მეთოდებში გამოჩენილი სასწორები განკუთვნილია სასწორების გამოყენებით მიღებულ გაზომვებზე, რომლებიც არ აკმაყოფილებენ თანაფარდობის ან ინტერვალის სკალების განსაზღვრებას. ყველაზე ხშირად ეს არის რიგითი (წოდება) ან ნომინალური გაზომვები. არაპარამეტრული სკალები არ საჭიროებს ვარაუდებს განაწილების პარამეტრებთან დაკავშირებით, განსაკუთრებით დისპერსიის შეფასებებთან დაკავშირებით, რადგან რიგითი და ნომინალური მასშტაბები გამორიცხავს დისპერსიის ცნებას. ამ მიზეზით, არაპარამეტრული მეთოდები ასევე გამოიყენება გაზომვებისთვის, რომლებიც მიღებულია ინტერვალისა და თანაფარდობის სკალების გამოყენებით, როდესაც ხდება მცირე ნიმუშების ანალიზი და პარამეტრული მეთოდების გამოყენებისათვის საჭირო ძირითადი დაშვებები, სავარაუდოდ, დაირღვა. ეს ტესტები, რომლებიც შეიძლება გონივრულად იქნას გამოყენებული მცირე ნიმუშებზე, მოიცავს: ფიშერის ზუსტი ალბათობის ტესტი, ფრიდმანის ორფაქტორიანი არაპარამეტრული (რანგის) დისპერსიული ანალიზი, კენდალის t რანგის კორელაციის კოეფიციენტი, კენდალის შესაბამისობის კოეფიციენტი (W), კრუსკალის H ტესტი - უოლესი. არაპარამეტრული (რანგის) ცალმხრივი დისპერსიული ანალიზისთვის, Mann-Whitney U-ტესტი, მედიანა ტესტი, ნიშნების ტესტი, Spearman-ის რანგის კორელაციის კოეფიციენტი r და Wilcoxon t-ტესტი.

ცვალებადობის შესწავლისას გამოიყოფა რაოდენობრივი და ხარისხობრივი მახასიათებლები, რომელთა შესწავლას ახორციელებს ვარიაციული სტატისტიკა, რომელიც ეფუძნება ალბათობის თეორიას. ალბათობა მიუთითებს ინდივიდის შეხვედრის შესაძლო სიხშირეზე კონკრეტულ თვისებაზე. P=m/n, სადაც m არის მოცემული თვისების მნიშვნელობის მქონე ინდივიდების რაოდენობა; n არის ჯგუფში ყველა ინდივიდის რაოდენობა. ალბათობა მერყეობს 0-დან 1-მდე (მაგალითად, ალბათობა არის 0,02 - ნახირში ტყუპების გამოჩენა, ანუ 100 მშობიარობაზე ორი ტყუპი გამოჩნდება). ამრიგად, ბიომეტრიის შესწავლის ობიექტი არის ცვალებადი მახასიათებელი, რომლის შესწავლა ხორციელდება ობიექტთა გარკვეულ ჯგუფზე, ე.ი. მთლიანობა. არსებობს ზოგადი და სანიმუშო პოპულაციები. მოსახლეობაეს არის ინდივიდთა დიდი ჯგუფი, რომელიც გვაინტერესებს შესასწავლი თვისებიდან გამომდინარე. საერთო პოპულაცია შეიძლება შეიცავდეს ცხოველის სახეობას ან იმავე სახეობის ჯიშს. საერთო პოპულაცია (ჯიში) მოიცავს რამდენიმე მილიონ ცხოველს. ამავდროულად, ჯიში მრავალ ჯგუფად იყოფა, ე.ი. ინდივიდუალური მეურნეობების ნახირი. ვინაიდან საერთო პოპულაცია შედგება ინდივიდების დიდი რაოდენობით, ტექნიკურად რთულია მისი შესწავლა. ამიტომ ისინი მთელ მოსახლეობას კი არ სწავლობენ, არამედ მხოლოდ მის ნაწილს, რომელსაც ე.წ არჩევითიან ნიმუშის პოპულაცია.

შერჩევის პოპულაციის საფუძველზე, განსჯა კეთდება მთლიანი პოპულაციის შესახებ. სინჯის აღება უნდა განხორციელდეს ყველა წესის მიხედვით, რომელიც უნდა მოიცავდეს ინდივიდებს სხვადასხვა მახასიათებლის ყველა მნიშვნელობის მქონე. ზოგადი პოპულაციისგან ინდივიდების შერჩევა ხდება შემთხვევითობის პრინციპით ან წილისყრით. ბიომეტრიაში არსებობს ორი სახის შემთხვევითი შერჩევა: დიდი და პატარა. დიდი ნიმუშიეწოდება ისეთს, რომელიც მოიცავს 30-ზე მეტ ინდივიდს ან დაკვირვებას და მცირე ნიმუში 30-ზე ნაკლები ინდივიდი. არსებობს მონაცემთა დამუშავების სხვადასხვა მეთოდი დიდი და მცირე ნიმუშების პოპულაციებისთვის. სტატისტიკური ინფორმაციის წყარო შეიძლება იყოს მონაცემები ზოოტექნიკური და ვეტერინარული ჩანაწერებიდან, რომლებიც გვაწვდიან ინფორმაციას თითოეული ცხოველის შესახებ დაბადებიდან განადგურებამდე. ინფორმაციის კიდევ ერთი წყარო შეიძლება იყოს მონაცემები ცხოველთა შეზღუდულ რაოდენობაზე ჩატარებული სამეცნიერო და საწარმოო ექსპერიმენტებიდან. ნიმუშის მიღების შემდეგ იწყება დამუშავება. ეს შესაძლებელს ხდის მათემატიკური რაოდენობების სახით მივიღოთ არაერთი სტატისტიკური რაოდენობა ან კოეფიციენტი, რომელიც ახასიათებს ინტერესის მქონე ცხოველების ჯგუფების მახასიათებლებს.

ბიომეტრიული მეთოდის გამოყენებით მიიღება შემდეგი სტატისტიკური პარამეტრები ან ინდიკატორები:

1. განსხვავებული მახასიათებლის საშუალო მნიშვნელობები (საშუალო არითმეტიკული, რეჟიმი, მედიანა, გეომეტრიული საშუალო).

2. კოეფიციენტები, რომლებიც ზომავენ ვარიაციის რაოდენობას ე.ი. შესასწავლი მახასიათებლის (ცვალებადობა) (სტანდარტული გადახრა, ვარიაციის კოეფიციენტი).

3. კოეფიციენტები, რომლებიც ზომავენ მახასიათებლებს შორის ურთიერთობის სიდიდეს (კორელაციის კოეფიციენტი, რეგრესიის კოეფიციენტი და კორელაციის კოეფიციენტი).

4. სტატისტიკური შეცდომები და მიღებული სტატისტიკური მონაცემების სანდოობა.

5. სხვადასხვა ფაქტორებისა და სხვა ინდიკატორების გავლენის ქვეშ წარმოქმნილი ვარიაციების წილი, რომლებიც დაკავშირებულია გენეტიკური და სელექციური პრობლემების შესწავლასთან.

ნიმუშის სტატისტიკური დამუშავებისას, პოპულაციის წევრები ორგანიზებულნი არიან ვარიაციის სერიის სახით. ვარიაციების სერია არის ინდივიდების დაჯგუფება კლასებად, შესწავლილი თვისების მნიშვნელობიდან გამომდინარე. ვარიაციის სერია შედგება ორი ელემენტისგან: კლასები და სიხშირეების სერია. ვარიაციების სერია შეიძლება იყოს წყვეტილი ან უწყვეტი. ფუნქციებს, რომლებსაც შეუძლიათ მხოლოდ მთელი რიცხვის აღება, ეწოდება წყვეტილი ნომერითავები, კვერცხების რაოდენობა, გოჭების რაოდენობა და სხვა. თვისებები, რომლებიც შეიძლება გამოიხატოს წილადი რიცხვებით, ეწოდება უწყვეტი(სიმაღლე სმ, რძის მოსავლიანობა კგ, % ცხიმი, ცოცხალი წონა და სხვა).

ვარიაციების სერიის აგებისას დაცულია შემდეგი პრინციპები ან წესები:

1. განსაზღვრეთ ან დათვალეთ ინდივიდების რაოდენობა, რომლებისთვისაც აშენდება ვარიაციის სერია (n).

2. იპოვეთ შესასწავლი მახასიათებლის მაქსიმალური და მინიმალური მნიშვნელობა.

3. განსაზღვრეთ კლასის ინტერვალი K = max - min / კლასების რაოდენობა, კლასების რაოდენობა აღებულია თვითნებურად.

4. ააგეთ კლასები და დაადგინეთ თითოეული კლასის საზღვარი min+K.

5. ანაწილებენ მოსახლეობის წევრებს კლასებად.

კლასების აგების და ინდივიდების კლასებად განაწილების შემდეგ გამოითვლება ვარიაციის სერიის ძირითადი მაჩვენებლები (X, σ, Cv, Mх, Мσ, Мcv). ატრიბუტის საშუალო მნიშვნელობამ მიიღო უდიდესი მნიშვნელობა პოპულაციის დახასიათებისას. ყველა ზოოტექნიკური, ვეტერინარული, სამედიცინო, ეკონომიკური და სხვა პრობლემის გადაჭრისას ყოველთვის დგინდება ნიშან-თვისების საშუალო მნიშვნელობა (ნახირისთვის რძის საშუალო მოსავლიანობა, % ცხიმი, ნაყოფიერება ღორის მოშენებაში, კვერცხის წარმოება ქათმებში და სხვა თვისებები). მახასიათებლის საშუალო მნიშვნელობის დამახასიათებელი პარამეტრები მოიცავს შემდეგს:

1. საშუალო არითმეტიკული.

2. შეწონილი არითმეტიკული საშუალო.

3. გეომეტრიული საშუალო.

4. მოდა (მო).

5. მედიანა (Me) და სხვა პარამეტრები.

Საშუალო არითმეტიკულიგვიჩვენებს, თუ რა მნიშვნელობა ჰქონდათ მოცემული ჯგუფის ინდივიდებს, თუ ის ყველასთვის ერთნაირი იყო და განისაზღვრება X = A + b × K ფორმულით.

არითმეტიკული საშუალოს მთავარი თვისება ის არის, რომ ის გამორიცხავს მახასიათებლის ცვალებადობას და საერთოს ხდის მას მთელი მოსახლეობისთვის. ამასთან, უნდა აღინიშნოს, რომ საშუალო არითმეტიკული აბსტრაქტული მნიშვნელობა იძენს, ე.ი. მისი გაანგარიშებისას მიიღება წილადი ინდიკატორები, რომლებიც სინამდვილეში შეიძლება არ არსებობდეს. მაგალითად: ხბოს მოსავლიანობა 100 ძროხაზე არის 85,3 ხბო, ღორების ნაყოფიერება 11,8 გოჭი, ქათმების კვერცხის წარმოება 252,4 კვერცხი და სხვა მაჩვენებლები.

საშუალო არითმეტიკული მნიშვნელობა ძალიან მაღალია მეცხოველეობის პრაქტიკაში და პოპულაციის მახასიათებლებში. მეცხოველეობის, კერძოდ მესაქონლეობის პრაქტიკაში, ლაქტაციის პერიოდში რძეში ცხიმის საშუალო შემცველობის დასადგენად გამოიყენება შეწონილი არითმეტიკული მნიშვნელობა.

გეომეტრიული საშუალო მნიშვნელობაგამოითვლება თუ საჭიროა ზრდის ტემპის, მოსახლეობის ზრდის ტემპის დახასიათება, როცა საშუალო არითმეტიკული მონაცემები ამახინჯებს.

მოდა დაასახელეთ სხვადასხვა მახასიათებლის ყველაზე ხშირად შემხვედრი მნიშვნელობა, როგორც რაოდენობრივი, ასევე ხარისხობრივი. ძროხის მოდალური ნომერია ძუძუს ნომერი-4. მიუხედავად იმისა, რომ არსებობენ ძროხები ხუთი ან ექვსი ძუძუს. ვარიაციის სერიებში მოდალური კლასი იქნება კლასი, სადაც არის ყველაზე მეტი სიხშირე და ჩვენ განვსაზღვრავთ მას, როგორც ნულოვან კლასს.

მედიანური ეწოდება ვარიანტი, რომელიც ყოფს მოსახლეობის ყველა წევრს ორ თანაბარ ნაწილად. პოპულაციის წევრების ნახევარს ექნება ცვლადი ნიშან-თვისებების მნიშვნელობა მედიანაზე ნაკლები, ხოლო მეორე ნახევარს ექნება საშუალოზე მეტი მნიშვნელობა (მაგალითად: ჯიშის სტანდარტი). მედიანა ყველაზე ხშირად გამოიყენება თვისებრივი მახასიათებლების დასახასიათებლად. მაგალითად: ყელის ფორმა არის თასის ფორმის, მრგვალი, თხის. შერჩევის სწორი ვარიანტით, სამივე ინდიკატორი უნდა იყოს იგივე (ანუ X, Mo, Me). ამრიგად, მოსახლეობის პირველი მახასიათებელი არის საშუალო მნიშვნელობები, მაგრამ ისინი საკმარისი არ არის მოსახლეობის განსასჯელად.

ნებისმიერი პოპულაციის მეორე მნიშვნელოვანი მაჩვენებელია თვისების ცვალებადობა ან ცვალებადობა. ნიშან-თვისების ცვალებადობას მრავალი გარემო ფაქტორი და შინაგანი ფაქტორი განაპირობებს, ე.ი. მემკვიდრეობითი ფაქტორები.

ნიშან-თვისების ცვალებადობის დადგენას დიდი მნიშვნელობა აქვს როგორც ბიოლოგიაში, ასევე მეცხოველეობის პრაქტიკაში. ამრიგად, სტატისტიკური პარამეტრების გამოყენებით, რომლებიც ზომავენ ნიშან-თვისების ცვალებადობის ხარისხს, შესაძლებელია დადგინდეს ჯიშის განსხვავებები სხვადასხვა ეკონომიკურად სასარგებლო თვისებების ცვალებადობის ხარისხში, წინასწარ განსაზღვროთ შერჩევის დონე ცხოველთა სხვადასხვა ჯგუფში, ისევე როგორც მისი ეფექტურობა. .

სტატისტიკური ანალიზის ამჟამინდელი მდგომარეობა საშუალებას იძლევა არა მხოლოდ ფენოტიპური ცვალებადობის გამოვლინების ხარისხის დადგენა, არამედ ფენოტიპური ცვალებადობის დაყოფა მის კომპონენტურ ტიპებად, კერძოდ, გენოტიპურ და პარატიპურ ცვალებადობად. ცვალებადობის ეს დაშლა ხდება დისპერსიის ანალიზის გამოყენებით.

ცვალებადობის ძირითადი მაჩვენებლებია შემდეგი სტატისტიკური მნიშვნელობები:

1. ლიმიტები;

2. სტანდარტული გადახრა (σ);

3. ცვალებადობის ან ვარიაციის კოეფიციენტი (Cv).

ნიშან-თვისების ცვალებადობის რაოდენობის წარმოდგენის უმარტივესი გზა არის ლიმიტების მეშვეობით. ლიმიტები განისაზღვრება შემდეგნაირად: განსხვავება ატრიბუტის მაქსიმალურ და მინიმალურ მნიშვნელობებს შორის. რაც უფრო დიდია ეს განსხვავება, მით მეტია ამ მახასიათებლის ცვალებადობა. თვისების ცვალებადობის გაზომვის მთავარი პარამეტრი არის სტანდარტული გადახრა ან (σ) და განისაზღვრება ფორმულით:

σ = ±K ∙ √∑ პა 2- ბ 2

სტანდარტული გადახრის ძირითადი თვისებები ე.ი. (σ) არის შემდეგი:

1. სიგმა ყოველთვის არის დასახელებული მნიშვნელობა და გამოიხატება (კგ, გ, მეტრი, სმ, ც.).

2. სიგმა ყოველთვის დადებითი მნიშვნელობაა.

3. რაც უფრო დიდია σ-ის მნიშვნელობა, მით მეტია თვისების ცვალებადობა.

4. ვარიაციის სერიაში ყველა სიხშირე შედის ±3σ-ში.

სტანდარტული გადახრის გამოყენებით, შეგიძლიათ განსაზღვროთ, თუ რომელ ვარიაციის სერიას ეკუთვნის მოცემული ინდივიდი. ლიმიტებისა და სტანდარტული გადახრის გამოყენებით მახასიათებლის ცვალებადობის განსაზღვრის მეთოდებს აქვთ ნაკლოვანებები, რადგან შეუძლებელია სხვადასხვა მახასიათებლების შედარება ცვალებადობის სიდიდის მიხედვით. აუცილებელია ვიცოდეთ სხვადასხვა ნიშან-თვისებების ცვალებადობა იმავე ცხოველში ან ცხოველთა იმავე ჯგუფში, მაგალითად: რძის მოსავლიანობის ცვალებადობა, ცხიმის შემცველობა რძეში, ცოცხალი მასა, რძის ცხიმის რაოდენობა. ამრიგად, საპირისპირო მახასიათებლების ცვალებადობის შედარებით და მათი ცვალებადობის ხარისხის დადგენით, ცვალებადობის კოეფიციენტი გამოითვლება შემდეგი ფორმულის გამოყენებით:

ამრიგად, პოპულაციის წევრებს შორის მახასიათებლების ცვალებადობის შეფასების ძირითადი მეთოდებია: ლიმიტები; სტანდარტული გადახრა (σ) და ცვალებადობის ან ცვალებადობის კოეფიციენტი.

მეცხოველეობის პრაქტიკაში და ექსპერიმენტულ კვლევებში ხშირად უხდება საქმე მცირე ნიმუშებს. მცირე ნიმუშიისინი ეძახიან ინდივიდების ან ცხოველების რაოდენობას, რომელიც არ აღემატება 30-ს ან 30-ზე ნაკლებს. დადგენილი ნიმუშები გადაეცემა მთელ პოპულაციას მცირე ნიმუშის გამოყენებით. მცირე ნიმუშისთვის დგინდება იგივე სტატისტიკური პარამეტრები, რაც დიდი ნიმუშისთვის (X, σ, Cv, Mx). თუმცა, მათი ფორმულები და გამოთვლები განსხვავდება დიდი ნიმუშისგან (ანუ ვარიაციის სერიის ფორმულებიდან და გამოთვლებისგან).

1. საშუალო არითმეტიკული მნიშვნელობა X = ∑ ვ

V - ვარიანტის ან მახასიათებლის აბსოლუტური მნიშვნელობა;

n არის ვარიანტების რაოდენობა ან ინდივიდების რაოდენობა.

2. სტანდარტული გადახრა σ = ± √ ∑α 2

α = x-¯x, ეს არის განსხვავება ოპციის მნიშვნელობასა და საშუალო არითმეტიკას შორის. ეს განსხვავება α არის კვადრატში და α 2 n-1 არის თავისუფლების გრადუსების რაოდენობა, ე.ი. ყველა ვარიანტის ან ინდივიდის რაოდენობა შემცირდა ერთით (1).

საკონტროლო კითხვები:

1. რა არის ბიომეტრია?

2.რა სტატისტიკური პარამეტრები ახასიათებს მოსახლეობას?

3.რა ინდიკატორები ახასიათებს ცვალებადობას?

4.რა არის პატარა ნიმუში

5. რა არის რეჟიმი და მედიანა?

ლექცია No12

ბიოტექნოლოგია და ემბრიონის ტრანსპლანტაცია

1. ბიოტექნოლოგიის ცნება.

2. დონორი და მიმღები ძროხების შერჩევა, ემბრიონის გადანერგვა.

3. გადანერგვის მნიშვნელობა მეცხოველეობაში.

სტატისტიკური კვლევის პრაქტიკაში ხშირად გვხვდება მცირე ნიმუშები , რომელთა მოცულობა 30 ერთეულზე ნაკლებია. დიდი ნიმუშები ჩვეულებრივ მოიცავს 100 ერთეულზე მეტ ნიმუშებს.

როგორც წესი, მცირე ნიმუშები გამოიყენება იმ შემთხვევებში, როდესაც შეუძლებელია ან არაპრაქტიკულია დიდი ნიმუშის გამოყენება. ასეთ ნიმუშებთან უხდება საქმე, მაგალითად, ტურისტებისა და სასტუმროს ვიზიტორების გამოკითხვისას.

მცირე ნიმუშის შეცდომის სიდიდე განისაზღვრება ფორმულების გამოყენებით, რომლებიც განსხვავდება შედარებით დიდი ნიმუშის ზომისგან ().

მცირე ზომის ნიმუშით მხედველობაში უნდა იქნას მიღებული კავშირი შერჩევისა და პოპულაციის განსხვავებას შორის:

ვინაიდან მცირე ნიმუშში ფრაქცია მნიშვნელოვანია, დისპერსიის გამოთვლა ხდება ე.წ თავისუფლების ხარისხების რაოდენობა . ეს გაგებულია, როგორც ვარიანტების რაოდენობა, რომელსაც შეუძლია მიიღოს თვითნებური მნიშვნელობები საშუალო მნიშვნელობის შეცვლის გარეშე.

მცირე ნიმუშის საშუალო შეცდომა განისაზღვრება ფორმულით:

შერჩევის მაქსიმალური შეცდომა საშუალოსა და პროპორციისთვის გვხვდება ისევე, როგორც დიდი ნიმუშის შემთხვევაში:

სადაც t არის ნდობის კოეფიციენტი, მნიშვნელოვნების მოცემულ დონესა და თავისუფლების ხარისხების რაოდენობაზე (დანართი 5).

კოეფიციენტების მნიშვნელობები დამოკიდებულია არა მხოლოდ მოცემულ ნდობის ალბათობაზე, არამედ ნიმუშის ზომაზე . t და n-ის ინდივიდუალური მნიშვნელობებისთვის, ნდობის ალბათობა განისაზღვრება Student განაწილებით, რომელიც შეიცავს სტანდარტიზებული გადახრების განაწილებას:

კომენტარი.როგორც ნიმუშის ზომა იზრდება, სტუდენტური განაწილება უახლოვდება ნორმალურ განაწილებას: როდის =20 ის ოდნავ განსხვავდება ნორმალური განაწილებისგან. მცირე შერჩევის გამოკითხვის ჩატარებისას მხედველობაში უნდა იქნას მიღებული, რომ რაც უფრო მცირეა შერჩევის ზომა , რაც უფრო დიდია განსხვავება სტუდენტურ განაწილებასა და ნორმალურ განაწილებას შორის. მაგალითად, როდის პ წთ. = 4 ეს განსხვავება საკმაოდ მნიშვნელოვანია, რაც მიუთითებს მცირე ნიმუშის შედეგების სიზუსტის შემცირებაზე.