ემპირიული განაწილების ფუნქცია. ემპირიული განაწილების ფუნქცია, თვისებები ემპირიული განაწილების ფუნქცია არის ფუნქცია f x

ლექცია 13. შემთხვევითი ცვლადების სტატისტიკური შეფასების კონცეფცია

მოდით, რაოდენობრივი X მახასიათებლის სტატისტიკური სიხშირე განაწილება ავღნიშნოთ დაკვირვებების რაოდენობით, რომლებშიც მახასიათებლის მნიშვნელობა დაფიქსირდა x-ზე ნაკლები და n-ით დაკვირვების საერთო რაოდენობა. ცხადია, X მოვლენის ფარდობითი სიხშირე< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

ემპირიული განაწილების ფუნქცია(ნიმუშების განაწილების ფუნქცია) არის ფუნქცია, რომელიც განსაზღვრავს თითოეული მნიშვნელობისთვის X მოვლენის ფარდობით სიხშირეს< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

ნიმუშის ემპირიული განაწილების ფუნქციისგან განსხვავებით, პოპულაციის განაწილების ფუნქციას უწოდებენ თეორიული განაწილების ფუნქცია.განსხვავება ამ ფუნქციებს შორის არის ის, რომ თეორიული ფუნქცია განსაზღვრავს ალბათობამოვლენები X< x, тогда как эмпирическая – შედარებითი სიხშირეიგივე მოვლენა.

როგორც n იზრდება, X მოვლენის ფარდობითი სიხშირე< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

ემპირიული განაწილების ფუნქციის თვისებები:

1) ემპირიული ფუნქციის მნიშვნელობები ეკუთვნის სეგმენტს

2) - შეუმცირებელი ფუნქცია

3) თუ ყველაზე პატარა ვარიანტია, მაშინ = 0-ისთვის, თუ ყველაზე დიდი ვარიანტია, მაშინ = 1-ისთვის.

ნიმუშის ემპირიული განაწილების ფუნქცია ემსახურება პოპულაციის თეორიული განაწილების ფუნქციის შეფასებას.

მაგალითი. მოდით ავაშენოთ ემპირიული ფუნქცია ნიმუშის განაწილების საფუძველზე:

Პარამეტრები
სიხშირეები

ვიპოვოთ ნიმუშის ზომა: 12+18+30=60. ყველაზე პატარა ვარიანტი არის 2, ასე რომ =0 ​​x £ 2-ისთვის. x-ის მნიშვნელობა<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. ამრიგად, სასურველ ემპირიულ ფუნქციას აქვს ფორმა:

სტატისტიკური შეფასებების ყველაზე მნიშვნელოვანი თვისებები

საჭირო გახდეს ზოგადი პოპულაციის ზოგიერთი რაოდენობრივი მახასიათებლის შესწავლა. დავუშვათ, რომ თეორიული მოსაზრებებიდან გამომდინარე შესაძლებელი გახდა ამის დადგენა რომელი ზუსტადგანაწილებას აქვს ნიშანი და აუცილებელია შევაფასოთ ის პარამეტრები, რომლითაც იგი განისაზღვრება. მაგალითად, თუ შესასწავლი მახასიათებელი ნორმალურად არის განაწილებული პოპულაციაში, მაშინ აუცილებელია მათემატიკური მოლოდინისა და სტანდარტული გადახრის შეფასება; თუ მახასიათებელს აქვს პუასონის განაწილება, მაშინ აუცილებელია l პარამეტრის შეფასება.

როგორც წესი, ხელმისაწვდომია მხოლოდ ნიმუშის მონაცემები, მაგალითად, n დამოუკიდებელი დაკვირვების შედეგად მიღებული რაოდენობრივი მახასიათებლის მნიშვნელობები. დამოუკიდებელ შემთხვევითი ცვლადების გათვალისწინებით შეგვიძლია ვთქვათ თეორიული განაწილების უცნობი პარამეტრის სტატისტიკური შეფასების პოვნა ნიშნავს დაკვირვებული შემთხვევითი ცვლადების ფუნქციის პოვნას, რომელიც იძლევა სავარაუდო პარამეტრის მიახლოებით მნიშვნელობას. მაგალითად, ნორმალური განაწილების მათემატიკური მოლოდინის შესაფასებლად, ფუნქციის როლს ასრულებს საშუალო არითმეტიკული



იმისათვის, რომ სტატისტიკურმა შეფასებებმა უზრუნველყოს სავარაუდო პარამეტრების სწორი მიახლოება, ისინი უნდა აკმაყოფილებდეს გარკვეულ მოთხოვნებს, რომელთა შორის ყველაზე მნიშვნელოვანია მოთხოვნები. გადაუადგილებელი და გადახდისუნარიანობა შეფასებები.

მოდით იყოს თეორიული განაწილების უცნობი პარამეტრის სტატისტიკური შეფასება. მოდით, შეფასდეს n ზომის ნიმუშიდან. გავიმეოროთ ექსპერიმენტი, ე.ი. მოდი ამოვიღოთ იგივე ზომის კიდევ ერთი ნიმუში საერთო პოპულაციიდან და მის მონაცემებზე დაყრდნობით მივიღოთ განსხვავებული შეფასება. ექსპერიმენტის მრავალჯერ გამეორებით, მივიღებთ სხვადასხვა რიცხვებს. ქულა შეიძლება მივიჩნიოთ როგორც შემთხვევითი ცვლადი, ხოლო რიცხვები მის შესაძლო მნიშვნელობებად.

თუ შეფასება იძლევა მიახლოებით მნიშვნელობას უხვად, ე.ი. თითოეული რიცხვი მეტია ნამდვილ მნიშვნელობაზე და შედეგად, შემთხვევითი ცვლადის მათემატიკური მოლოდინი (საშუალო მნიშვნელობა) მეტია:. ანალოგიურად, თუ ის იძლევა შეფასებას მინუსით, რომ .

ამრიგად, სტატისტიკური შეფასების გამოყენება, რომლის მათემატიკური მოლოდინი არ არის შეფასებული პარამეტრის ტოლი, გამოიწვევს სისტემატურ (იგივე ნიშნის) შეცდომებს. თუ პირიქით, მაშინ ეს გარანტიას იძლევა სისტემური შეცდომებისგან.

მიუკერძოებელი ეწოდება სტატისტიკური შეფასება, რომლის მათემატიკური მოლოდინი უდრის შეფასებულ პარამეტრს ნებისმიერი ნიმუშის ზომისთვის.

გადაადგილებულიეწოდება შეფასება, რომელიც არ აკმაყოფილებს ამ პირობას.

შეფასების მიუკერძოებლობა ჯერ კიდევ არ იძლევა გარანტიას სავარაუდო პარამეტრის კარგ მიახლოებას, ვინაიდან შესაძლო მნიშვნელობები შეიძლება იყოს ძალიან მიმოფანტული მისი საშუალო მნიშვნელობის გარშემო, ე.ი. განსხვავება შეიძლება იყოს მნიშვნელოვანი. ამ შემთხვევაში, მაგალითად, ერთი ნიმუშის მონაცემებიდან აღმოჩენილი შეფასება შეიძლება მნიშვნელოვნად დაშორდეს საშუალო მნიშვნელობას და, შესაბამისად, შეფასებულ პარამეტრს.

ეფექტური არის სტატისტიკური შეფასება, რომელსაც აქვს მოცემული ნიმუშის ზომა n ყველაზე მცირე შესაძლო განსხვავება .

დიდი ნიმუშების განხილვისას საჭიროა სტატისტიკური შეფასებები გადახდისუნარიანობა .

Მდიდარი ეწოდება სტატისტიკური შეფასება, რომელიც, რადგან n®¥ მიდრეკილია სავარაუდო პარამეტრზე. მაგალითად, თუ მიუკერძოებელი შეფასების დისპერსია ნულისკენ მიისწრაფვის, როგორც n®¥, მაშინ ასეთი შეფასება თანმიმდევრული აღმოჩნდება.

შევისწავლოთ რაოდენობრივი თვისება? ზოგადი პოპულაცია და ვივარაუდოთ, რომ ნებისმიერი ნიმუშის ზომისთვის ცნობილია ამ მახასიათებლის სიხშირის განაწილება. ნიმუშის ზომის დაფიქსირებით P,აღნიშნავენ მიერ გვ x x-ზე ნაკლები ვარიანტების რაოდენობა. მაშინ ძნელი არ არის ამის დანახვა njnგამოხატავს მოვლენის ფარდობით სიხშირეს (?

ეს თანაფარდობა დამოკიდებულია ფიქსირებულ x რიცხვზე და, მაშასადამე, არის x სიდიდის გარკვეული ფუნქცია. მოდით აღვნიშნოთ F*(x).

განმარტება 1.10. ფუნქცია F*(x) = -, რომელიც გამოხატავს ნათესავს

მოვლენის სიხშირე (? ემპირიული ფუნქცია

განაწილება (შერჩევის განაწილების ფუნქციაან სტატისტიკური განაწილების ფუნქცია).

ამრიგად, განსაზღვრებით

შეგახსენებთ, რომ ფუნქციის განაწილების ფუნქცია ?, პოპულაცია განისაზღვრება, როგორც მოვლენის ალბათობა (?

და განსხვავებით ემპირიული განაწილების ფუნქციას უწოდებენ თეორიული განაწილების ფუნქცია.ვინაიდან ემპირიული განაწილების ფუნქცია არის ერთი და იგივე მოვლენის ალბათობა, მაშინ ბერნულის თეორემის მიხედვით (იხ. ნაწილი 5.4), ნიმუშის დიდი ზომით ისინი ცოტა განსხვავდებიან ერთმანეთისგან იმ გაგებით, რომ

სადაც e არის ნებისმიერი თვითნებურად მცირე დადებითი რიცხვი.

კავშირი (1.2) გვიჩვენებს, რომ თუ თეორიული განაწილების ფუნქცია უცნობია, მაშინ ნიმუშიდან ნაპოვნი ემპირიული განაწილების ფუნქცია შეიძლება გამოყენებულ იქნას როგორც მისი შეფასების ნიმუში. ფორმულიდან (1.2) ერთდროულად გამომდინარეობს, რომ ეს შეფასება თანმიმდევრულია (იხ. განმარტება 2.4).

კომენტარი 1.6. დამოკიდებულება ნჯასევე შეიძლება განიმარტოს როგორც გაზიარებანიმუშის ის წევრები, რომლებიც დევს ფიქსირებული x რიცხვის მარცხნივ. ავღნიშნოთ ის co^ შესაბამისად,

ახლა მოდით შევხედოთ დისკრეტული ნიმუშისთვის ემპირიული განაწილების ფუნქციის აგების მაგალითს.

მაგალითი 1.2. ნიმუშის განაწილება ცნობილია (ცხრილი 1.7).

ცხრილი 1.7

ვარიანტი x.

სიხშირეᲛᲔ.

მისი ემპირიული განაწილების ფუნქციის აგება.

პირველი, მოდით ვიპოვოთ ნიმუშის ზომა:

ვარიანტი x x- ყველაზე პატარა. Ამიტომაც n x = 0 და F*(x)= 0 at X% 3, მაშინ z = 6, ე.ი. წერტილის მარცხნივ X= 3 არის ექვსი ნიმუშის მნიშვნელობა. აქედან გამომდინარე, F*(3) = - = 0.12. Მარცხნივ x = 5მდებარეობს

ცოლები n x=5 = 6 + 9= 15 ნიმუშის ვარიანტი. Ამიტომაც Fn(5) = - = 0.3. Ისე

Როგორ n x=1 = 6 + 9 + 18 = 33, მაშინ Fn(7) = - = 0,66. ანალოგიურად ვპოულობთ

33 + 12 = 45. ამიტომ F* (9) = ^ = 0,9.

ვარიანტი x 5 = 9 ყველაზე დიდია. ამიტომ, x > 9-ისთვის, მთელი ნიმუში დევს ამ x წერტილის მარცხნივ. Ამიტომაც n x>9= 50 და F*(x) = -= 1 x > 9. 50

ამრიგად, ზემოთ ჩატარებული გამოთვლებიდან გამომდინარეობს, რომ სასურველი ემპირიული ფუნქცია ცალსახად არის განსაზღვრული მთელ რეალურ ღერძზე, ცალ-ცალკე მუდმივი და აქვს ფორმა

ამ ფუნქციის გრაფიკი წარმოადგენს საფეხურის ფიგურას და ნაჩვენებია ნახ. 1.6. ?

რაც შეეხება უწყვეტი ნიმუშებისთვის ემპირიული ფუნქციის აგების საკითხს, ეს პრობლემა მოგვარებულია, ზოგადად, ცალსახად. ეს გამოწვეულია იმით, რომ ემპირიული ფუნქციის მნიშვნელობები ცალსახად შეიძლება მოიძებნოს მხოლოდ ნაწილობრივი ინტერვალების ბოლო წერტილებში, რომლებშიც იყოფა ნიმუშის პოპულაციის შემცველი ძირითადი ინტერვალი. მაგრამ ნაწილობრივი ინტერვალების შიდა წერტილებში ის არ არის განსაზღვრული. ამ წერტილებში იგი შემდგომ განისაზღვრება ან ცალმხრივი მუდმივი ფუნქციით (იხ. წინა მაგალითი) ან ზოგიერთი მზარდი უწყვეტი ფუნქციით, მაგალითად, წრფივი ფუნქციით, ე.ი. ემპირიული განაწილების ფუნქციის ასაგებად გამოიყენება წრფივი მიახლოება.

მაგალითი 1.3. ცხრილი 1.3-ის მიხედვით იპოვეთ საწარმოს თანამშრომლების ემპირიული განაწილების ფუნქცია სტაჟის მიხედვით.

განსაზღვრულობისთვის ვვარაუდობთ, რომ განხილული ნაწილობრივი ინტერვალები დახურულია მარცხნივ და ღიაა მარჯვნივ, ე.ი. ისინი შეიცავს მხოლოდ მათ მარცხენა ბოლოებს. მოდით x = 2. შემდეგ მოვლენა n 2 = 0 და F*(2)= 0. თუ x e (2; 6), მაშინ ამ ეტაპზე მნიშვნელობა გვ xაღარ არის განსაზღვრული და მასთან ერთად არ არის განსაზღვრული ემპირიული ფუნქციის მნიშვნელობა. მაგალითად, თუ x = 3, მაშინ პრობლემის პირობებიდან შეუძლებელია სამ წელზე ნაკლები სამუშაო გამოცდილების მქონე მუშაკების რაოდენობის დადგენა, ე.ი. სიხშირეს ვერ პოულობს გვ xდა, შესაბამისად F*(x).

გარდა ამისა, მსგავსი გზით მსჯელობით, ჩვენ დარწმუნებული ვართ, რომ საჭირო ფუნქცია F*(x)იღებს კონკრეტულ მნიშვნელობებს ნაწილობრივი ინტერვალების მარცხენა ბოლო წერტილებში, მაგალითად: "6) = 4/100 = 0.04; "10) = 0.12; "14) = 0.24; "18) = 0.59; F*(22) = 0,78; "26) = 0.90"; "30) = 1, მაგრამ ის არ არის განსაზღვრული ნაწილობრივი ინტერვალების შიდა წერტილებში. პრობლემის საბოლოოდ გადასაჭრელად, სასურველი ფუნქცია ნაწილობრივი ინტერვალების შიდა წერტილებში შემდგომში განისაზღვრება ან ცალმხრივი მუდმივი ფუნქციით (ნახ. 1.7) ან რაიმე უწყვეტი მზარდი ფუნქციით (ნახ. 1.8, სადაც სასურველი ემპირიული ფუნქცია შემდგომ განისაზღვრება წრფივი ფუნქცია). ?

ემპირიული განაწილების ფუნქციის განსაზღვრა

დაე, $X$ იყოს შემთხვევითი ცვლადი. $F(x)$ არის მოცემული შემთხვევითი ცვლადის განაწილების ფუნქცია. ჩვენ განვახორციელებთ $n$ ექსპერიმენტებს მოცემულ შემთხვევით ცვლადზე იმავე პირობებში, ერთმანეთისგან დამოუკიდებლად. ამ შემთხვევაში ვიღებთ მნიშვნელობების თანმიმდევრობას $x_1,\ x_2\ $, ... ,$\ x_n$, რომელსაც ეწოდება ნიმუში.

განმარტება 1

თითოეულ მნიშვნელობას $x_i$ ($i=1,2\ $, ... ,$ \ n$) ეწოდება ვარიანტი.

თეორიული განაწილების ფუნქციის ერთი შეფასება არის ემპირიული განაწილების ფუნქცია.

განმარტება 3

ემპირიული განაწილების ფუნქცია $F_n(x)$ არის ფუნქცია, რომელიც განსაზღვრავს თითოეული მნიშვნელობისთვის $x$ მოვლენის შედარებით სიხშირეს $X \

სადაც $n_x$ არის $x$-ზე ნაკლები ვარიანტების რაოდენობა, $n$ არის ნიმუშის ზომა.

განსხვავება ემპირიულ ფუნქციასა და თეორიულს შორის არის ის, რომ თეორიული ფუნქცია განსაზღვრავს მოვლენის ალბათობას $X.

ემპირიული განაწილების ფუნქციის თვისებები

ახლა განვიხილოთ განაწილების ფუნქციის რამდენიმე ძირითადი თვისება.

    $F_n\left(x\right)$ ფუნქციის დიაპაზონი არის $$ სეგმენტი.

    $F_n\left(x\right)$ არის შეუმცირებელი ფუნქცია.

    $F_n\left(x\right)$ არის მარცხენა უწყვეტი ფუნქცია.

    $F_n\left(x\right)$ არის ცალმხრივი მუდმივი ფუნქცია და იზრდება მხოლოდ $X$ შემთხვევითი ცვლადის მნიშვნელობების წერტილებში.

    მოდით $X_1$ იყოს ყველაზე პატარა და $X_n$ ყველაზე დიდი ვარიანტი. შემდეგ $F_n\left(x\right)=0$ $(x\le X)_1$-ისთვის და $F_n\left(x\right)=1$ $x\ge X_n$-ისთვის.

შემოვიღოთ თეორემა, რომელიც აკავშირებს თეორიულ და ემპირიულ ფუნქციებს.

თეორემა 1

მოდით $F_n\left(x\right)$ იყოს ემპირიული განაწილების ფუნქცია და $F\left(x\right)$ იყოს ზოგადი ნიმუშის თეორიული განაწილების ფუნქცია. მაშინ თანასწორობა მოქმედებს:

\[(\mathop(lim)_(n\ to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

ემპირიული განაწილების ფუნქციის პოვნის ამოცანების მაგალითები

მაგალითი 1

მოდით, შერჩევის განაწილებას შემდეგი მონაცემები ჰქონდეს ჩაწერილი ცხრილის გამოყენებით:

სურათი 1.

იპოვეთ ნიმუშის ზომა, შექმენით ემპირიული განაწილების ფუნქცია და დახაზეთ იგი.

ნიმუშის ზომა: $n=5+10+15+20=50$.

თვისებით 5, გვაქვს ეს $x\le 1$ $F_n\left(x\right)=0$ და $x>4$$F_n\left(x\right)=1$.

$ x ღირებულება

$ x ღირებულება

$ x ღირებულება

ამრიგად, ჩვენ ვიღებთ:

სურათი 2.

სურათი 3.

მაგალითი 2

რუსეთის ცენტრალური ნაწილის ქალაქებიდან შემთხვევით შეირჩა 20 ქალაქი, რისთვისაც მიღებული იქნა შემდეგი მონაცემები საზოგადოებრივი ტრანსპორტის ტარიფების შესახებ: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14. , 15, 13, 13, 12, 12, 15, 14, 14.

შექმენით ემპირიული განაწილების ფუნქცია ამ ნიმუშისთვის და დახაზეთ იგი.

მოდით ჩამოვწეროთ ნიმუშის მნიშვნელობები აღმავალი თანმიმდევრობით და გამოვთვალოთ თითოეული მნიშვნელობის სიხშირე. ჩვენ ვიღებთ შემდეგ ცხრილს:

სურათი 4.

ნიმუშის ზომა: $n=20$.

თვისებით 5, გვაქვს ეს $x\le 12$ $F_n\left(x\right)=0$ და $x>15$$F_n\left(x\right)=1$.

$ x ღირებულება

$ x ღირებულება

$ x ღირებულება

ამრიგად, ჩვენ ვიღებთ:

სურათი 5.

მოდით გამოვსახოთ ემპირიული განაწილება:

სურათი 6.

ორიგინალობა: $92.12\%$.

როგორც ცნობილია, შემთხვევითი ცვლადის განაწილების კანონი შეიძლება განისაზღვროს სხვადასხვა გზით. დისკრეტული შემთხვევითი ცვლადი შეიძლება განისაზღვროს განაწილების სერიის ან ინტეგრალური ფუნქციის გამოყენებით, ხოლო უწყვეტი შემთხვევითი ცვლადი შეიძლება განისაზღვროს ინტეგრალური ან დიფერენციალური ფუნქციის გამოყენებით. განვიხილოთ ამ ორი ფუნქციის შერჩევითი ანალოგები.

დაე, იყოს შემთხვევითი მოცულობის ცვლადის მნიშვნელობების ნიმუში და ამ ნაკრებიდან თითოეული ვარიანტი ასოცირდება მის სიხშირესთან. მოდით შემდგომი არის რაღაც რეალური რიცხვი და - შემთხვევითი ცვლადის ნიმუშის მნიშვნელობების რაოდენობა
, უფრო პატარა .მერე ნომერი არის ნიმუშში დაფიქსირებული რაოდენობის მნიშვნელობების სიხშირე X, უფრო პატარა , იმათ. მოვლენის დადგომის სიხშირე
. როცა იცვლება xზოგადად, ღირებულება ასევე შეიცვლება . ეს ნიშნავს, რომ ფარდობითი სიხშირე არგუმენტის ფუნქციაა . და რადგან ეს ფუნქცია გვხვდება ექსპერიმენტების შედეგად მიღებული ნიმუშის მონაცემებიდან, მას უწოდებენ შერჩევით ან ემპირიული.

განმარტება 10.15. ემპირიული განაწილების ფუნქცია(ნიმუშების განაწილების ფუნქცია) არის ფუნქცია
, განსაზღვრავს თითოეული მნიშვნელობისთვის xმოვლენის ფარდობითი სიხშირე
.

(10.19)

ემპირიული შერჩევის განაწილების ფუნქციისგან განსხვავებით, განაწილების ფუნქცია (x) საერთო მოსახლეობის ე.წ თეორიული განაწილების ფუნქცია. განსხვავება მათ შორის არის თეორიული ფუნქცია (x) განსაზღვრავს მოვლენის ალბათობას
, ხოლო ემპირიული არის ერთი და იგივე მოვლენის ფარდობითი სიხშირე. ბერნულის თეორემიდან გამომდინარეობს

,
(10.20)

იმათ. დიდად ალბათობა
და მოვლენის ფარდობითი სიხშირე
, ე.ი.
ცოტათი განსხვავდება ერთმანეთისგან. აქედან გამომდინარეობს, რომ მიზანშეწონილია გამოიყენოს ნიმუშის ემპირიული განაწილების ფუნქცია ზოგადი პოპულაციის თეორიული (ინტეგრალური) განაწილების ფუნქციის დასაახლოებლად.

ფუნქცია
და
აქვთ იგივე თვისებები. ეს გამომდინარეობს ფუნქციის განმარტებიდან.

Თვისებები
:


მაგალითი 10.4.შექმენით ემპირიული ფუნქცია მოცემული ნიმუშის განაწილების საფუძველზე:

Პარამეტრები

სიხშირეები

გამოსავალი:მოდით ვიპოვოთ ნიმუშის ზომა = 12+18+30=60. ყველაზე პატარა ვარიანტი
, შესაბამისად,
ზე
. მნიშვნელობა
, კერძოდ
დაფიქსირდა 12-ჯერ, შესაბამისად:

=
ზე
.

მნიშვნელობა x< 10, კერძოდ
და
დაფიქსირდა 12+18=30-ჯერ, შესაბამისად,
=
ზე
. ზე

.

საჭირო ემპირიული განაწილების ფუნქცია:

=

განრიგი
ნაჩვენებია ნახ. 10.2


არის. 10.2

საკონტროლო კითხვები

1. რა ძირითად ამოცანებს წყვეტს მათემატიკური სტატისტიკა? 2. ზოგადი და სანიმუშო პოპულაცია? 3. განსაზღვრეთ ნიმუშის ზომა. 4. რომელ ნიმუშებს ეწოდება წარმომადგენლობითი? 5. წარმომადგენლობითობის შეცდომები. 6. შერჩევის ძირითადი მეთოდები. 7. სიხშირის, ფარდობითი სიხშირის ცნებები. 8. სტატისტიკური სერიის ცნება. 9. ჩაწერეთ სტურგესის ფორმულა. 10. ჩამოაყალიბეთ ნიმუშის დიაპაზონის, მედიანისა და რეჟიმის ცნებები. 11. სიხშირის მრავალკუთხედი, ჰისტოგრამა. 12. შერჩევის პოპულაციის პუნქტური შეფასების კონცეფცია. 13. მიკერძოებული და მიუკერძოებელი ქულების შეფასება. 14. ჩამოაყალიბეთ ნიმუშის საშუალო ცნება. 15. ჩამოაყალიბეთ ნიმუშის დისპერსიის ცნება. 16. ჩამოაყალიბეთ ნიმუშის სტანდარტული გადახრის ცნება. 17. ჩამოაყალიბეთ ვარიაციის ნიმუშის კოეფიციენტის ცნება. 18. ჩამოაყალიბეთ სანიმუშო გეომეტრიული საშუალოს ცნება.

ემპირიული განაწილების ფუნქციის განსაზღვრა

დაე, $X$ იყოს შემთხვევითი ცვლადი. $F(x)$ არის მოცემული შემთხვევითი ცვლადის განაწილების ფუნქცია. ჩვენ განვახორციელებთ $n$ ექსპერიმენტებს მოცემულ შემთხვევით ცვლადზე იმავე პირობებში, ერთმანეთისგან დამოუკიდებლად. ამ შემთხვევაში ვიღებთ მნიშვნელობების თანმიმდევრობას $x_1,\ x_2\ $, ... ,$\ x_n$, რომელსაც ეწოდება ნიმუში.

განმარტება 1

თითოეულ მნიშვნელობას $x_i$ ($i=1,2\ $, ... ,$ \ n$) ეწოდება ვარიანტი.

თეორიული განაწილების ფუნქციის ერთი შეფასება არის ემპირიული განაწილების ფუნქცია.

განმარტება 3

ემპირიული განაწილების ფუნქცია $F_n(x)$ არის ფუნქცია, რომელიც განსაზღვრავს თითოეული მნიშვნელობისთვის $x$ მოვლენის შედარებით სიხშირეს $X \

სადაც $n_x$ არის $x$-ზე ნაკლები ვარიანტების რაოდენობა, $n$ არის ნიმუშის ზომა.

განსხვავება ემპირიულ ფუნქციასა და თეორიულს შორის არის ის, რომ თეორიული ფუნქცია განსაზღვრავს მოვლენის ალბათობას $X.

ემპირიული განაწილების ფუნქციის თვისებები

ახლა განვიხილოთ განაწილების ფუნქციის რამდენიმე ძირითადი თვისება.

    $F_n\left(x\right)$ ფუნქციის დიაპაზონი არის $$ სეგმენტი.

    $F_n\left(x\right)$ არის შეუმცირებელი ფუნქცია.

    $F_n\left(x\right)$ არის მარცხენა უწყვეტი ფუნქცია.

    $F_n\left(x\right)$ არის ცალმხრივი მუდმივი ფუნქცია და იზრდება მხოლოდ $X$ შემთხვევითი ცვლადის მნიშვნელობების წერტილებში.

    მოდით $X_1$ იყოს ყველაზე პატარა და $X_n$ ყველაზე დიდი ვარიანტი. შემდეგ $F_n\left(x\right)=0$ $(x\le X)_1$-ისთვის და $F_n\left(x\right)=1$ $x\ge X_n$-ისთვის.

შემოვიღოთ თეორემა, რომელიც აკავშირებს თეორიულ და ემპირიულ ფუნქციებს.

თეორემა 1

მოდით $F_n\left(x\right)$ იყოს ემპირიული განაწილების ფუნქცია და $F\left(x\right)$ იყოს ზოგადი ნიმუშის თეორიული განაწილების ფუნქცია. მაშინ თანასწორობა მოქმედებს:

\[(\mathop(lim)_(n\ to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

ემპირიული განაწილების ფუნქციის პოვნის ამოცანების მაგალითები

მაგალითი 1

მოდით, შერჩევის განაწილებას შემდეგი მონაცემები ჰქონდეს ჩაწერილი ცხრილის გამოყენებით:

სურათი 1.

იპოვეთ ნიმუშის ზომა, შექმენით ემპირიული განაწილების ფუნქცია და დახაზეთ იგი.

ნიმუშის ზომა: $n=5+10+15+20=50$.

თვისებით 5, გვაქვს ეს $x\le 1$ $F_n\left(x\right)=0$ და $x>4$$F_n\left(x\right)=1$.

$ x ღირებულება

$ x ღირებულება

$ x ღირებულება

ამრიგად, ჩვენ ვიღებთ:

სურათი 2.

სურათი 3.

მაგალითი 2

რუსეთის ცენტრალური ნაწილის ქალაქებიდან შემთხვევით შეირჩა 20 ქალაქი, რისთვისაც მიღებული იქნა შემდეგი მონაცემები საზოგადოებრივი ტრანსპორტის ტარიფების შესახებ: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14. , 15, 13, 13, 12, 12, 15, 14, 14.

შექმენით ემპირიული განაწილების ფუნქცია ამ ნიმუშისთვის და დახაზეთ იგი.

მოდით ჩამოვწეროთ ნიმუშის მნიშვნელობები აღმავალი თანმიმდევრობით და გამოვთვალოთ თითოეული მნიშვნელობის სიხშირე. ჩვენ ვიღებთ შემდეგ ცხრილს:

სურათი 4.

ნიმუშის ზომა: $n=20$.

თვისებით 5, გვაქვს ეს $x\le 12$ $F_n\left(x\right)=0$ და $x>15$$F_n\left(x\right)=1$.

$ x ღირებულება

$ x ღირებულება

$ x ღირებულება

ამრიგად, ჩვენ ვიღებთ:

სურათი 5.

მოდით გამოვსახოთ ემპირიული განაწილება:

სურათი 6.

ორიგინალობა: $92.12\%$.