ویژگی های پراکندگی ویژگی های پراکندگی پراکندگی و خواص آن نابرابری چبیشف ویژگی های موقعیت و پراکندگی

مهم نیست که مشخصه های میانگین چقدر مهم هستند، یک مشخصه به همان اندازه مهم یک آرایه از داده های عددی، رفتار اعضای باقیمانده آرایه در رابطه با میانگین است، چقدر با میانگین تفاوت دارند، چند عضو آرایه متفاوت هستند. به طور قابل توجهی از میانگین در طول آموزش تیراندازی آنها در مورد دقت نتایج صحبت می کنند؛ در آمار ویژگی های پراکندگی (گسترش) را مطالعه می کنند.

تفاوت بین هر مقدار x و مقدار متوسط ​​x نامیده می شود انحراف و به عنوان تفاوت x, - x محاسبه می شود. در این حالت، انحراف می تواند هر دو مقدار مثبت را در صورتی که عدد از میانگین بیشتر باشد، و اگر عدد کمتر از میانگین باشد، مقادیر منفی را به خود اختصاص دهد. با این حال، در آمار اغلب مهم است که بتوانیم با یک عدد کار کنیم که «دقت» همه عناصر عددی یک آرایه داده را مشخص کند. هر گونه جمع تمام انحرافات اعضای آرایه به صفر منجر می شود، زیرا انحرافات مثبت و منفی یکدیگر را خنثی می کنند. برای جلوگیری از صفر شدن، تفاوت های مجذور، یا به طور دقیق تر، میانگین حسابی انحرافات مجذور، برای مشخص کردن پراکندگی استفاده می شود. این مشخصه پراکندگی نامیده می شود واریانس نمونه

هر چه واریانس بیشتر باشد، پراکندگی مقادیر متغیر تصادفی بیشتر است. برای محاسبه پراکندگی، یک مقدار تقریبی از میانگین نمونه x با حاشیه یک رقمی در رابطه با همه اعضای آرایه داده استفاده می شود. در غیر این صورت، هنگام جمع کردن تعداد زیادی از مقادیر تقریبی، خطای قابل توجهی جمع می شود. در رابطه با ابعاد مقادیر عددی، باید به یکی از اشکالات شاخص پراکندگی مانند پراکندگی نمونه اشاره کرد: واحد اندازه گیری پراکندگی D مربع واحد اندازه گیری مقادیر است ایکس، که مشخصه آن پراکندگی است. برای خلاص شدن از شر این اشکال، آمار چنین مشخصه پراکندگی را معرفی کرد انحراف استاندارد نمونه ، که با علامت نشان داده می شود آ (بخوانید "سیگما") و با استفاده از فرمول محاسبه می شود

به طور معمول، بیش از نیمی از اعضای آرایه داده با میانگین کمتر از انحراف استاندارد تفاوت دارند، یعنی. متعلق به بخش [ایکس - آ؛ x + a]. در غیر این صورت می گویند: میانگین با احتساب پراکندگی داده ها برابر با x ± a است.

معرفی یکی دیگر از مشخصه های پراکندگی با بعد اعضای آرایه داده مرتبط است. تمام ویژگی های عددی در آمار به منظور مقایسه نتایج حاصل از مطالعه آرایه های عددی مختلف که متغیرهای تصادفی مختلف را مشخص می کنند، معرفی شده اند. با این حال، مقایسه انحرافات استاندارد از مقادیر میانگین مختلف مجموعه داده‌های مختلف نشان‌دهنده نیست، به خصوص اگر ابعاد این مقادیر نیز متفاوت باشد. به عنوان مثال، اگر طول و وزن هر جسم یا پراکندگی در ساخت محصولات خرد و کلان مقایسه شود. در رابطه با ملاحظات فوق یک مشخصه پراکندگی نسبی معرفی می شود که به آن می گویند ضریب تغییرو با فرمول محاسبه می شود

برای محاسبه ویژگی های عددی پراکندگی مقادیر متغیر تصادفی، استفاده از جدول راحت است (جدول 6.9).

جدول 6.9

محاسبه ویژگی های عددی پراکندگی مقادیر متغیر تصادفی

Xj- ایکس

(Xj-X)2/

میانگین نمونه در حال تکمیل این جدول است. ایکس،که در آینده به دو صورت استفاده خواهد شد. به عنوان مشخصه میانگین نهایی (مثلاً در ستون سوم جدول) میانگین نمونه ایکسباید به رقمی گرد شود که مربوط به کوچکترین رقم یکی از اعضای آرایه داده های عددی است x gاما از این شاخص در جدول برای محاسبات بیشتر استفاده می شود و در این شرایط، یعنی هنگام محاسبه در ستون چهارم جدول، میانگین نمونه ایکسباید با حاشیه یک رقمی نسبت به کوچکترین رقم یکی از اعضای آرایه داده های عددی گرد شود. ایکس ( .

نتیجه محاسبات با استفاده از جدولی مانند جدول. 6.9 مقدار پراکندگی نمونه را به دست می آورد و برای ثبت پاسخ لازم است بر اساس مقدار پراکندگی نمونه، مقدار انحراف معیار a محاسبه شود.

پاسخ نشان می دهد: الف) نتیجه متوسط ​​با در نظر گرفتن پراکندگی داده ها در فرم x±o; ب) مشخصه پایداری داده V.پاسخ باید کیفیت ضریب تغییرات را ارزیابی کند: خوب یا بد.

ضریب تغییرات قابل قبول به عنوان شاخص همگنی یا پایداری نتایج در تحقیقات ورزشی 10-15 درصد در نظر گرفته شده است. ضریب تغییرات V= 20% در هر تحقیقی رقم بسیار بزرگی در نظر گرفته می شود. اگر حجم نمونه پ> 25، پس V> 32 درصد شاخص بسیار بدی است.

به عنوان مثال، برای یک سری تغییرات گسسته 1; 5 4 4 5 3; 3; 1 1 1 1 1 1 3; 3; 5 3; 5 4 4 3; 3; 3; 3; 3 میز 6.9 به شرح زیر پر می شود (جدول 6.10).

جدول 6.10

نمونه ای از محاسبه ویژگی های عددی پراکندگی مقادیر

*1

فی

1

L پ 25 = 2,92 = 2,9

D_S_47.6_ پ 25

پاسخ: الف) مشخصه متوسط ​​با در نظر گرفتن پراکندگی داده ها برابر است ایکس± a = = 3 ± 1.4; ب) پایداری اندازه‌گیری‌های به‌دست‌آمده در سطح پایینی است، زیرا ضریب تغییرات است V = 48% > 32%.

آنالوگ جدول 6.9 همچنین می تواند برای محاسبه ویژگی های پراکندگی یک سری تغییرات بازه ای استفاده شود. در همان زمان، گزینه ها x gبا نمایندگان شکاف جایگزین خواهد شد xv ja گزینه فرکانس مطلق f(-به فرکانس مطلق فواصل fv

با توجه به موارد فوق می توان موارد زیر را انجام داد: نتیجه گیری

اگر اطلاعات مربوط به پدیده های انبوه پردازش شود، نتایج آمار ریاضی قابل قبول است.

به طور معمول، یک نمونه از جمعیت عمومی اشیا مورد مطالعه قرار می گیرد که باید نماینده باشد.

داده های تجربی به دست آمده در نتیجه مطالعه هر خاصیت اشیاء نمونه، مقدار یک متغیر تصادفی را نشان می دهد، زیرا محقق نمی تواند از قبل پیش بینی کند که کدام عدد با یک شی خاص مطابقت دارد.

برای انتخاب یک یا دیگر الگوریتم برای توصیف و پردازش اولیه داده های تجربی، مهم است که بتوانیم نوع متغیر تصادفی را تعیین کنیم: گسسته، پیوسته یا مختلط.

متغیرهای تصادفی گسسته توسط یک سری تغییرات گسسته و شکل گرافیکی آن - یک چند ضلعی فرکانس توصیف می شوند.

متغیرهای تصادفی مخلوط و پیوسته با یک سری تغییرات بازه ای و شکل گرافیکی آن - هیستوگرام توصیف می شوند.

هنگام مقایسه چند نمونه با توجه به سطح تولید شده یک ویژگی خاص، از میانگین ویژگی های عددی و ویژگی های عددی پراکندگی یک متغیر تصادفی در رابطه با میانگین استفاده می شود.

هنگام محاسبه مشخصه متوسط، مهم است که نوع مشخصه متوسط ​​را به درستی انتخاب کنید که برای حوزه کاربرد آن مناسب باشد. مقادیر میانگین ساختاری، حالت و میانه، ساختار مکان متغیر را در یک آرایه مرتب از داده های تجربی مشخص می کند. میانگین کمی امکان قضاوت در مورد اندازه متوسط ​​گزینه (میانگین نمونه) را فراهم می کند.

برای محاسبه مشخصات عددی پراکندگی - واریانس نمونه، انحراف معیار و ضریب تغییرات - روش جدولی موثر است.

ویژگی های موقعیت مرکز توزیع را توصیف می کند. در عین حال، معانی گزینه را می توان در اطراف آن در یک نوار پهن و باریک گروه بندی کرد. بنابراین، برای توصیف توزیع، لازم است دامنه تغییرات در مقادیر مشخصه مشخص شود. مشخصه های پراکندگی برای توصیف دامنه تغییرات یک مشخصه استفاده می شود. پرکاربردترین آنها محدوده تغییرات، پراکندگی، انحراف معیار و ضریب تغییرات هستند.

محدوده تنوعبه عنوان تفاوت بین حداکثر و حداقل مقدار یک مشخصه در جمعیت مورد مطالعه تعریف می شود:

آر=ایکسحداکثر - ایکسدقیقه

مزیت آشکار شاخص مورد بررسی، سادگی محاسبه است. با این حال، از آنجایی که دامنه تغییرات فقط به مقادیر مقادیر شدید مشخصه بستگی دارد، دامنه کاربرد آن به توزیع های نسبتاً همگن محدود می شود. در موارد دیگر، محتوای اطلاعاتی این شاخص بسیار کوچک است، زیرا توزیع های زیادی وجود دارد که از نظر شکل بسیار متفاوت هستند، اما محدوده یکسانی دارند. در مطالعات عملی، دامنه تغییرات گاهی با حجم نمونه کوچک (بیش از 10) استفاده می شود. به عنوان مثال، از روی دامنه تغییرات، به راحتی می توان ارزیابی کرد که بهترین و بدترین نتایج در یک گروه از ورزشکاران چقدر متفاوت است.

در این مثال:

آر= 16.36 - 13.04 = 3.32 (m).

دومین ویژگی پراکندگی این است پراکندگیپراکندگی میانگین مربع انحراف یک متغیر تصادفی از میانگین آن است. پراکندگی یک مشخصه پراکندگی است، گسترش مقادیر یک کمیت در اطراف مقدار متوسط ​​آن. خود کلمه «پراکندگی» به معنای «پراکندگی» است.

هنگام انجام مطالعات نمونه، لازم است برآوردی برای واریانس ایجاد شود. واریانس محاسبه شده از داده های نمونه، واریانس نمونه نامیده می شود و نشان داده می شود اس 2 .

در نگاه اول، طبیعی ترین برآورد برای واریانس، واریانس آماری است که بر اساس تعریف با استفاده از فرمول محاسبه می شود:

در این فرمول - مجموع انحرافات مربع مقادیر ویژگی x iاز میانگین حسابی . برای به دست آوردن میانگین انحراف مربع، این مجموع بر حجم نمونه تقسیم می شود پ.

با این حال، چنین برآوردی بی طرفانه نیست. می توان نشان داد که مجموع انحرافات مجذور مقادیر ویژگی برای یک میانگین حسابی نمونه کمتر از مجذور انحرافات از هر مقدار دیگر، از جمله از میانگین واقعی (انتظار ریاضی) است. بنابراین، نتیجه به دست آمده از فرمول فوق حاوی یک خطای سیستماتیک خواهد بود و مقدار تخمینی واریانس کمتر برآورد می شود. برای از بین بردن سوگیری، کافی است یک عامل اصلاح را معرفی کنید. نتیجه رابطه زیر برای واریانس برآورد شده است:

برای مقادیر بزرگ nبه طور طبیعی، هر دو تخمین - مغرضانه و بی طرفانه - تفاوت بسیار کمی خواهند داشت و معرفی یک عامل اصلاح بی معنی می شود. به عنوان یک قاعده، فرمول تخمین واریانس زمانی باید اصلاح شود n<30.

در مورد داده های گروه بندی شده، آخرین فرمول را می توان به شکل زیر کاهش داد تا محاسبات ساده شود:

جایی که ک- تعداد فواصل گروه بندی.

n من- فرکانس بازه با عدد من;

x i- مقدار میانه فاصله با عدد من.

به عنوان مثال، اجازه دهید واریانس داده های گروه بندی شده مثالی را که در حال تجزیه و تحلیل هستیم محاسبه کنیم (جدول 4 را ببینید).

اس 2 =/ 28=0.5473 (m2).

واریانس یک متغیر تصادفی دارای بعد مربع ابعاد متغیر تصادفی است که تفسیر آن را دشوار می کند و باعث می شود خیلی واضح نباشد. برای توصیف بصری بیشتر پراکندگی، استفاده از مشخصه ای که بعد آن با بعد مشخصه مورد مطالعه مطابقت دارد راحت تر است. برای این منظور مفهومی معرفی شده است انحراف معیار(یا انحراف معیار).

انحراف معیارجذر مثبت واریانس نامیده می شود:

در مثال ما، انحراف معیار برابر است با

انحراف معیار دارای واحدهای اندازه گیری مشابه نتایج اندازه گیری مشخصه مورد مطالعه است و بنابراین، درجه انحراف مشخصه را از میانگین حسابی مشخص می کند. به عبارت دیگر نشان می دهد که چگونه قسمت اصلی گزینه نسبت به میانگین حسابی قرار گرفته است.

انحراف معیار و واریانس پرکاربردترین معیارهای تغییرات هستند. این به دلیل این واقعیت است که آنها در بخش قابل توجهی از قضایای نظریه احتمال گنجانده شده اند که به عنوان پایه و اساس آمار ریاضی عمل می کند. علاوه بر این، واریانس را می توان به عناصر مؤلفه آن تجزیه کرد، که امکان ارزیابی تأثیر عوامل مختلف بر تنوع صفت مورد مطالعه را فراهم می کند.

علاوه بر شاخص های مطلق تغییرات که پراکندگی و انحراف معیار است، شاخص های نسبی نیز در آمار معرفی شده اند. اغلب از ضریب تغییرات استفاده می شود. ضریب تغییراتبرابر با نسبت انحراف استاندارد به میانگین حسابی که به صورت درصد بیان می شود:

از تعریف مشخص می شود که به معنای آن، ضریب تغییرات معیاری نسبی از پراکندگی یک مشخصه است.

برای مثال مورد بحث:

ضریب تغییرات به طور گسترده در تحقیقات آماری استفاده می شود. به عنوان یک مقدار نسبی، به شما امکان می دهد تغییرپذیری هر دو ویژگی را که واحدهای اندازه گیری متفاوتی دارند، و همچنین یک ویژگی را در چندین جمعیت مختلف با مقادیر مختلف میانگین حسابی مقایسه کنید.

از ضریب تغییرات برای مشخص کردن همگنی داده های تجربی به دست آمده استفاده می شود. در تمرین فرهنگ بدنی و ورزش، گسترش نتایج اندازه گیری بسته به مقدار ضریب تغییرات کم در نظر گرفته می شود (V<10%), средним (11-20%) и большим (V> 20%).

محدودیت در استفاده از ضریب تغییرات با ماهیت نسبی آن مرتبط است - این تعریف شامل نرمال سازی به میانگین حسابی است. در این راستا، در مقادیر مطلق کوچک میانگین حسابی، ضریب تغییرات ممکن است محتوای اطلاعاتی خود را از دست بدهد. هرچه میانگین حسابی به صفر نزدیکتر باشد، اطلاعات این شاخص کمتر می شود. در حالت محدود، میانگین حسابی به صفر می‌رسد (مثلاً دما) و ضریب تغییرات بدون توجه به گسترش مشخصه به بی‌نهایت می‌رود. با قیاس با حالت خطا می توان قاعده زیر را تدوین کرد. اگر مقدار میانگین حسابی در نمونه بیشتر از یک باشد، استفاده از ضریب تغییرات قانونی است، در غیر این صورت، پراکندگی و انحراف معیار باید برای توصیف پراکندگی داده‌های تجربی استفاده شود.

در پایان این بخش، ارزیابی تغییرات در مقادیر ویژگی های ارزیابی را در نظر خواهیم گرفت. همانطور که قبلا ذکر شد، مقادیر مشخصه های توزیع محاسبه شده از داده های تجربی با مقادیر واقعی آنها برای جمعیت عمومی منطبق نیست. امکان تعیین دقیق دومی وجود ندارد، زیرا، به عنوان یک قاعده، بررسی کل جمعیت غیرممکن است. اگر از نتایج نمونه های مختلف از یک جامعه برای تخمین پارامترهای توزیع استفاده کنیم، معلوم می شود که این تخمین ها برای نمونه های مختلف با یکدیگر متفاوت است. مقادیر تخمینی حول مقادیر واقعی آنها در نوسان است.

انحراف برآورد پارامترهای کلی از مقادیر واقعی این پارامترها را خطاهای آماری می نامند. دلیل وقوع آنها حجم نمونه محدود است - همه اشیاء در جمعیت عمومی در آن گنجانده نمی شوند. برای تخمین بزرگی خطاهای آماری از انحراف معیار مشخصات نمونه استفاده می شود.

به عنوان مثال، مهمترین ویژگی موقعیت - میانگین حسابی را در نظر بگیرید. می توان نشان داد که انحراف معیار میانگین حسابی با رابطه زیر تعیین می شود:

جایی که σ - انحراف معیار برای جمعیت.

از آنجایی که مقدار واقعی انحراف معیار مشخص نیست، کمیتی نامیده می شود خطای استاندارد میانگین حسابیو برابر:

مقدار خطا را مشخص می کند که به طور متوسط ​​هنگام جایگزینی میانگین عمومی با تخمین نمونه آن مجاز است. طبق فرمول، افزایش حجم نمونه در حین مطالعه منجر به کاهش خطای استاندارد به نسبت جذر حجم نمونه می شود.

برای مثال مورد بررسی، خطای استاندارد میانگین حسابی برابر است با . در مورد ما، معلوم شد که 5.4 برابر کمتر از انحراف استاندارد است.

    سطح پراکندگی موثر (منطقه)- مشخصه بازتابی هدف که با نسبت توان الکتریکی بیان می شود. ماگ انرژی منعکس شده توسط هدف در جهت گیرنده به سطحی که چگالی شار انرژی بر روی هدف وارد می شود. بستگی دارد به… … دایره المعارف نیروهای موشکی استراتژیک

    مکانیک کوانتومی ... ویکی پدیا

    - (EPR) مشخصه بازتابی یک هدف که توسط امواج الکترومغناطیسی تابش می شود. مقدار EPR به عنوان نسبت جریان (قدرت) انرژی الکترومغناطیسی منعکس شده توسط هدف در جهت تجهیزات رادیویی الکترونیکی (RES) به... ... Marine Dictionary تعریف می شود.

    باند پراکنده- ویژگی های آماری داده های تجربی، منعکس کننده انحراف آنها از مقدار متوسط. موضوعات: متالورژی به طور کلی EN گروه ناامید ... راهنمای مترجم فنی

    - (تابع انتقال مدولاسیون)، عملکرد، با کمک برش، ویژگی های "تیز" لنزهای نوری تصویربرداری ارزیابی می شود. سیستم ها و بخش عناصر چنین سیستم هایی Ch.k.x. به اصطلاح تبدیل فوریه است. تابع پراکندگی خط که ماهیت "گسترش" را توصیف می کند... ... دایره المعارف فیزیکی

    تابع انتقال مدولاسیون، تابعی که ویژگی‌های «شارپنس» سیستم‌های نوری تصویربرداری و عناصر منفرد چنین سیستم‌هایی را ارزیابی می‌کند (به عنوان مثال، وضوح تصویر عکاسی را ببینید). Ch.k.x. فوریه هست... ...

    باند پراکنده- مشخصه آماری داده های تجربی، منعکس کننده انحراف آنها از مقدار متوسط. همچنین ببینید: نوار لغزش، نوار ریزش، نوار سختی ... فرهنگ لغت دایره المعارف متالورژی

    باند پراکندگی- مشخصه آماری داده های تجربی، منعکس کننده انحراف آنها از مقدار متوسط ​​... فرهنگ لغت متالورژی

    ویژگی های پراکندگی مقادیر متغیر تصادفی. M. t. h با فرمول σ به انحراف مربع مربوط می شود (نگاه کنید به انحراف مربع) σ این روش اندازه گیری پراکندگی با این واقعیت توضیح داده می شود که در حالت عادی ... ... دایره المعارف بزرگ شوروی

    آمار تغییرات- آمار تغییرات، اصطلاحی است که گروهی از تکنیک های تجزیه و تحلیل آماری را که عمدتاً در علوم طبیعی استفاده می شوند، متحد می کند. در نیمه دوم قرن نوزدهم. کویتله، "Anthro pomete ou mesure des differentes facultes de 1... ... دایره المعارف بزرگ پزشکی

    ارزش مورد انتظار- (میانگین جمعیت) انتظار ریاضی توزیع احتمال یک متغیر تصادفی است انتظار ریاضی، تعریف، انتظار ریاضی متغیرهای تصادفی گسسته و پیوسته، نمونه، انتظار شرطی، محاسبه،... ... دایره المعارف سرمایه گذار

یکی از دلایل انجام تجزیه و تحلیل آماری، نیاز به در نظر گرفتن تأثیر عوامل تصادفی (اختلال) بر شاخص مورد مطالعه است که منجر به پراکندگی (پراکندگی) داده ها می شود. حل مشکلاتی که در آنها داده های پراکنده وجود دارد با خطر همراه است، زیرا حتی اگر از تمام اطلاعات موجود استفاده کنید، نمی توانید دقیقاپیش بینی کنید در آینده چه اتفاقی خواهد افتاد. برای مقابله مناسب با چنین شرایطی، بهتر است ماهیت خطر را درک کنید و بتوانید درجه پراکندگی یک مجموعه داده را تعیین کنید. سه مشخصه عددی وجود دارد که اندازه پراکندگی را توصیف می کند: انحراف معیار، محدوده و ضریب تغییرات (تغییرپذیری). بر خلاف شاخص های معمولی (میانگین، میانه، حالت) که مرکز را مشخص می کند، ویژگی های پراکندگی نشان می دهد چقدر نزدیکمقادیر مجزای مجموعه داده به سمت این مرکز قرار دارد
تعریف انحراف معیار انحراف معیار(انحراف استاندارد) اندازه گیری انحراف تصادفی مقادیر داده ها از میانگین است. در زندگی واقعی، بیشتر داده ها با پراکندگی مشخص می شوند، یعنی. مقادیر فردی در فاصله ای از میانگین قرار دارند.
استفاده از انحراف معیار به عنوان یک مشخصه کلی پراکندگی صرفاً با میانگین گیری انحرافات داده ها غیرممکن است، زیرا بخشی از انحرافات مثبت و بخشی دیگر منفی و در نتیجه ممکن است نتیجه میانگین گیری برابر با صفر برای خلاص شدن از شر علامت منفی، از تکنیک استاندارد استفاده کنید: ابتدا محاسبه کنید پراکندگیبه عنوان مجموع انحرافات مجذور تقسیم بر ( n–1)، و سپس جذر از مقدار حاصل گرفته می شود. فرمول محاسبه انحراف معیار به شرح زیر است: نکته 1: واریانس در مقایسه با انحراف معیار اطلاعات اضافی را منتقل نمی کند، اما تفسیر آن دشوارتر است زیرا در واحدهای مربع بیان می شود، در حالی که انحراف معیار بیان می شود. در واحدهای آشنا برای ما (به عنوان مثال، دلار). نکته 2 : فرمول فوق برای محاسبه انحراف معیار یک نمونه بوده و با دقت بیشتری نامیده می شود انحراف استاندارد نمونه. هنگام محاسبه انحراف معیار جمعیت(با علامت s مشخص می شود) تقسیم بر n. مقدار انحراف استاندارد نمونه کمی بزرگتر است (زیرا تقسیم بر n-1)، که تصحیحی برای تصادفی بودن خود نمونه فراهم می کند. هنگامی که مجموعه داده به طور معمول توزیع می شود، انحراف معیار معنای خاصی پیدا می کند. در شکل زیر در دو طرف میانگین به ترتیب در فواصل یک، دو و سه انحراف معیار علامت گذاری شده است. شکل نشان می دهد که تقریباً 66.7٪ (دو سوم) از همه مقادیر در یک انحراف استاندارد در دو طرف میانگین قرار می گیرند، 95٪ از مقادیر در دو انحراف استاندارد میانگین قرار می گیرند و تقریباً همه داده ها قرار می گیرند. (99.7%) در سه انحراف استاندارد از میانگین خواهد بود.
66,7%


این ویژگی انحراف استاندارد برای داده‌های توزیع شده عادی «قانون دو سوم» نامیده می‌شود.

در برخی موقعیت‌ها، مانند تجزیه و تحلیل کنترل کیفیت محصول، محدودیت‌هایی اغلب به‌گونه‌ای تعیین می‌شوند که مشاهدات (3/0%) که بیش از سه انحراف استاندارد از میانگین دارند، یک مشکل ارزشمند در نظر گرفته می‌شوند.

متأسفانه، اگر داده ها از توزیع نرمال پیروی نکنند، قانون توضیح داده شده در بالا قابل اعمال نیست.

در حال حاضر محدودیتی به نام قانون چبیشف وجود دارد که می تواند برای توزیع های نامتقارن (کج) اعمال شود.

مجموعه داده های اولیه SV را تولید کنید

جدول 1 پویایی تغییرات سود روزانه در بورس اوراق بهادار ثبت شده در روزهای کاری دوره 31 تیر تا 9 مهر 87 را نشان می دهد.

جدول 1. پویایی تغییرات سود روزانه در بورس اوراق بهادار

تاریخ سود روزانه تاریخ سود روزانه تاریخ سود روزانه
-0,006 0,009 0,012
-0,004 -0,015 -0,004
0,008 -0,006 0,002
0,011 0,002 -0,008
-0,001 0,011 -0,010
0,017 0,013 -0,013
0,017 0,002 0,009
-0,004 -0,018 -0,020
0,008 -0,014 -0,003
-0,002 -0,001 -0,001
0,006 -0,001 0,017
-0,017 -0,013 0,001
0,004 0,030 -0,000
0,015 0,007 -0,035
0,001 -0,007 0,001
-0,005 0,001 -0,014
اکسل را راه اندازی کنید
فایل ایجاد کنید روی دکمه ذخیره در نوار ابزار استاندارد کلیک کنید. پوشه Statistics را در کادر محاوره ای ظاهر شده باز کنید و نام فایل Scattering Characteristics.xls را بگذارید.
برچسب را تنظیم کنید 6. در Sheet1، در سلول A1، برچسب روزانه سود، 7 را تنظیم کنید و در محدوده A2:A49، داده های جدول 1 را وارد کنید.
تابع AVERAGE VALUE را تنظیم کنید 8. در سلول D1، برچسب Average را وارد کنید. در سلول D2، میانگین را با استفاده از تابع آماری AVERAGE محاسبه کنید.
عملکرد STANDARDEV را تنظیم کنید در سلول D4، برچسب استاندارد انحراف را وارد کنید. در سلول D5، انحراف معیار را با استفاده از تابع آماری STDEV محاسبه کنید
اندازه بیت حاصل را به رقم چهارم اعشار کاهش دهید.
تفسیر نتایج کاهش می یابدمیانگین سود روزانه 0.04% بود (میانگین سود روزانه 0.0004- بود). این بدان معناست که میانگین سود روزانه برای دوره مورد نظر تقریباً صفر بوده است، یعنی. بازار یک نرخ متوسط ​​را حفظ کرد. انحراف معیار 0.0118 بود. این بدان معنی است که یک دلار (1 دلار) سرمایه گذاری شده در بازار سهام به طور متوسط ​​0.0118 دلار در روز تغییر می کند، یعنی. سرمایه گذاری او می تواند منجر به سود یا زیان 0.0118 دلار شود.
بیایید بررسی کنیم که آیا مقادیر سود روزانه ارائه شده در جدول 1 با قوانین توزیع عادی مطابقت دارد یا خیر 1. فاصله مربوط به یک انحراف معیار در دو طرف میانگین را محاسبه کنید. 2. در سلول های D7، D8 و F8 به ترتیب برچسب ها را تنظیم کنید: یک انحراف استاندارد، کران پایین، کران بالا. 3. در سلول D9 فرمول = -0.0004 – 0.0118 و در سلول F9 فرمول = -0.0004 + 0.0118 را وارد کنید. 4. نتیجه را تا رقم چهارم اعشار دقیق بگیرید.

5. تعداد مقادیر سود روزانه را که در یک انحراف استاندارد قرار دارند، تعیین کنید. ابتدا داده ها را فیلتر کنید و مقادیر سود روزانه را در محدوده [-0.0121، 0.0114] بگذارید. برای انجام این کار، هر سلول در ستون A را با مقادیر سود روزانه انتخاب کنید و دستور را اجرا کنید:

Data®Filter®AutoFilter

منو را با کلیک بر روی فلش در هدر باز کنید سود روزانهو (شرط...) را انتخاب کنید. در کادر محاوره ای Custom AutoFilter، گزینه ها را مطابق شکل زیر تنظیم کنید. روی OK کلیک کنید.

برای شمارش تعداد داده های فیلتر شده، محدوده مقادیر سود روزانه را انتخاب کنید، بر روی فضای خالی در نوار وضعیت کلیک راست کرده و تعداد مقادیر را از منوی زمینه انتخاب کنید. نتیجه را بخوانید. اکنون تمام داده های اصلی را با اجرای دستور: Data®Filter®Display All نمایش دهید و فیلتر خودکار را با استفاده از دستور: Data®Filter®AutoFilter خاموش کنید.

6. درصد مقادیر سود روزانه را که یک انحراف استاندارد با میانگین فاصله دارند محاسبه کنید. برای انجام این کار، برچسب را در سلول H8 قرار دهید درصدو در سلول H9 فرمول محاسبه درصد را برنامه ریزی کنید و نتیجه را با دقت یک رقم اعشار بدست آورید.

7. محدوده مقادیر سود روزانه را در دو انحراف استاندارد از میانگین محاسبه کنید. در سلول های D11، D12 و F12، برچسب ها را بر اساس آن تنظیم کنید: دو انحراف معیار, خط پایین, حد بالا. فرمول های محاسباتی را در سلول های D13 و F13 وارد کنید و نتیجه را تا رقم چهارم اعشار دقیق دریافت کنید.

8. ابتدا با فیلتر کردن داده ها، تعداد مقادیر سود روزانه را که در دو انحراف استاندارد قرار دارند، تعیین کنید.

9. درصد مقادیر سود روزانه را که دو انحراف استاندارد از میانگین فاصله دارند محاسبه کنید. برای انجام این کار، برچسب را در سلول H12 قرار دهید درصدو در سلول H13 فرمول محاسبه درصد را برنامه ریزی کنید و نتیجه را با دقت یک رقم اعشار بدست آورید.

10. محدوده مقادیر سود روزانه را در سه انحراف استاندارد از میانگین محاسبه کنید. در سلول‌های D15، D16 و F16، برچسب‌ها را بر این اساس تنظیم کنید: سه انحراف معیار, خط پایین, حد بالا. فرمول های محاسباتی را در سلول های D17 و F17 وارد کنید و نتیجه را تا رقم چهارم اعشار دقیق دریافت کنید.

11. ابتدا با فیلتر کردن داده ها، تعداد مقادیر سود روزانه را که در سه انحراف استاندارد قرار دارند، تعیین کنید. درصد ارزش های سود روزانه را محاسبه کنید. برای انجام این کار، برچسب را در سلول H16 قرار دهید درصدو در سلول H17 فرمول محاسبه درصد را برنامه ریزی کنید و نتیجه را با دقت یک رقم اعشار بدست آورید.

13. یک هیستوگرام از بازده روزانه سهام در بورس بسازید و آن را همراه با جدول توزیع فراوانی در ناحیه J1:S20 قرار دهید. میانگین تقریبی و فواصل مربوط به یک، دو و سه انحراف معیار از میانگین را روی هیستوگرام نشان دهید.

ویژگی های پراکندگی

اقدامات پراکندگی نمونه برداری

حداقل و حداکثر نمونه به ترتیب کوچکترین و بزرگترین مقادیر متغیر مورد مطالعه است. تفاوت بین حداکثر و حداقل نامیده می شود محدودهنمونه ها. تمام داده های نمونه بین حداقل و حداکثر قرار دارند. به نظر می رسد این شاخص ها مرزهای نمونه را مشخص می کنند.

R№1= 15.6-10=5.6

R شماره 2 =0.85-0.6=0.25

واریانس نمونه(انگلیسی) واریانس) و انحراف معیارنمونه (انگلیسی) انحراف معیار) معیاری برای تغییرپذیری یک متغیر هستند و درجه پراکندگی داده ها در اطراف مرکز را مشخص می کنند. در این مورد، انحراف معیار به دلیل این واقعیت است که ابعاد آن مشابه داده های واقعی مورد مطالعه است، شاخص راحت تری است. بنابراین از شاخص انحراف معیار به همراه میانگین حسابی نمونه برای توصیف مختصر نتایج تجزیه و تحلیل داده ها استفاده می شود.

محاسبه واریانس نمونه با استفاده از فرمول مناسب تر است:

انحراف استاندارد با استفاده از فرمول محاسبه می شود:

ضریب تغییرات یک معیار نسبی از پراکندگی یک صفت است.

ضریب تغییرات نیز به عنوان شاخصی برای همگنی مشاهدات نمونه استفاده می شود. اعتقاد بر این است که اگر ضریب تغییرات از 10٪ تجاوز نکند، می توان نمونه را همگن در نظر گرفت، یعنی از یک جمعیت عمومی به دست آمده است.

از آنجایی که ضریب تغییرات در هر دو نمونه است، همگن هستند.

نمونه را می توان به صورت تحلیلی در قالب یک تابع توزیع و همچنین به صورت جدول فرکانس متشکل از دو خط ارائه کرد. در خط بالایی عناصر انتخاب (گزینه ها) قرار دارند که به ترتیب صعودی مرتب شده اند. فرکانس های گزینه در خط پایین نوشته شده است.

فرکانس متغیر عددی برابر با تعداد تکرارهای یک نوع معین در نمونه است.

نمونه شماره 1 "مادران"

نوع منحنی توزیع

عدم تقارنیا ضریب چولگی (اصطلاحی که برای اولین بار توسط پیرسون، 1895 ابداع شد) معیاری برای چولگی یک توزیع است. اگر چولگی به وضوح با 0 متفاوت باشد، توزیع نامتقارن است، چگالی توزیع نرمال نسبت به میانگین متقارن است.

فهرست مطالب عدم تقارن(انگلیسی) چولگی) برای مشخص کردن درجه تقارن توزیع داده ها در اطراف مرکز استفاده می شود. عدم تقارن می تواند هم ارزش منفی و هم ارزش مثبت داشته باشد. یک مقدار مثبت برای این پارامتر نشان می دهد که داده ها به سمت چپ مرکز منتقل شده اند و یک مقدار منفی نشان می دهد که داده ها به سمت راست منتقل شده اند. بنابراین، علامت شاخص چولگی جهت سوگیری داده ها را نشان می دهد، در حالی که بزرگی نشان دهنده درجه این سوگیری است. چولگی برابر با صفر نشان می دهد که داده ها به طور متقارن در اطراف مرکز متمرکز شده اند.

زیرا عدم تقارن مثبت است، بنابراین، بالای منحنی به سمت چپ مرکز حرکت می کند.

ضریب کورتوز(انگلیسی) کشیدگی) مشخصه ای است که نشان می دهد تا چه حد عمده داده ها در اطراف مرکز گروه بندی شده اند.

با کشیدگی مثبت، منحنی تیز می شود، با کشیدگی منفی، صاف می شود.

منحنی صاف شده است.

منحنی تیز می شود.