Точкові оцінки параметрів генеральної сукупності
Основним завданням математичної статистики є розробка методів отримання науково обгрунтованих висновків про масові явища та процеси з даних спостережень і експериментів. Ці факти та висновки належать не до окремих випробувань, з повторення яких складається дане масове явище, а являють собою твердження про загальні імовірнісних характеристиках даного процесу, тобто про можливості, законах розподілу, математичних очікуваннях, дисперсіях і т. Д. Таке використання фактичних даних як раз і є відмінною рисою статистичного методу.
Нехай ми маємо відомості (зазвичай досить обмеженими), наприклад, про кількість дефектних виробів в виготовленої в певних умовах продукції або про результати випробувань матеріалів на руйнування і т. П. Зібрані нами дані можуть представляти безпосередній інтерес у сенсі інформації про якість тієї чи іншої партії продукції. Статистичні ж проблеми виникають тоді, коли ми на основі тієї ж інформації починаємо робити висновки щодо більш широкого кола явищ. Так, наприклад, нас може цікавити якість технологічного процесу, для чого ми оцінюємо ймовірність отримання в ньому дефектного виробу або середню довговічність вироби. В цьому випадку ми розглядаємо зібраний матеріал не заради його самого, а лише як певну пробну групу або вибірку, що представляє тільки серії з можливих результатів, які ми могли б зустріти при продовженні спостережень масового процесу в даній обстановці. Висновки і оцінки, засновані на матеріалі спостережень, відображають випадковий склад пробної групи і тому вважаються приблизними оцінками імовірнісного характеру. У багатьох випадках теорія вказує, як найкращим способом використовувати наявну інформацію для отримання по можливості більш точних і надійних характеристик, вказуючи при цьому ступінь надійності висновків, що пояснюється обмеженістю запасу відомостей.
Друге завдання - перевірка гіпотез - полягає в тому, що ми робимо припущення про розподіл ймовірностей випадкової величини (наприклад, про значення одного або декількох параметрів функції розподілу) і вирішуємо, чи узгоджуються в деякому сенсі ці значення параметрів з отриманими результатами спостережень.
Нехай нам потрібно обстежити кількісний ознака в партії примірників деякого товару. Перевірку партії можна проводити двома способами:
1) провести суцільний контроль всієї партії;
2) провести контроль тільки частини партії.
Перший спосіб не завжди здійснимо, наприклад, через великої кількості примірників в партії, через дорожнечу проведення операції контролю, через те, що контроль пов'язаний з руйнуванням примірника (перевірка електролампи на довговічність її роботи).
При другому способі безліч випадковим чином відібраних об'єктів називається вибіркової сукупністю чи вибіркою. Всемножество об'єктів, з якого виробляється вибірка, називається генеральною сукупністю. Число об'єктів у вибірці називається об'ємом вибірки. Зазвичай будемо вважати, що обсяг генеральної сукупності нескінченний.
Вибірки поділяються на повторні (з поверненням) і бесповторном (без повернення).
Зазвичай здійснюються бесповторном вибірки, але завдяки великому (нескінченному) обсягом генеральної сукупності ведуться розрахунки і робляться висновки, справедливі лише для повторних вибірок.
Вибірка повинна досить повно відображати особливості всіх об'єктів генеральної сукупності, інакше кажучи, вибірка повинна битьрепрезентатівной (представницької).
Вибірки розрізняються за способом відбору.
1. Простий випадковий відбір.
Всі елементи генеральної сукупності нумеруються і з таблиці випадкових чисел беруть, наприклад, послідовність будь-яких 30-ти йдуть підряд чисел. Елементи з випали номерами і входять до вибірки.
2. Типовий відбір.
Такий відбір проводиться в тому випадку, якщо генеральну сукупність можна представити у вигляді об'єднання підмножин, об'єкти яких однорідні за якоюсь ознакою, хоча вся сукупність такої однорідності не має (партія товару складається з декількох груп, вироблених на різних підприємствах). Тоді по кожному підмножині проводять простий випадковий відбір, і в вибірку об'єднуються всі отримані об'єкти.
3. Механічний відбір.
Відбирають кожен двадцятий (сотий) екземпляр.
4. Серійний відбір.
До вибірки підбираються екземпляри, вироблені на якомусь виробництві в певний проміжок часу.
Надалі під генеральною сукупністю ми будемо мати на увазі не саме безліч об'єктів, а безліч значень випадкової величини, що приймає числове значення на кожному з об'єктів. Насправді генеральної сукупності як безлічі об'єктів може і не існувати. Наприклад, має сенс говорити про безліч деталей, які можна зробити. використовуючи даний технологічний процес. Використовуючи якісь відомі нам характеристики даного процесу, ми можемо оцінювати параметри цього неіснуючого безлічі деталей. Розмір деталі - це випадкова величина, значення якої визначається впливом безлічі чинників, що становлять технологічний процес. Нас, наприклад, може цікавити ймовірність, з якою ця випадкова величина приймає значення, що належить деякому інтервалу. На це питання можна відповісти, знаючи закон розподілу цієї випадкової величини, а також її параметри, такі як M x і D x.
Отже, відволікаючись від поняття генеральної сукупності як безлічі об'єктів, що володіють деяким ознакою, будемо розглядати генеральну сукупність як випадкову величину x. закон розподілу і параметри якої визначаються за допомогою вибіркового методу.
Розглянемо вибірку обсягу n. представляє дану генеральну сукупність. Перше вибіркове значення x1 будемо розглядати як реалізацію, як одне з можливих значень випадкової величини x1. має той же закон розподілу з тими ж параметрами, що і випадкова величина x. Друге вибіркове значення x2 - одне з можливих значень випадкової величини x2 з тим же законом розподілу, що і випадкова величина x. Те ж саме можна сказати про значення x3, x4. xn.
Таким чином на вибірку будемо дивитися як на сукупність незалежних випадкових величин x1. x2. xn. розподілених так само, як і випадкова величина x. представляє генеральну сукупність .Виборочние значення x1, x2. xn - це значення, які прийняли ці випадкові величини в результаті 1-го, 2-го. n -го експерименту.
Нехай для об'єктів генеральної сукупності визначено певний ознака або числова характеристика, яку можна заміряти (розмір деталі, питома кількість нітратів в дині, шум роботи двигуна). Ця характеристика - випадкова величина x, що приймає на кожному об'єкті певне числове значення. З вибірки обсягу n отримуємо значення цієї випадкової величини у вигляді ряду з n чисел:
Ці числа називаються значеннями ознаки.
Серед чисел ряду (*) можуть бути однакові числа. Якщо значення ознаки упорядкувати, тобто розташувати в порядку зростання або зменшення, написавши кожне значення лише один раз, а потім під кожним значенням xi ознаки написати число mi. що показує скільки раз дане значення зустрічається в ряду (*):
то вийде таблиця, називаемаядіскретним варіаційним рядом. Число mi називається частотою i -гозначенія ознаки.
Очевидно, що xi в ряду (*) може не збігатися з xi в варіаційному ряду. Очевидна також справедливість рівності

Якщо проміжок між найменшим і найбільшим значеннями ознаки у вибірці розбити на кілька інтервалів однакової довжини, кожному інтервалу поставити у відповідність число вибіркових значень ознаки, що потрапили в цей інтервал, то отримаємо інтервальний варіаційний ряд. Якщо ознака може приймати будь-які значення з деякого проміжку, тобто є безперервною випадковою величиною, доводиться вибірку представляти саме таким поруч. Якщо в вариационном интервальном ряду кожен інтервал [ai; ai + 1) замінити лежачим в його середині числом (ai + ai + 1) / 2, то отримаємо дискретний варіаційний ряд. Така заміна цілком природна, так як, наприклад, при вимірюванні розміру деталі з точністю до одного міліметра всіма розмірами з проміжку [49,5; 50,5), буде відповідати одне число, рівне 50.
Точкові оцінки параметрів генеральної сукупності.
У багатьох випадках ми маємо інформацію про вид закону розподілу випадкової величини (нормальний, бернуллиевского, рівномірний і т. П.), Але не знаємо параметрів цього розподілу, таких як M x, D x. Для визначення цих параметрів застосовується вибірковий метод.
Нехай вибірка обсягу n представлена у вигляді варіаційного ряду. Назвемо вибіркової середньої величину
величина


Природно вважати величину вибіркової оцінкою параметра M x. Вибіркова оцінка параметра, що представляє собою число, називаетсяточечной оцінкою.
можна вважати точковою оцінкою дисперсії Dx генеральної сукупності.
Наведемо ще один приклад точкової оцінки. Нехай кожен об'єкт генеральної сукупності характеризується двома кількісними ознаками x і y. Наприклад, деталь може мати два розміри - довжину і ширину. Можна в різних районах вимірювати концентрацію шкідливих речовин в повітрі і фіксувати кількість легеневих захворювань населення в місяць. Можна через рівні проміжки часу зіставляти прибутковість акцій даної корпорації з будь-яким індексом, що характеризує середню прибутковість всього ринку акцій. В цьому випадку генеральна сукупність є двовимірну випадкову величину x, h. Ця випадкова величина приймає значення x, y на безлічі об'єктів генеральної сукупності. Не знаючи закону спільного розподілу випадкових величин x іh, ми не можемо говорити про наявність або глибині кореляційної зв'язку між ними, проте деякі висновки можна зробити, використовуючи вибірковий метод.
Вибірку обсягу n в цьому випадку представимо у вигляді таблиці, де
i-тий відібраний об'єкт (i = 1,2. n) представлений парою чисел xi. yi: