Оцінка параметрів генеральної сукупності за її вибірці
Припустимо, що генеральна сукупність є нор-ною розподілом (тут замість ймовірності слід ис-користувати відносну частоту). Нормальний розподіл повністю визначено математичним очікуванням (середнім зна-ченням) і середнім квадратичним відхиленням. Тому якщо за вибіркою можна оцінити, т. Е. Приблизно знайти, ці парамет-ри, то буде вирішена одна з задач математичної статистики - визначення параметрів великого масиву по дослідженню його частини.
Як і для вибірки, для генеральної сукупності можна оп-рідшали генеральну середню - середнє арифметичне значення всіх величин, що складають цю сукупність. Враховувати-вая великий обсяг цієї сукупності, можна вважати, що гені-ральная середня дорівнює математичному очікуванню:
де X - загальна запис випадкової величини (значення досліджуваного ознаки) генеральної сукупності.
Розсіювання значень досліджуваного ознаки генеральної сово-купності від їх генеральної середньої оцінюють генеральної дис-Персією
де N - обсяг генеральної сукупності, або генеральним середовищ-них квадратичним відхиленням
Точкова оцінка. Припустимо, що з генеральної сукупність-ності виробляються різні вибірки; роблять це так, щоб вся генеральна сукупність зберігалася незмінною. Для визна-лінощів будемо вважати обсяги цих вибірок однаковими і рав-ними п. Їх вибіркові середні є випадок-величинами, які розподілені по нормальному зако-ну (див. Кінець § 2.3), а їх математичне сподівання дорівнює математичному очікуванню генеральної сукупності, т. е. генеоал'ной середньої:
На практиці іноді при досить великій вибірці за генераль-ву середню наближено приймають вибіркову середню.
Для дисперсій положення виходить трохи іншим. Мате-тичних очікування дисперсій різних вибірок [M (DBi)], со-ставлених з генеральної сукупності, відрізняється від генеральної дисперсії:
При великому п отримуємо і
Для генерального середнього квадратичного відхилення відпо-відно з (3.14) і (3.14а) отримуємо:
На практиці іноді при досить великій вибірці вибороч-ве середньоквадратичне відхилення наближено приймають за генеральне середнє відхилення. Так, якщо вва-тать, що статистичний розподіл (див. Табл. 5) є ви-Борки з деякою генеральної сукупності, то на підставі (3.6) і (3.9) можна зробити висновок, що для цієї генеральної сукупності »3,468 кг і Sг »0,3896 кг.
Такого роду оцінка параметрів генеральної сукупності або будь-яких вимірювань певними числами називається то-Чечні оцінкою.
Інтервальна оцінка генеральної середньої. Точкова оціню-ка, особливо при малій вибірці, може значно відрізнятися від справжніх параметрів генеральної сукупності. Тому прі не-великому обсязі вибірки користуються інтервальними, оцінками.
У цьому випадку вказується інтервал (довірчий інтервал, або довірчі кордону), в якому з певною (до-вірчої) ймовірністю р знаходиться генеральна середня.
Інакше кажучи, р визначає ймовірність, з якою здійснюва-ляють такі нерівності:
де позитивне число e характеризує точність оцінки.
Крім довірчої ймовірності використовують «протипожежні-помилкове» поняття - рівень значущості
який виражає ймовірність непотрапляння генеральної середовищ-ній в довірчий інтервал.
Довірчу ймовірність не слід вибирати дуже ма-ленькой (не слід її знецінювати). Найбільш часто р прини-мают рівній 0,95; 0,99; 0,999. Чим більше р. тим ширше інтервал, т. е. тим більше e. Щоб встановити кількісний зв'язок між цими величинами, необхідно знайти вираз для довіри-котельної ймовірності. Це можна зробити, використовуючи (2.17), одна-ко потрібно зрозуміти, що при цьому слід взяти за функцію розподілу ймовірностей і які прийняти межі ін-тегрірованія. Розглянемо це питання.
Отже, генеральна сукупність розподілена за нормальним законом з математичним очікуванням (середнім значенням) і дисперсією D р Якщо з цієї генеральної сукупності брати раз-ні вибірки з однаковим об'ємом п, то можна для кожної вибірки отримати середнє значення. Ці середні значення самі є випадковими величинами. Їх розподіл, т. Е. Розподіл середніх значень різних вибірок, отриманих з однієї генеральної сукупності, буде нормальним із середнім значенням, рівним середньому значенню генеральної сукупності. дисперсією і середнім квадратичним відхиленням (див. кінець § 2.2).
Таким чином, вже виступає як випадкова величина, для неї можна записати наступну функцію розподілу вероят-ностей [см. (2.22)]:
З (3.16) можна записати для наступні нерівності:
Імовірність того, що потрапляє в цей інтервал (довіритель-ву ймовірність), можна знайти за загальною формулою (2.17), використовуючи функцію (3.18). Межі інтегрування необхідно взяти з виразу (3.19):
Хоча нерівності (3.16) і (3.19) по суті ідентичні, але для практичних цілей важливіше запис (3.16), так як вона позво-ляет вирішити головну задачу - при заданій довірчій веро-ятность і знайденої вибіркової середньої знайти довірчий інтервал, в який потрапляє генеральна середня.
Запишемо нерівність (3.16), підставивши в нього вираз з формули (3.22):
Практично при знаходженні довірчого інтервалу за формулою (3.24) беруть вибіркову середню деякої конкретної вибірки (обсяг п ³ 30), а замість генеральної середньої квадратично »використовують вибіркову середню квадратичну цієї ж вибірки.
Пояснимо це деяким прикладом. Знову звернімося до даних табл. 5, вважаючи їх вибіркою. Знайдемо довірчий інтервал для генеральної середньої, з якої ця вибірка отримана, вва-тая довірчу ймовірність дорівнює р = 0,95. З (3.23) для такої довірчої ймовірності отримуємо: Ф (t) = 0,975 маємо t = 1,9 + 0,06 = 1,96. Підставляючи це значення t. вибіркову середню (3.6), вибіркове середньоквадратичне відхилення (3.9) і обсяг ви-бірки (п = 100) в вираз (3.24), маємо: