Критерії перевірки статистичних гіпотез

Нуль-гіпотезаН0: між обома вибірками немає суттєвої різниці, обидві вони належать одній генеральній сукупності, а наявні відмінності обумовлені випадковим характером вибірок, наприклад, впливом випадкових помилок.

Звичайна процедура перевірки гіпотез полягає в наступному:

1) за вибірковими даними розраховується критерій перевірки;

2) отримане значення критерію порівнюють з критичним значенням, знаходять з таблиць. Критичне значення кожного конкретного критерію визначається рівнем значущості і числом ступенів свободи, за яким були розраховані величини, що входять в критерій.

Розглянемо деякі часто зустрічаються критерії перевірки гіпотез.

Критерій винятку грубої помилки. Якщо результати експерименту отримані через грубу помилку, то їх необхідно відкинути, не піддаючи жодним статистичних оцінок. Необхідно провести перевірку різко виділяються значень.

Критерій перевірки має вигляд

де xпод - «підозрілий» результат (найбільший або найменший);

- середнє, отримане за формулою;

S - середньоквадратичне відхилення; при цьому в розрахунок х іS включається «підозрілий» результат;

n - кількість вимірювань.

Отримане значення критерію порівнюють з табличним. Також можна використовувати, критерій Ірвіна # 955 ;. який заснований на різниці xn і xn + 1 (двох найбільших значень СВ):

Якщо отримане значення # 955; p більше значення, відповідного табличному # 955; кр то його слід залишити.

критерій Пірсона # 967; 2. Для перевірки гіпотези про відповідність емпіричного розподілу СВ теоретичного найбільш часто застосовують критерій Пірсона # 967; 2

Потрібно перевірити, чи узгоджуються експериментальні дані з гіпотезою про те, що СВD має даний закон розподілу заданий функцією F (d) або щільністю ймовірності f (d). Назвемо цей закон розподілу «теоретичним».

Знаючи цей закон, можна обчислити очікуване число відмов вироби в певних інтервалах, на які розбити час випробування.

В результаті отримаємо теоретичний ряд частот в k інтервалах часу випробувань:

Підрахуємо також число відмовили виробів в цих же інтервалах в нашому досвіді і отримаємо експериментальний ряд частот

Для перевірки узгодженості теоретичного і експериментального розподілів підраховується міра розбіжності # 967; 2.

і число ступенів свободи v = k-f. де f - число обмежень. Число обмежень дорівнює числу параметрів розподілу, збільшеному на одиницю. Для розподілу Пірсона складено спеціальні таблиці.

критерій Колмогорова # 955 ;. Критерій Пірсона застосовують тільки в тих випадках, коли число спостережень (n≥25). Якщо теоретичні значення параметрів розподілу відомі, то найкращим критерієм є критерій Колмогорова.

Складають різницю між накопиченими теоретичними і емпіричними сумами і знаходять максимальне значення цієї різниці, обчислюючи величину D за формулою:

Де. - різниця функцій експериментального і теоретичного розподілу СВ.

коефіцієнт # 955; знаходять за формулою:

Користуючись табличними даними для обчисленого значення # 955 ;, визначають ймовірність P (# 955;) - ймовірність того, що гіпотетична функція обрана правильно.

Критерій Фішера F. Перш ніж порівнювати середні значення двох вибірок, необхідно переконатися в рівності їх дисперсій. При нормальному законі розподілу СВ для перевірки гіпотези про рівність (однорідності) вибіркових дисперсій як критерій використовується статистика, яка дорівнює відношенню двох незалежних оцінок дисперсій генеральної сукупності і. мають ступінь свободи відповідно v1 іv2. тобто

При цьому повинна виконуватися умова. де - велика величина вибіркової дисперсії в двох вибірках.

Знайдене значення порівнюється стаблічним при заданому рівні значимості p і ступенях свободи v1 = n1 -1 іv2 = n2 -1. якщо F

Критерій КохренаG. Якщо число паралельних дослідів в серіях однаково, то однорідність дисперсій декількох вибірок перевіряється за допомогою критерію КохренаG за формулою:

де - максимальна дисперсія, а - сума всіх дисперсій вибірок, N - число вибірок, n - номер вибірки.

Якщо розрахункове значення G більше табличного Gкр (при рівні значущості # 945; і ступенях свободи v1 = n1 -1 для чисельника і v2 = N для знаменника), то гіпотеза про рівність (однорідності) дисперсій відкидається.

Якщо перевірка за критеріями Фішера і Кохрена покаже, що для оцінок дисперсій можна прийняти нуль-гіпотезу, оцінки називають однорідними; цю процедуру часто називають перевіркою однорідності дисперсій. Однорідні оцінки можна усереднити - знайти єдину оцінку дисперсії по всій сукупності вимірювань; для цього користуються формулою:

Критерій Стьюдента t. Для перевірки гіпотези про рівність двох вибіркових середніх значень СВ, що має нормальний закон розподілу, використовують критерій Стьюдента t.

Нуль-гіпотеза тут: середні значення в двох серіях вимірювань є оцінками одного і того ж генерального значення (математичного очікування, істинного значення).

Якщо серії вимірювань, в яких отримані середні, зроблені з різною точністю (з різними дисперсіями), то процедура порівняння середніх різко ускладнюється. У цих випадках можна рекомендувати спеціальні методи. Якщо дисперсії однорідні і знайдена спільна оцінка, тоді перевірка проводиться за критерієм Стьюдента

де п1 і n2 - числа вимірювань в першій і другій серіях; s - єдина оцінка стандартного відхилення по всій сукупності вимірювань.

Критичне значення t залежить від v і # 945; .