Статистична перевірка гіпотез

Статистичної гіпотезою називається будь-яке припущення про вид невідомого закону розподілу або про параметри відомих розподілів. Припустимо, що на підставі наявних даних є підстави висунути припущення про закон розподілу або про параметр закону розподілу випадкової величини (або генеральної сукупності, на безлічі об'єктів якої визначена ця випадкова величина). Завдання перевірки статистичної гіпотези полягає в підтвердженні або спростуванні цього припущення на підставі вибіркових (експериментальних) даних.

Перевірка статистичної гіпотези означає перевірку відповідності вибіркових даних висунутої гіпотези. Паралельно з висунутою основною гіпотезою, розглядають і суперечить їй гіпотезу, яка називається конкуруючої або альтернативної. Альтернативна гіпотеза вважається справедливою, якщо основна висунута гіпотеза відкидається.

Параметричної гіпотезою називається гіпотеза про значення параметрів розподілу або про порівняльну величиною параметрів двох розподілів. Прикладом параметричної статистичної гіпотези є гіпотеза про рівність математичних очікувань двох нормальних сукупностей.

Непараметричних гіпотезами називаються гіпотези про вид розподілу випадкової величини.

Нульовий, основний або перевіряється гіпотезою називається спочатку висунута гіпотеза, яка позначається Н0.

Конкуруючої або альтернативної гіпотезою називається гіпотеза, яка суперечить основній гіпотезі Н0 і позначається Н1.

Наприклад, основна гіпотеза Н0 полягає в тому, що математичне очікування μ одно якогось значення μ0. В цьому випадку конкуруюча гіпотеза Н1 може складатися в припущенні, що математичне очікування μ не дорівнює (більше або менше) значення μ0.

При перевірці статистичних гіпотез існує ймовірність припуститися помилки, прийнявши або спростувавши вірну гіпотезу. Рівнем значущості (а) називається ймовірність здійснення помилки першого роду. Значення рівня значущості а зазвичай задається близьким до нуля (наприклад, 0,05; 0,01; 0,02 і т. Д.), Тому, що чим менше значення рівня значущості, тим менше ймовірність припуститися помилки першого роду, що складається в спростуванні вірною гіпотези Н0. Р -Статистична достовірність прийняття вірною гіпотези. Перевірка справедливості статистичних гіпотез здійснюється за допомогою різних статистичних критеріїв. У статистиці найчастіше користуються трьома рівнями значущості:

α = 0,10, тоді Р = 0,90 (в 10 випадках з 100)

α = 0,05, тоді Р = 0,95 (в 5 випадках з 100)

α = 0,01, тоді Р = 0,99 (в 1 випадку з 100) може бути відкинута правильна гіпотеза

Статистичним критерієм називається випадкова величина, яка використовується з метою перевірки нульової гіпотези. Статистичні критерії називаються відповідно по тому закону розподілу, якому вони підпорядковуються, т. Е. F-критерій підпорядковується розподілу Фішера-Снедекора, χ2-критерій підпорядковується χ2 -розподіленого, Т-критерій підпорядковується розподілу Стьюдента, U-критерій підпорядковується нормальному розподілу.

Областю прийняття гіпотези або областю допустимих значень називається безліч можливих значень статистичного критерію, при яких основна гіпотеза приймається. Якщо бачимо значення статистичного критерію, розраховане за даними вибіркової сукупності, належить критичної області. то основна гіпотеза відкидається. Якщо бачимо значення статистичного критерію належить області прийняття гіпотези, то основна гіпотеза приймається.

Розглянемо на прикладі:

Перевірити вірність нульової гіпотези

Електролампочки на 220 В виготовляються двома електроламповий завод.
З першої партії, виготовленої заводом № 1, було відібрано електролампочок кількістю n1 = 25. з іншого партії- кількістю n2 = 36. Першу і другу партію електролампочок перевірили на термін служби. Результати перевірки наведені у вигляді статистичних розподілів такого вигляду:

Відомо, що ознаки є випадковими величинами, які є незалежними між собою і мають нормальний закон розподілу зі значенням середньоквадратичного відхилення: σy = 50; σx = 72

При рівні значущості α = 0,01 перевірити правильність нульової гіпотези:
H 0. M (X) = M (Y), якщо альтернативна гіпотеза:
H α. M (X)> M (Y)

Рішення:
1. Визначимо математичне очікування для обох заводів:

M (X)> M (Y): 59.5> 52

Перевіряємо нульову гіпотезу про рівність матожіданія (середніх): Ho. M (X) = M (Y)

2. Оцінимо генеральну дисперсію по 1-го і 2-го заводам:

3. Розрахуємо одну загальну оцінку генеральної дисперсії як середню зважену:

4. Розрахуємо вибіркове значення t- статистики:

По таблиці значень функції Стьюдента (двостороння критична область) при:

  • α = 0.01
  • число ступенів свободи ν = 36 + 25-2 = 59
  • знаходимо t-табличне = 2,66
  • t-розрахункове = 0,45 не влучає у допустиму область (-2,66, +2,66)

Отже нульова гіпотеза про рівність матожіданія (середніх) відхиляється:

M (x) = 59,5> M (y) = 52

Навігація по постам