Перевірка статистичних гіпотез 1
§1. Статистична гіпотеза. Основні поняття.
Завдання перевірки гіпотези в сенсі нагадує задачу оцінки параметрів генеральної сукупності за даними вибірки: висловлюється деяке твердження і на підставі даних вибірки виноситься судження про справедливість цього твердження.
Статистичні гіпотези стверджують що-небудь про статистично стійких події (події, які можуть протікати багато разів при ідентичних умовах).
1. Генеральна сукупність розподілена за нормальним законом;
2. Дисперсії двох нормальних розподілів рівні;
3. дисперсія ознаки, розподіленого в генеральної сукупності
· Якщо в гіпотезі затверджується щось про значення якогось параметра, то гіпотеза називається параметричної.
Якщо гіпотеза припускає щось, кількісно виміряти (наприклад, «ознака має нормальний розподіл»), то гіпотеза називається непараметричної.
· Основний (нульовий) гіпотезою називають висунуту гіпотезу.
· Альтернативною (конкуруючою) називають гіпотезу, яка суперечить висунутої.
· Гіпотеза називається простий, якщо відповідь на неї однозначний ( «ознака розподілу нормальний, дисперсія розподілу дорівнює 2»)
Якщо відповідь неоднозначна, гіпотеза називається складною.
§2. Помилки першого і другого роду.
Висунута гіпотеза може бути правильною або неправильною, тому її необхідно перевірити по емпіричним даним (по вибірки). Оскільки вміст вибірки випадково, то й висловлювання, зроблені на підставі дослідження вибірки, випадкові, тобто вони можуть бути і правильні, і неправильні.
В результаті перевірки гіпотези може бути прийняті неправильні рішення в двох випадках, тобто можуть бути допущені помилки двох типів:
1. Помилкою першого роду - називають помилку, що допускається в разі, коли відкинута правильна основна гіпотеза (відкинута, хоча правильна);
2. Помилкою другого роду - називають помилку, що допускається в разі прийняття неправильної, основний гіпотези (прийнята, хоча вона не вірна);
Результат перевірки основної гіпотези
Чи не негативний результат статистичної перевірки гіпотези не означає, що висловлена нами гіпотеза є найкращою і єдиним достойним, просто вона не суперечить наявним у нас вибірковими даними, однак такими ж властивостями можуть володіти і інші гіпотези.
Ухвалення рішення про правильність гіпотези або її хибність засноване на статистичних критеріях.
§ 3. Статистичний критерій. Критична область. Область прийняття гіпотези. Критичні точки.
Для перевірки гіпотези використовують спеціально підібрану випадкову величину, точне або наближене розподіл якої відомо.
Випадкова величина Q. служить для перевірки гіпотези називається статистичним критерієм або просто критерієм. Спостережуваним значенням називають значення критерію, обчислене за вибіркою.
Після вибору критерію безліч всіх його можливих значень розбивають на 2 непересічних підмножини:
· Одне з них містить значення критерію, при якому відкидається - воно називається критичною областю S.
· Інша містить значення критерію, при якому гіпотеза приймається - воно називається областю прийняття гіпотези. (Допустима область).
Критичними точками називають точки, що визначають критичну область від області прийняття гіпотези, розрізняють;
1. односторонні і двосторонні критичні області.
Односторонні діляться на:
· Правостороннім критичну область;
· Лівосторонній критичну область;
Зокрема, якщо критичні точки симетричні відносно нуля, то двостороння область визначається по модулю | Q |>.
У загальному випадку критерій є багатовимірну випадкову величину, проте, в подальшому будемо розглядати найпростіші одномірні критерії.
Критична і допустима область є одномірні числові множини. Вид критичної області залежить від виду основної та альтернативної гіпотези.
§ 4. Рівень значущості та потужність критерію.
1. Імовірність припуститися помилки першого роду називають рівнем значущості критерію і позначають,.
Імовірність помилки другого роду позначають.
2. Потужністю критерію називають імовірність влучення критерію в критичну область за умови, що справедлива альтернативна гіпотеза. (Т. Е потужність критерію - це ймовірність неприпустимість помилки другого роду.)
Зазвичай для використовують стандартне значення: # 945; = 0,05, # 945; = 0,01.
Як би не була мала величина. попадання в критичну область є тільки малоймовірне, але не абсолютно неможлива подія.
Чим менше. тим менш імовірно допустити помилку першого роду. Зі зменшенням зменшується критична область.
При = 0, гіпотеза - буде завжди прийматися незалежно від результатів вибірки. Зменшення. тягне за собою збільшення ймовірності помилки другого роду.
Одночасне зменшення помилок першого і другого роду можливо лише при збільшенні обсягу вибірки.
Зазвичай при перевірці гіпотеза задаються певним рівнем значущості і обсягом вибірки n. Критерій вибирається так, щоб потужність критерію була максимальною.
§ 5. Види критичних областей.
Нехай перевіряється гіпотеза про рівність деякого параметра генерального розподілу, наприклад генерального середнього. і для перевірки гіпотези використовується критерій Q. розподілу якого має вигляд:
1. Якщо в якості альтернативної гіпотези висувається. . то критичну область природно визначати. тобто вибрати лівосторонній критичну область.
Поставивши собі за рівнем значущості з рівняння. знаходимо лівосторонній область.
2. При альтернативної гіпотезі. Критична область визначається з рівняння. називається правобічна критична область.
3. Якщо альтернативна гіпотеза формулюється у вигляді. то будується двостороння критична область.
Критичні точки знаходяться з рівняння.
Найчастіше двосторонню критичну область будують як симетричну:
§6. Методика перевірки гіпотези.
Існує безліч різних статистичних критеріїв для вирішення різних статистичних завдань. Однак можна описати загальну схему.
Методика перевірки статистичних гіпотез зводиться до наступних етапів:
1 етап. Формулюється основна перевіряється гіпотеза; одночасно вказується, щодо яких альтернатив повинна бути проведена перевірка, тобто формулюється альтернативна гіпотеза.
2 Етап. Підбирається статистичний критерій - це випадкова величина, що обчислюється за результатами вибірки.
3 Етап. Формулюється правило перевірки, визначається відповідний обсяг вибірки n по заданих рівнем значущості і потужності критерію або з умови мінімізації при даних і.
4 Етап. Залежно від конкретних гіпотези і її альтернатив вибирається одностороння або двостороння перевірка.
Вибір альтернативної гіпотези диктується істотою перевірки.
5 Етап. За відомим розподілу критерію обчислюються критичні точки.
6 Етап. Проводиться вибірка і для отриманої реалізації вибірки обчислюється спостережуване значення критерію. Якщо це значення потрапляє в критичну область, гіпотеза визнається не відповідає даним спостереження і тому відхиляється. Якщо потрапляє в допустиму область, то гіпотеза визнається не суперечить вибірковими даними і може бути визнана правдоподібною.
Для кожного виду перевіряються гіпотез розроблені відповідні критерії. Найчастіше використовується випадкові величини, що мають нормальний розподіл, розподіл (квадрат Пірсона), розподіл Стьюдента, F- розподіл Фішера - Снедекора.
Наведена вище схема дослідження передбачає, що закон розподілу генеральної сукупності відомий і оцінці підлягають один або кілька параметрів розподілу.
Такі гіпотези звуться параметричні.
Поряд з подібними гіпотезами доводиться проводити статистичні перевірки і при невідомому законі розподілу генеральної сукупності. Відповідні гіпотези називаються непараметричні.
Непараметричні критерії мають значно меншу потужність, ніж параметричні, тобто для збереження тієї ж величини необхідно більше досвідчених даних.
З іншого боку, непараметричні критерії можуть застосовуватися при будь-якому законі розподілу генеральної сукупності і застосовні як до кількісних, так і до якісними ознаками.
§ 7. Деякі типові завдання перевірки параметричних гіпотез.
Розглянемо деякі найбільш часто зустрічаються завдання, що наважуються з допомогою перевірки гіпотез. Це перш за все:
· Завдання порівняння (порівняння вибіркових характеристик до нормативних характеристиками)
· Порівняння характеристик двох вибірок між собою (для перевірки гіпотези про приналежність цих вибірок до однієї генеральної сукупності).
Типові непараметричні завдання:
· Перевірка гіпотез про вид вибіркового розподілу;
· Перевірка значущості розбіжності вибіркових характеристик.
7.1 Перевірка гіпотез про середнє значення.
а) Порівняння середнього значення з нормативним значенням.
Такі завдання зустрічаються при перевірці якості продукції, що характеризується деяким середнім показником:
1. середній час роботи пристрою;
2. середній розмір деталі і т.д.
б) Порівняння середніх значень двох сукупностей.
Нехай є дві сукупності, що характеризуються середніми значеннями і. дисперсиями і.
Було висунуто гіпотеза, що ці середні рівні. т. е
Для перевірки основної гіпотези використовують критерій
Так як . при справедливості нульової гіпотези будемо мати.
Використовуючи властивості дисперсії і припускаючи вибірки незалежними, отримаємо:
Зробивши додаткове припущення, що дисперсії обох сукупностей рівні, тобто отримаємо:
Припущення про рівність дисперсій потребує спеціальної перевірки, про що мова піде в наступному розділі.
Підставляючи цей вираз в формулу для критерію, отримуємо:
Якщо обидві вибірки достатнього великого обсягу, то випадкова величина і випадкова величина мають нормальний розподіл, тому нормально буде розподілений і критерій.
Замінюючи невідому дисперсію генеральної сукупності на її несмещенную вибіркову оцінку.
Прийдемо до нормально розподіленого критерієм:
Подальша перевірка ведеться звичайним чином з використанням таблиць функцій розподілу Лапласа.
Якщо вибірки малого обсягу і застосування нормального розподілу може привести до помилок, для того ж критерію Z використовують t-розподіл Стьюдента з числом ступенів свобода.
7.2 Порівняння дисперсій 2-ух сукупностей.
Нехай є дві нормально розподілені сукупності, дисперсії яких дорівнюють; нульова гіпотеза.
Так як дисперсії генеральнихсукупностей невідомі, перевірка гіпотези здійснюється на основі зіставлення вибіркових дисперсій і. Якщо відношення. близько до 1, немає підстав відхиляти нульову гіпотезу, якщо значно відрізняється - гіпотеза відхиляється. Для вирішення питання, наскільки великим має бути відміну вибіркових дисперсій, щоб відхилення нульової гіпотези було досить обґрунтованим, використовується відношення
Розподіл цього відносини, що називається F-розподілом Фішера - Снедекора, залежить від двох параметрів - чисел ступенів свободи чисельника і знаменника і. де і - обсяги вибірок. Числа і вказуються в фігурних дужках поруч з обчисленим значенням F:
Критична область будується в залежності від виду альтернативної гіпотези:
1. Нульова гіпотеза. Альтернативна гіпотеза. якщо ().
по заданому # 945; і відомим і по таблиці розподілу Фішера - Снедекора знаходимо критичне значення. Перевірка гіпотези H 0сводітся до наступного правила: якщо відношення вибіркових дисперсій. гіпотеза H 0отклоняется; якщо. гіпотеза H 0не відхиляється.
2. Альтернативна гіпотеза.
В цьому випадку будуємо симетричну двосторонню критичну область з критичними точками і. обумовленими зі нерівностей
Права критична точка знаходиться безпосередньо по таблиці критичних точок розподілу Фішера - Снедекора для рівня значущості і ступенів свободи і. Лівих критичних точок таблиця не містить, але, при обраному симетричному способі побудови критичної області, досягається потрапляння критерію F в критичну область з ймовірністю, яка дорівнює рівню значущості .Так як з визначення рівня значущості. то вибираючи. ми одночасно досягаємо і. Перевірка гіпотези H 0проізводітся за тим же правилом, що і в разі односторонньої критичної області, але табличні значення критерію шукаються для значення. вдвічі меншого, ніж заданий рівень значимості: якщо відношення вибіркових дисперсій. нульова гіпотеза H 0 відхиляється, якщо гіпотеза H 0 не відхиляється.
§ 8. Непараметричні гіпотези. Критерії згоди Пірсона і Колмогорова.
Раніше розглядалися методи перевірки гіпотези щодо окремих параметрів генерального розподілу.
Особливе місце займають гіпотези щодо узгодженості вибіркового розподілу з теоретичним (генеральним) розподілом.
Критерії згоди дозволяють відповісти на питання про те, чи є відмінності між вибірковим і теоретичним розподілом настільки незначним, що вони можуть бути приписані впливу випадкових факторів, чи ні.
Нехай закон розподілу генеральної сукупності невідомий, але є підстави припускати, що він має певний вид.
1) Якщо виконуються умови центральної граничної теореми, є підстави очікувати, що генеральне розподіл - нормальне;
2) Якщо вибіркове середнє і вибіркова дисперсія рівні, то можна припускати, що генеральна сукупність розподілена за законом Пуассона і т.д.
Ці твердження носять характер гіпотез і повинні бути піддані статистичній перевірці.
Для перевірки гіпотези. закон розподілу має такий вид (нормальний, рівномірний, показовий), використовується спеціально підібрана випадкова величина, яка називається критерієм згоди.
Критерій згоди є критерій перевірки гіпотези про передбачуваний законі невідомого розподілу.
Є кілька критеріїв згоди:
- (Хі-квадрат) Пірсона, критерій Колмогорова, Мізеса - Смирнова та ін.
8.1 Критерій Пірсона.
Розглянемо випадок, коли вибірка представляється інтервальним статистичним рядом. Для вивчення випадкової величини Х, проведено n- дослідів, діапазон спостерігалися значень величини Х розбитий на q інтервалів. Ряд розподілу має вигляд: