U-критерій Манна-Уїтні

Методи оцінки зв'язку

Методи оцінки розподілу

U-критерій Манна-Уїтні - непараметричний статистичний критерій, який використовується для порівняння двох незалежних вибірок за рівнем якої-небудь ознаки, виміряного кількісно. Метод заснований на визначенні того, чи достатньо мала зона перехрещуються значень між двома варіаційними рядами (ранжируваною поруч значень параметра в першій вибірці і таким же в другій вибірці). Чим менше значення критерію, тим імовірніше, що відмінності між значеннями параметра в вибірках достовірні.

1. Історія розробки U-критерію

Даний метод виявлення відмінностей між вибірками був запропонований в 1945 році американським хіміком і статистиком Френком Уилкоксона.
У 1947 році він був істотно перероблений і розширений математиками Х.Б. Манном (H.B. Mann) і Д.Р. Уїтні (D.R. Whitney), по іменах яких сьогодні зазвичай і називається.

2. Для чого використовується U-критерій Манна-Уїтні?

U-критерій Манна-Уїтні використовується для оцінки відмінностей між двома незалежними вибірками за рівнем будь-якого кількісного ознаки.

3. В яких випадках можна використовувати U-критерій Манна-Уїтні?

U-критерій Манна-Уїтні є непараметрическим критерієм, тому, на відміну від t-критерію Стьюдента. не вимагає наявності нормального розподілу порівнюваних сукупностей.

U-критерій підходить для порівняння малих вибірок: в кожної з вибірок має бути не менше 3 значень ознаки. Допускається, щоб в одній вибірці було 2 значення, але в другій тоді має бути не менше п'яти.

Умовою для застосування U-критерію Манна-Уїтні є відсутність в порівнюваних групах співпадаючих значень ознаки (всі числа - різні) або дуже мале число таких збігів.

Аналогом U-критерію Манна-Уїтні для порівняння більше двох груп є Критерій Краскела-Уолліса.

4. Як розрахувати U-критерій Манна-Уїтні?

Спочатку з обох порівнюваних вибірок складається єдиний ранжируваних ряд. шляхом розставляння одиниць спостереження за ступенем зростання ознаки і присвоєння меншому значенню меншого рангу. У разі рівних значень ознаки у декількох одиниць кожної з них присвоюється середнє арифметичне послідовних значень рангів.

Наприклад, дві одиниці, що займають в єдиному ранжированном ряду 2 і 3 місце (ранг), мають однакові значення. Отже, кожній з них присвоюється ранг рівний (3 + 2) / 2 = 2,5.

У складеному єдиному ранжированном ряду загальна кількість рангів вийде рівним:

де n1 - кількість елементів в першій вибірці, а n2 - кількість елементів у другій вибірці.

Далі знову поділяємо єдиний ранжируваних ряд на два, що складаються відповідно з одиниць першої і другої вибірок, запам'ятовуючи при цьому значення рангів для кожної одиниці. Підраховуємо окремо суму рангів, що припали на долю елементів першої вибірки, і окремо - на частку елементів другої вибірки. Визначаємо велику з двох рангових сум (Tx) відповідну вибірці з nx елементами.

Нарешті, знаходимо значення U-критерію Манна-Уїтні за формулою:

5. Як інтерпретувати значення U-критерію Манна-Уїтні?

Отримане значення U-критерію порівнюємо по таблиці для обраного рівня статистичної значущості (p = 0.05 або p = 0.01) з критичним значенням U при заданій чисельності зіставляються вибірок:

Якщо отримане значення U менше табличного або дорівнює йому, то визнається статистична значимість відмінностей між рівнями ознаки в розглянутих вибірках (приймається альтернативна гіпотеза). Достовірність відмінностей тим вище, чим менше значення U.
Якщо ж отримане значення U більше табличного, приймається нульова гіпотеза.