надійність тесту

НАДІЙНІСТЬ - одне з трьох головних психометричних властивостей будь-вимірювальної психодіагностичної методики (тесту). Надійність - це стійкість тесту, незалежність його результатів від дії всіляких випадкових факторів. До числа таких факторів слід віднести:

-Різноманітність зовнішніх матеріальних умов тестування, що міняються від одного випробуваного до іншого (час доби, освітленість, температура в приміщенні, наявність сторонніх звуків, що відволікають увагу і т. п.),

-дінамічние внутрішні чинники, по-різному діють на різних випробуваних в ході тести вання (час так званої врабативаемості - виходу на стабільні показники темпу і точності дій після початку тестування, швидкість стомлення і т. п.),

Різноманітність і мінливість всіх цих факторів такі великі, що вони зумовлюють появу у кожного випробуваного непрогнозованого за розмірами і напрямком відхилення виміряного тестового бала від істинного тестового бала (який можна було б в принципі отримувати в ідеальних умовах). Середня відносна величина цього відхилення визначається як стандартна похибка вимірювання (Se). Величина помилки вимірювання вказує на рівень неточності або ненадійності тестової шкали (спеціально підкреслимо, що в психометрической теорії надійність і точність виявляються синонімами).

ПОМИЛКА ВИМІРЮВАННЯ (Se) і надійність вимірювання (R), відповідно до загальноприйнятої психометрической теорії, пов'язані наступною формулою:

де S - дисперсія тестових показників X.

Формула (1) є суто теоретичною, і на її основі не можна підрахувати надійність тесту, так як величина Se виявляється також невідомою величиною. Тому на практиці застосовують кореляційні методи-Найвідоміший з них - метод перетестірованія (тест-ретест) або метод вимірювання ретестовой НАДІЙНОСТІ. На одній і тій же вибірці випробуваних (не менше 30 осіб, що беруть участь в пілотажний психометрической експериментальному дослідженні) проводять перше тестування X. а потім повторне тестування Y. Інтервал, як правило, - два тижні, що гарантує забування питань тесту.

Потім для двох рядів значень X і Y підраховується, наприклад, лінійний коефіцієнт кореляції (можливий і нерідко більш коректний варіант - підраховувати рангові коефіцієнт кореляції):

де Sx. S - стандартні відхилення X і Y.

Cov (X. Y) - коваріація двох змінних X і Y.

Що важливо для суті теорії надійності тестів, так це можливість визначити помилку вимірювання після того, як підрахована кореляція тест-ретест за формулою (3), отриманої шляхом простого перетворення формули (1):

Таким чином, якщо стандартне відхилення в тесті склало 10 очок (середнє відхилення, яке в середньому допускають випробовувані від середнього балу для вибірки), а кореляція тест-ретест виявилася рівною лише 0,5, то помилка виміру виявляється дуже великий:

Тобто виявляється, що помилка вимірювання перекриває більшу частину розкиду тестових показників, так як справжній бал по тесту може відхилятися від виміряного балу на цілих 7 очок! І якщо випробовуваний набрав на 6 очок більше, ніж середній випробуваний, ми не можемо з достатньою впевненістю (статистичною достовірністю) говорити про те, що він істотно перевершив середнього випробуваного, так як це відхилення виявляється в межах стандартної помилки вимірювання.

Таким чином, низька кореляція результатів тесту між першим і повторним тестуванням говорить про те, що випадкові фактори суттєво спотворюють результати тесту. Це означає, що тест не володіє необхідною завадостійкістю, і його не можна використовувати як вимірювальний інструмент.

Показник надійності R. який прийнято вважати досить високим, дорівнює або перевищує 0,95. Хоча в особистісних тестах часто користуються значно менш надійними тестами з показниками 0,8 - 0,9.

Метод вимірювання ретестовой надійності придатний тільки для психічних властивостей, стабільних в часі. Надійність тестів на психічні стани і динамічні установки особистості не можна перевірити таким чином. У цьому випадку застосовують різні методи розщеплення тесту на окремі пункти, освітлення яких виходить за межі цього посібника.