Результати тесту успішності

Діагностична цінність завдання є приватне перехресних сум діагоналей чотирьох полів, т. Е .:

Критичною величиною діагностичної цінності завдання вважають 1,5. Якщо діагностична цінність, отримана шляхом обчислення, більше критичної величини 1,5 тоді завдання має потрібну діагностичну цінність. Практично вважають приватне перехресних сум діагоналей 3 хорошою діагностичної цінністю. Треба звернути увагу на те, що при одній меті, яку у попередньої контрольної роботи, недоцільно ділити експериментальну групу на «сильних» і «слабких», це треба робити на підставі оцінки вчителя.

Для оцінки діагностичної цінності (D) кожного питання правильні і неправильні відповіді учнів на кожне питання вносяться в таблицю (див. Табл. 5).

Відповіді на кожне запитання успішності

Неправильні відповіді в «слабкою» групі VN

Неправильні відповіді в «сильній» групі VT

Залишок «сильних» і «слабких» VN - VT

Сума відповідей «сильних» і «слабких» VN + VT

Діагностична цінність кожного D питання обчислюється за формулою:

де K - загальна кількість питань (отже, і можливих відповідей);

n - кількість учнів в «сильній» ( «слабкою») групі.

де N - загальна кількість учнів, які написали роботу;

VN - помилки в «слабкою» групі;

VT - помилки в «сильній» групі.

Припустимо, що для визначення діагностичної цінності питань контрольної роботи була проведена контрольна робота з 50 учнями, причому правильні і неправильні відповіді трьох перших питань розподілилися так, як наведено в таблиці (в обох групах, тобто в «слабкою» і «сильною» , було 14 учнів):

кількість питань 15.

Діагностична цінність першого питання:

Діагностична цінність другого питання:

Діагностична цінність третього питання:

Практично диагностирующими вважаються ті завдання, діагностична цінність яких складає від 16% до 84%. Якщо завдання надто легка і більшість учнів можуть розв'язати цю проблему, тоді діагностична цінність її нижче 16%, якщо завдання занадто важка і її не може вирішити більшість учнів, тоді діагностична цінність її більше 84%. Отже, перше завдання, наведена в прикладі, занадто легка, третя - занадто важка, друге завдання має задовільну діагностичну цінність.

На підставі таблиці 5 можна також зробити висновок про діагностичної цінності завдань. Це показує число
(VN - VT), наведене в четвертому стовпці таблиці 5. Чим більше це число, тим вище діагностична цінність питання. П'ятий стовпець показує ступінь складності завдань: чим більше це число, тим важче завдання.

Іноді трапляється, що число, що знаходиться в четвертому стовпці негативне, тобто на деякі питання «сильні» відповідають неправильно, «слабкі» - правильно. Зазвичай такі питання неясно сформульовані, тому відповіді випадкові. При виявленні таких питань їх слід переформулювати інакше.

Діагностичну цінність тесту успішності або контрольної роботи можна легко визначити за допомогою знакового тесту.

На підставі попереднього досвіду вибирають «сильних» і «слабких» учнів (27%) і проводять з ними попередню контрольну роботу. Для кожного завдання відзначають в «слабкою» і «сильною» групах правильний або неправильний відповідь кожного учня буквою П або Н. Потім обчислюють достовірність відмінності знаків. Якщо загальна кількість однорідних знаків ( «+», або «-»), отриманих шляхом обчислення, більше критичного числа, наведеного в спеціальній таблиці, тоді задача має достовірну діагностичну цінність.

Хорошим способом перевірки валідності тесту успішності або контрольної роботи є і коррелированность результатів тесту з оцінками вчителя про учнів або порівняння з результатами, отриманими шляхом проведення тесту, сформульованого по-іншому. В такому випадку треба також перевірити достовірність коефіцієнта кореляції.

Іншим методом вирішення питання про диференціює здатності завдання може бути наступний спосіб обчислення так званого «індексу диференціації». Випробовуваних за результатами виконаних завдань ділять на три групи - сильну, середню та слабку. Якщо загальне число не ділиться на 3, то сильну і слабку групу роблять за кількістю однаковими. Індекс диференціації обчислюється за формулою:

де K '- кількість правильних відповідей в сильній групі,

K "- кількість правильних відповідей в слабкій групі,

n - число випробовуваних в групі.

E має межі від -1 до +1. Допустимим вважається значення E = +0,4. Менше значення E говорить про те, що таке формулювання завдання не дозволяє розрізняти випробовуваних за рівнем підготовки. Негативне значення E свідчить про те, що слабо підготовлені краще впоралися із завданням, ніж сильні. Отже, завдання необхідно або переробити, або відмовитися від нього.

Після визначення діагностичної цінності питань не можна виключати питання з контрольної роботи механічно, тому що низька діагностична цінність питання не завжди залежить від змісту, вона може залежати і від формулювання. Рекомендується переформулювати питання, що мають малу діагностичну цінність, і потім вдруге дати їх учням в попередньому досвіді. Практично питаннями основного експерименту можуть бути ті, які при попередньому досвіді дали приблизно 50% правильних і 50% неправильних відповідей.

Якщо тест або контрольна робота складається з окремих питань, які не обов'язково систематизовані за змістом, тоді питання основного експерименту повинні бути подані в тексті по порядку їх труднощі - на початку легші, в кінці важчі.

Труднощі або легкість визначається по процентному відношенню правильних відповідей до загальної кількості можливих. Тест або контрольна робота має хорошу діагностичну цінність в тому випадку, коли за передбачене час зможе відповісти на всі питання 90% учнів (деякі вважають 75%). Це означає, що якщо всі учні за передбачене час зможуть відповісти на всі питання, то тест занадто легкий, якщо за цей час на питання зможе відповісти нижче 90% учнів, то тест занадто важкий.

Ступінь складності завдань можна визначити при обчисленні відсотка учнів, які отримали вірний результат. Якщо 80% учнів, що обробляють завдання, вирішили його правильно, то в такому випадку ступінь складності цього завдання становить 80 одиниць. Ступінь складності завдання можна вивести за допомогою наступної формули:

де K - кількість учнів, які отримали вірні відповіді;

N - кількість учнів, які вирішували завдання.

Ступінь складності P в числовому вираженні тим більше, чим легше завдання.

У тому випадку, коли потрібно провести диференціацію учнів з найнижчою успішністю, створюються легкі тести, коли необхідно відібрати сильних, звертаються до складних тестів. В інших випадках для досягнення хорошого результату розподілу результатів тестування прагнуть до розподілу ступеня складності від P = 20 до P = 80 з середньою величиною P = 50.