випадкові помилки

Вибірка ж Гелапа і Роупера носила випадковий характер і відображала все населення США, що дозволило їм зробити правильний прогноз.
Але якщо систематичні помилки не зменшуються зі збільшенням кількості опитаних і спосіб усунення таких помилок слід шукати насамперед в особливостях побудови самої вибірки, то випадкові помилки підкоряються імовірнісним законам і підлягають оцінці. Одне з головних їхніх властивостей полягає в тому, що вони зменшуються зі збільшенням вибірки. Розглянемо відповідний приклад (частково фантастичний).
Розглянемо наступний премєр.
Уявімо собі величезний лототрон на 100.000 куль, в якому 10.000 куль з №1, 10.000 - з №2, 10.000 - з №3, 10.000 - з №4, 10.000 - з №5, 10.000 - з №6, 10.000 - з № 7, 10.000 - з №8, 10.000 - з №9 і 10.000 - з №10. За умови правильної роботи лототрону кожну кулю має рівну ймовірність випадання (принаймні на самому початку, а після того як кулі почнуть випадати, ймовірно будуть дуже близькі). Отже, ймовірність випадання кулі з будь-яким з номерів дорівнює 10% (№1 - 10%, №2 - 10% і т.д.). І якби не було випадкових помилок, то будь-яка вибірка, що дозволяє повністю реалізувати модель генеральної сукупності мала б по 10% куль з кожним з номерів. Звичайно ж отримання такої вибірки в реальності дуже рідкісне явище через саме випадкових помилок, які вносять ту чи іншу ступінь невідповідності генеральної сукупності і її моделі - випадкової вибірки.
Далі наведені дані, отримані за допомогою комп'ютерної програми, що моделює описаний вище лототрон:

Якби випадкові помилки були відсутні, то після випадання перших 25 куль розподіл складалося з 8% і 12% для того чи іншого кулі (не по 10%, тому що в результаті поділу 25 на 10 не виходить цілих чисел), після 50 куль - з 10% для кожного кулі, після 75 куль - з 9,3% і 10,7% для того чи іншого кулі, після 100 - знову з 10%.
Але як ми бачимо на кожному з чотирьох етапів виникли випадкові помилки. На першому етапі найбільш часто випадав куля №1 і максимальне відхилення від істинного значення склало 10%. На другому етапі максимальна випадкова помилка також спостерігається для кулі №1, але стає вже трохи менше - 8%. На третьому етапі максимальна помилка спостерігається вже для кулі №9, який з 75 спрацьовувань лототрону випав лише в 4% випадків. Отже, максимальна помилка зменшилася з 8% до 6%. Нарешті на останньому етапі максимальна помилка зменшується до 3% (кулі №1, №4, №10). Таким чином, зі збільшенням нашої вибірки випадкова помилка падала. Чисто теоретично випадкові помилки могли впливати тільки на один (або два) з куль, але виникнення кожної наступної випадкової помилки на одному і тому ж кулі є все менш і менш імовірним (спробуйте поподбрасивать монету - скільки разів поспіль випаде тільки одна зі сторін?), в той час як виникнення таких помилок на інших кулях є більш імовірним подією. У підсумку виходить, що випадкові помилки мають тенденцію до взаємного компенсування.

Один з найважливіших принципів роботи в рамках кількісної соціології полягає в тому, що використовуючи різні види розподілів вибіркових статистик соціолог може оцінити наскільки ймовірним є те, що результати вибірки отримані внаслідок випадкових помилок, тобто оцінити їх можливий вплив на результати дослідження.
Зверніть увагу на останній рядок таблиці, що показує середнє значення для вибірки на кожному з етапів. Як ви повинні пам'ятати з двох попередніх глав, розподіл всіх можливих вибіркових середніх в даному випадку відповідає номральному розподілу. Відповідно, отримання вибірки, середнє значення якої близько до істинного середнього значення (в нашому випадку воно дорівнює 5,5) значно вище, ніж вірогідність отримання вибірки, середнє значення якої значно відрізняється від істинного. Виходячи з наведених даних, чим більше наша вибірка, тим ближче середнє значення для вибірки до середнього значення для генеральної сукупності. Відмінність між вибірковим і генеральним середніми на кожному етапі також можна трактувати як випадкових помилок. Як видно, на останньому етапі, при вибірці всього в 100 спостережень, величина випадкової помилки становить всього 0,02.