Залежність обсягу вибірки від обсягу генеральної сукупності

Лекція 4. Розрахунок вибірки.

1.Особенности розрахунку вибірки. Обсяг вибіркової сукупності

2. Помилки вибірки.

Основні поняття: обсяг вибіркової сукупності, довірчий інтервал, репрезентативність вибірки, випадкова помилка вибірки, систематична помилка вибірки

Розрахунок обсягу вибірки

З усіх питань, які задають співробітникам знаменитого Інституту опитувань громадської думки Геллапа, найпопулярнішим є такий: як ви можете, проінтерв'ював 1000 осіб, судити про те, що думають 300 млн. Американців?

Для відповіді на це питання потрібно згадати не тільки високу кваліфі-кацію і величезний практичний досвід співробітників, але і використання ними статистики та математики. Якщо методи опитування не засновані на науці, резуль-тати можуть ввести вас в оману.

У статистиці прийняті такі розмежування обсягів вибірки. Обсяг вибірки, достатній для Взаємопогашення випадковостей і отримання стати-стических характеристик закономірного характеру, дорівнює 30. Вибірка такого обсягу називається малою. Характер розподілу значень ознаки в малих вибірках наближається до нормального з ростом числа випробувань. Мінімальний обсяг вибірки, що дозволяє отримати середні значення ознаки із зазначенням довірчих ймовірностей, дорівнює 5. Вибірки такого обсягу називаються сверхмалимі. Розподіл значень при-знака в таких вибірках характеризується розподілом Стьюдента. Але найчастіше в соціології мають справу з набагато більшим об'ємом вибірки.

При плануванні вибіркового обстеження настає момент, коли потрібно вирішити, скільки людина опитувати, тобто яким повинен бути обсяг вибірки. Це рішення надзвичайно важливо, оскільки занадто велика вибірка зажадає зайвих витрат, а надто маленька знизить якість результатів.

Оскільки вибіркова сукупність - це частина генеральної сукупно-сті, відібрана за допомогою спеціальних методів, - важливо, щоб ця частина не спотворювала уявлення про ціле, тобто репрезентувала його. Соціологів, часто проводять емпіричні дослідження, постійно хвилює питання про те, як багато треба опитувати осіб, щоб отримати достовірну інфор-мацію? Інститут Геллапа в США проводить регулярні опитування по національ-ної вибіркою обсягом в 1,5 тис. Осіб і досягає вражаючою точністю (похибка вибірки становить від 1 до 1,5%). Центр «Соціо-Експрес» Інсти-тута соціології РАН проводить дослідження на вибірці обсягом в 2 тис. Че-ловек, при цьому похибка вибірки не перевищує 3% 25.

Фахівці вважають, що найкраща вибірка - не обов'язково велика. Звичайно, чим більший об'єм вибірки, тим вище точність її результатів. Однак навіть величезна вибірка не гарантує успіху, якщо генеральна сукупність «погано перемішана», тобто є неоднорідною. Однорідної вважається така сукупність, в якій контрольований ознака розбраті діловий рівномірно, не утворює пустот або згущені. В цьому випадку, опросівнесколькіх людина, можна отримати точну інформацію про розподіл цієї ознаки в генеральній сукупності.

Таким чином, на репрезентативність даних впливають не кількісного-ні характеристики вибіркової сукупності (її обсяг), а якісні характеристики генеральної сукупності - ступінь її однорідності.

У соціології ще не придумано єдиної і чіткої формули, що використовуються $ яку можна розрахувати оптимальний обсяг вибіркової сукупності, -такий формули просто не існує в природі. І пояснюється це дуже тяжкий, просто. Справа в тому, що визначення обсягу вибіркової сукупності -проблема не так статистична, скільки змістовна. Іншими сло-вами, обсяг вибіркової сукупності залежить від безлічі факторів, у ton числі від цілей і завдань, теоретичної моделі, гіпотез і методів дослід-вання, ступеня однорідності генеральної сукупності, нарешті, вимагаю-щейся точності одержуваної інформації.

Практика показує, що для багатьох соціологів обгрунтування обсягу вибірки є каменем спотикання, незважаючи на значну кількість литерату-ри, присвяченій вибірковим методам і, зокрема, розрахунку обсягу вибірки Причин кілька:

1) дефіцит спеціальної літератури на периферії; 2) брак часу для самоосвіти; 3) невміння користуватися математичним ап-Параті.

Процедура розрахунку обсягу вибірки - ланцюг нескінченних компромісу між прагненням до точності і обмеженістю ресурсів, дефіцитний часу і неповнотою відомостей про досліджуваному явищі. Разом з тим ете наука і мистецтво, пізнання яких є кожній людині. Однакс для цього потрібно знати стратегії розрахунку обсягу вибірки (попередньо-го розрахунку, послідовної і комбінованої стратегії), а також фак-тори, що впливають на обсяг вибірки (обсяг генеральної сукупності, варь-ювання відповідей респондентів, точність оцінювання, характер предпола-Гаєм розподілу відповідей, метод дослідження, процедура обробки)

Стратегія попереднього розрахунку полягає в тому, що обсяг вибірки * визначається до проведення основного дослідження. Для розрахунку обсяг; випадкової вибірки треба знати бажану точність оцінювання, величі ризику одержуваного відповіді і ступінь мінливості відповіді. Традиційно точ-ність оцінювання приймають за 5%, а величину ризику - за 0,95. Іншими сло-вам, якщо за даними вибіркового дослідження 60% опитаних задоволені роботою, то можна стверджувати, що в генеральній сукупності частка задоволених складе від 55 до 65% в 95% випадків, а в 5% випадків така частка може вийти за цей інтервал. Якщо виходити з 5% -ної точності і ве-личини ризику в 0,95, обсяг вибірки буде наступним.

Залежність обсягу вибірки від обсягу генеральної сукупності

Обсяг генеральної совокупнос

Результати, наведені в таблиці, свідчать проти поширеною-ненного помилки, нібито обсяг вибірки - жорстко фіксований відсоток від генеральної сукупності, що дорівнює 10. Насправді ж ця ве-личина - непостійна, а змінна, що змінюється в конкретних умо-вах. Обсяг вибірки залежить також від того, які питання використовуються в анкеті. Цифри в табл. 3 дійсні тільки для одного випадку - коли мова йде про дихотомічному питанні, у якого максимальний розкид відповідей - 50 на 50%. Не маючи попередньою інформацією про розкид оцінок, соці-олог як би заздалегідь страхується і вважає, що цей розкид складе 50 на 50%. Якщо ж така інформація є, то обсяг вибірки буде наступним.

Рас-чет обсягу вибірки для кількісних питань, що включають питання типу «вік» і «заробітна плата», будується виходячи з коефіцієнта ва-РИАЦ (табл. 5), який показує, який відсоток становить середнє відхилення від середньої арифметичної, і дозволяє срав -нівать між собою (за ступенем варіювання) будь-які ознаки.

Якщо вивчаються умови праці, взаємини в колективі, заробітку-на плата і т.д. за допомогою пятичленной шкали, то коефіцієнт варіації змінюється тут від 27 до 62%, а при використанні семичленной - від 78 до 113%. Стало бути, чим довше шкала, тим вище коефіцієнт варіації і більше повинен бути обсяг вибірки. Якщо соціолог хоче обійтися невеликих шой вибіркою, то і питання повинен формулювати простіше. Іноді дума-ють, що чим довше шкала, тим точніше вимір. Але переваги семи-бальних шкал над п'ятибальною не доведені.

Серед соціологів поширена думка, згідно з яким чим біль-ше обсяг вибірки, тим точніше результат, і це змушує їх непомірно збіль-лічівает кількість опитаних. У реальності справа йде інакше: за даними Інституту Геллапа, існує залежність між-ду об'ємом вибірки і точністю оцінювання у відсотках. З неї випливає, що зі збільшенням обсягу вибірки точність зростає, але до виразно-го порога. Уже при 600 опитаних досягається бажаний для всіх 5% -вий рівень точності. Стало бути, 600 чоловік - прийнятний обсяг вибірки.

При розрахунку обсягу вибірки соціологи часто роблять таку помилку: розрахувавши за існуючими формулами необхідний обсяг вибірки в це-лом для сукупності, в подальшому пропорційно розміщують його по окремим підрозділам вибірки, наприклад по цехам, підприємствам, районам, містам, типам сімей. Після чого на етапі обробки даних - ана-лізує вже самі відмінності між підрозділами. Однак правильніше обчислити об'єм вибірки окремо для кожного підрозділу, а потім сум-рмувати окремі обсяги. Припустимо, розрахунки обсягу вибірки за трьома цехам (з урахуванням розмірності шкали, чисельності працюючих, характеру передбачуваного розподілу оцінок) дозволили встановити, що в пер-вом цеху необхідно запитати 384 людини, у другому - 222, а в третьому -600. Тоді загальний обсяг вибірки складе 384 + 222 + 600 = 1206 осіб.