Види, методи і способи відбору
Вибіркова сукупність буде повно і адекватно відображати властивості генеральної сукупності в тому випадку, якщо вона буде репрезентує-нормативної (представницької). Репрезентативність вибірки залежить від застосовуваних видів, методів і способів відбору одиниць.
Достовірність результатів спостереження досягається за рахунок дотримання основного принципу вибіркового спостереження. забезпечення випадковості відбору одиниць (рівна можливість одиниць потрапити до вибірки)
У теорії вибіркового спостереження розроблені різні види, методи і способи відбору одиниць з генеральної сукупності.
Розрізняють два види відбору одиниць у вибіркову сукупність: по-повторний і бесповторний.
При бесповторном відборі відібрана одиниця піддається обстеженню і в подальшій процедурі відбору не бере ( «схема безповоротного кулі»). Тим самим, ймовірність потрапити до вибірки для решти одиниць збільшується з кожним кроком відбору. Такий вид відбору практично можливий, коли обсяг генеральної сукупності чітко визначено.
В ході вибіркового спостереження можуть застосовуватися такі способи відбору одиниць з генеральної сукупності:
§ індивідуальний відбір - у вибірку відбираються окремі одиниці сукупності;
§ груповий відбір - у вибірку потрапляють якісно однород-ні групи або серії одиниць;
§ комбінований відбір - поєднання індивідуального і групового способів відбору.
Вибіркова сукупність може бути сформована за допомогою таких методів відбору одиниць:
1. випадковий (власне-випадковий);
3. типовий (розшарований, стратифікований);
4. серійний (гніздовий);
Наведемо коротку характеристику цих методів відбору одиниць.
Власне-випадковий (випадковий) відбір - індивідуальний відбір одиниць, кожній з яких привласнений порядковий номер, за допомогою жеребкування або таблиці випадок-них чисел (Додаток 3). Генеральна сукупність попередньо не поділяється на будь-які групи. Умовою репрезентативності вибірки служить принцип випадковості (рівна можливість кожної одиниці потрапити до вибірки). Власне-випадкова вибірка може здійснюватися за схемами повторного і бесповторного волок (наприклад, проведення тиражів грошово-речової лотереї).
Механічний відбір-відбір з попередньо впорядкованої і розбитою на рівні інтервали (групи) генеральної сукупності. Розмір ін-інтервалу дорівнює зворотній величині частки вибірки. Наприклад, при 5% - ної вибірці відбирається кожна 20-я одиниця (1 / 0,05), при 10% -ної вибірці - кожна 10-я одиниця (1 / 0,1) і т.д. В результаті, генеральна сукупність як би механічно розбивається на рівновеликі групи. З кожної групи до вибірки відбирається лише одна одиниця. При цьому відбір починається не з першої одиниці сукупності, а з се-Редіна першого інтервалу. Для забезпечення репрезентативності все одиниці генеральної сово-купності повинні розташовуватися в певному порядку. Механічний відбір завжди буває бесповторного. Він має перевагу перед випадковим відбором, тому що його легше організувати.
Типовий відбір (розшарований, стратифікований) - неоднорідна генеральна сукупність спочатку розбивається на якісно однорідні типові групи (не обов'язково рівні). Потім з кожної групи проводиться індивідуальний відбір випадковим або механічним методом. Типова вибірка застосовується при вивченні складних статистичних сукупностей і дає більш точні результати в порівнянні з іншими методами відбору. Зокрема, випадкова помилка при типовому відборі менше, ніж при власне-випадковому і механічному відборі. Це пояснюється тим, що наявне співвідношення між групами одиниць генеральної сукупності, зберігається і в вибіркової сукупності. Типовий відбір буває повторним і бесповторного.
З кожної типової групи в вибіркову сукупність можна відбирати певну кількість одиниць за допомогою наступних різновидів типового відбору:
1. пропорційний типовий відбір - число одиниць вибірки n пропорційно питомій вазі кожної групи в генераль-ної сукупності:
де: - обсяг вибірки з - ой типової групи;
- обсяг - ой типової групи в генеральній сукупності.
2. непропорційний типовий відбір - число одиниць вибірки непропорційно питомою вагою кожної групи в гені-ральної сукупності:
де - число виділених типових груп.
3. відбір з урахуванням варіації ознаки число одиниць вибірки пропорційно питомій вазі в генеральній сукупно-сті з урахуванням варіації ознаки по групах:
- для середньої. де - середньоквадратичне відхилення i - ї групи;
Серійний (гніздовий) відбір - це відбір, при якому у випадковому порядку відбираються не окремі одиниці, а цілі групи одиниць (серії, гнізда), які піддаються суцільному спостереженню. Відбір окремих серій здійснюється на основі випадкового або механічного методу. Серійний відбір застосовується в тому випадку, якщо генеральна сукупність розбита на групи ще до початку вибіркового спостереження. На практиці частіше застосовується бесповторний відбір з рівними серіями. Помилка серійної вибірки більше, ніж при іншому методі відбору. Але серійний відбір має організаційними перевагами, тому досить часто застосовується на практиці. Серійну вибірку застосовують в двох випадках: 1) всі серії мають однакову кількість одиниць; 2) серії різні за обсягом. Серійний відбір забезпечує економію коштів, якщо про-проходження поширюються на велику територію і гнізда-ми є територіальні одиниці.
У розглянутих вище методах здійснювався одноступінчатий і багато-ступінчастий відбір одиниць у вибіркову сукупність.
При одноступінчастої вибірці кожна відібрана єдині-ца відразу ж піддається вивченню за заданою ознакою (власне-випадковий і серійний відбір).
При багатоступінчастої вибірці застосовується кілька ста-дій (ступенів) відбору. Проводять відбір окремих груп з ге-ральним сукупності, потім з груп вибі-раются окремі одиниці (механічний відбір). При цьому кожна стадія має свою оди-ніцу відбору. Число ступенів визначається числом типів одиниць відбору. Наприклад, на останньому щаблі одиниця відбору збігається з едини-цей вибірки. Помилка всієї вибірки складається з помилок на окремих ступенях відбору.
При побудові багатоступінчастої вибірки використовується комбінація різних методів відбору, тому такий метод відбору іноді називають комбінованої вибіркою.
Від багатоступінчастого відбору слід відрізняти багатофазних відбір. На відміну від багатоступінчастого відбору, він передбачає збереження однієї і тієї ж одиниці відбору на всіх етапах його проведення. При цьому відібрані на кожній стадії одиниці піддаються обстеженню по більш широкій програмі. Багатофазна вибірка використовується для розширення програми обстеження.
Особливим видом вибіркового спостереження явища моментное спостереження. тобто вибіркове спостереження в часі. При цьому всі одиниці досліджуваної сукупності підлягають суцільному обліку: об'єктами вибірки служать відрізки часу. Тому поняття генеральної і вибіркової сукупності відносяться не до сукупності одиниць, а до часу спостереження.
Вибіркове спостереження носить несуцільний характер, тому воно супроводжується помилками (похибками).
Помилки вибіркового спостереження виникають в двох випадках: 1. при зборі даних (помилки реєстрації); 2. в результаті неповного обліку одиниць генеральної сукупності (помилки репрезентативності).
Таким чином, будь-якого вибіркового спостереження властива помилка репрезентативності - розбіжність між характеристиками вибіркової і генеральної сукупності (рис 7.1).
Рис 7.1. Види помилок репрезентативності
Помилка репрезентативності виникає в результаті того, що ви-борочная сукупність повному обсязі відбиває закономірності, притаманні генеральної сукупності. Величина випадкової помилки репрезентативності залежить:
1) від обсягу вибірки;
2) від ступеня варіації ознаки у генеральній сукупності;
3) від методу відбору одиниць і т.д.
За даними вибіркової сукупності оцінюють показники (параметри) генеральної сукупності. Наприклад, використовують оцінку 2-х параметрів:
- генеральної середньої величини досліджуваного ознаки (для кількісної ознаки);
- генеральної частки (для альтернативної ознаки).
Теоретичне обґрунтування появи випадкових помилок вибірки пояснюють граничні теореми теорії ймовірностей. Так як випадкова помилка вибірки виникає в результаті випадкових відмінностей між кордонами вибіркової і генераль-ної сукупностей, то при досить великому обсязі вибірки ця помилка буде як завгодно мала. Тому характеристики вибірки можуть досить добре представляти характеристики генеральної сукупність-ності. Випадкові помилки можуть бути доведені до незначних розмірів, що дозволить визначити їх розміри і межі з достатнім ступенем точності на підставі закону великих чисел.
Вибіркове розподіл середньої величини буде прибл-тулитися до нормального розподілу в міру збільшення обсягу вибірки. незави-Сімо від характеру розподілу генеральної сукупності. Зі збільшенням чисельності вибірки величина вибіркової середньої наближається до генеральної середньої.
Одним із завдань вибіркового методу є визначення помилок вибірки. тобто можливих розбіжностей характеристик сукупностей:
1) між вибіркової середньої () та генеральної середньої ();
2) між вибіркової часткою оди-ниць. які мають досліджуваним ознакою, і генеральної до-лей (р).
Методи математичного-ської статистики дозволяють виміряти ці помилки і вказати межі їх коливання. Величину помилок можна оцінити за формулами:
У статистиці розрізняють три види помилок вибірки:
Вид формули середньої помилки вибірки залежить від методу відбору. Розглянемо порядок розрахунку помилок вибірки при власне-випадковому відборі.
Середня помилка вибірки - характеризує середню величи-ну можливих розбіжностей вибіркових (середня. Частка) і генеральних характеристик (середня. Частка) сукупності. Являє собою середнє відхилення можливих значень характеристик вибіркової сукупності від характеристик генеральної сукупності.
Розглянемо формули середньої помилки вибірки длясредней і частки при повторному і бесповторном відборі:
1. При повторному відборі:
1.1. Середня помилка вибіркової середньої:
1.2. Середня помилка вибіркової частки:
2. При бесповторном відборі:
2.1. Середня помилка вибіркової середньої:
2.2. Середня помилка вибіркової частки:
де - дисперсія ознаки у генеральній сукупності;
- вибіркова частка одиниць, які мають досліджуваним ознакою; дисперсія частки (альтернативного ознаки).
Зауваження. На практиці величина дисперсії ознаки в генеральній сукупності. як правило, невідома. Тому в формули помилки вибірки підставляють дисперсію вибіркової сукупності. Це можливо, оскільки між дисперсіями генеральної і вибіркової сукупностей існує наступний взаємозв'язок:
При великій чисельності вибіркової сукупності співмножник прагне до одиниці, і вибіркова дисперсія практично збігається з генеральною. тобто .
Зауваження. Оскільки при бесповторном відборі в ході вибірки обсяг генеральної сукупності скорочується, то в формулу для розрахунку середньої помилки включають додатковий множник.
Середня помилка вибірки при власне-випадковому повторному відборі залежить від:
- обсягу вибірки (зворотна залежність);
- ступеня варіації ознаки (пряма залежність).
Чим більше варіація ознаки, тим більше помилка вибірки. Для її зменшення необхідно збільшити обсяг вибіркової сукупності.
Формули розрахунку середніх помилок для різних методів відбору наведені в табл. 7.2.
Формули середніх помилок для різних методів відбору
Умовні позначення в таблиці:
- середня з групових дисперсій;
частка одиниць i -і типової групи (серії) вибірки, які мають досліджуваним ознакою;
- середня з групових дисперсій для частки.
М, m - кількість рівних серій відповідно у генеральній і вибіркової сукупностях;
- межгрупповая вибіркова дисперсія,
де середня в i -й серії; загальна вибіркова середня;
- межгрупповая вибіркова дисперсія частки, де - частка одиниць, що володіють ознакою в вибірці. При рівновеликих серіях
Слід мати на увазі, що в кожній конкретній вибірці різниця може бути менше, більше або дорівнює величині середньої помилки. Імовірність такої помилки різна. Тому розраховують граничну похибку вибірки.
Гранична помилка вибірки - це максимально можливе розбіжність характеристик вибіркової (середня. Частка) і генеральної сукупності (середня. Частка), тобто максимум помилки при заданої ймовірності її появи.
Величина граничної помилки визначається за формулою:
де - коефіцієнт довіри, який визначається за таблицею значень інтеграла Лапласа при заданій довірчій ймовірності Він показує, у скільки разів гранична помилка вибірки відрізняється від середньої помилки.
Відповідно, формули граничної помилки для середньої і частки. мають вигляд:
Значення інтеграла Лапласа табульовані в залежності від значень коефіцієнта (Додаток 2). Тому на практиці користуються готовими таблицями значень. Наведемо найуживаніші рівні довірчої ймовірності і відповідні їм значення:
Наприклад, 10% -вий рівень значущості означає, що в 90 випадках з 100 характеристика генеральної сукупності, виявлена на основі вибірки, буде лежати в межах довірчого інтервалу. Тобто, в 10 випадках з 100 існує ризик припуститися помилки за вибірковими даними при оцінці генеральної сукупності.
Очевидно, що чим більше значення граничної помилки. тим більше величина довірчого інтервалу, тобто нижче точність оцінки.
Формули граничної помилки дозволяють визначити:
§ довірчі інтервали. в яких будуть перебувати значення генеральних параметрів:
§ необхідну чисельність вибірки. забезпечують-вающий з певною ймовірністю задану точність спостереження ();
§ ймовірність допуску тієї чи іншої заданий помилки (визначається і знаходиться ймовірність).
Поряд з абсолютною величиною граничної помилки вибірки розраховують і відносну похибку вибірки. Вона определяетсякак процентне відношення граничної помилки вибірки до відповідної характеристиці вибіркової сукупності (середня. Частка):
Вибірка вважається репрезентативною, якщо 5%.
Приклад. В порядку випадкової бесповторной вибірки було обстежено n = 160 турфірм з N = 1500, і отримані наступні дані про їхній обсяг продажів за звітний період (табл. 7.4).