стратифікована вибірка

Стратифікована, або розщеплену, вибірка - це процес, перебуваючи щий з двох етапів, в якому сукупність ділиться на підгрупи (слоu, страти, strata). Шари повинні взаємно виключати і взаємно доповнювати один одного, щоб кожен елемент сово-купності ставився до одного і тільки одного шару, і жоден елемент не був упущений. Далі, з кожного шару випадковим чином вибираються елементи, при цьому зазвичай використовується ме-тод простий випадкової вибірки. Формально, вибір елементів із кожного шару може здійс-вляться тільки за допомогою простого випадкового методу. Однак на практиці іноді застосовується систематичний від-бор та інші ймовірні вибіркові методи. Відмінність стратифікованою вибірки від квотною полягає в тому, що елементи в ній вибираються скоріше випадково, а не з зручності або на підставі думки дослідника. Головне завдання стратифікованою вибірки - збіль-чення точності.

Змінні, що використовуються для розподілу сукупності на шари, називаються стратифікації-ційними змінними. Критерії для їх вибору: однорідність, неоднорідність і взаімосвя-занності. Елементи, що відносяться до одного шару, повинні бути якомога більш однорідними, а відносяться до різних слоям- навпаки, якомога більше різнорідними. Крім того, стратифікаційних змінні повинні бути тісно пов'язані з досліджуваної ха-рактеристики. Чим більше змінні відповідають цим критеріям, тим ефективніше зменшення небажаних відхилень у вибірці. Зрештою, змінні повинні знижувати вартість процесу розшарування, будучи простими в оцінці та застосуванні. Як правило, длястратіфікаціі використовують такі змінні, як демографічні характеристики (як показано на прикладі квотної вибірки), різновид покупця (власники кредитної картки або ті, хто її не має), величина фірми або галузь промисловості. Для стра-тіфікаціі можна використовувати кілька змінних, однак більше двох застосовують ред-ко, оскільки це непрактично і економічно невиправдано. Незважаючи на те, що кількість шарів в расслоенной вибірці залишається предметом спору, досвід показує, що використовувати потрібно не більше шести. При використанні більше шести шарів будь-яке підвищення точності зводиться нанівець збільшенням вартості розшарування і відбору.

Інша важлива рішення пов'язане з використанням пропорційної або непропорціо-нальної вибірки (див. Схему). При пропорційному стратификационном відборі обсяг вибірки, отриманої з кожного шару, пропорційний частці цього шару в обсязі генеральної сукупності. При непропорційному стратификационном відборі обсяг вибірки, напів-ченной з кожного шару, пропорційний частці цього шару в обсязі генеральної сукупності і середньоквадратичного відхилення розподілу досліджуваної характеристики серед усіх елементів цього шару. Логіка непропорційною вибірки проста. По-перше, шари відноси-кові більшого розміру більше впливають на визначення середньої для генеральної сукупно-сті. Отже, ці шари більше впливають на формування результатів вибіркового на-блюдения. Таким чином, шари повинні бути представлені великою кількістю елементів. По-друге, для підвищення точності оцінки слід відбирати більше елементів з шарів з великим середньоквадратичним відхиленням, і менше елементів - з шарів з меншим середньоквадратичним відхиленням. (Якщо всі елементи шару ідентичні, вибірка, що складається з одного елемента, забезпечить отримання повної інформації.) Важливо, що ці ме-тоди ідентичні за умови, що досліджувана характеристика має одне й те саме среднеквад-ратичних відхилення в кожному шарі.

При застосуванні непропорційного відбору необхідно розрахувати середньоквадратичне відхилення розподілу досліджуваної характеристики серед елементів шару. Оскільки ця інформація не завжди доступна, досліднику часто доводиться покладатися на інтуїцію і логіку, визначаючи обсяг вибірки для кожного шару. Наприклад, у великих роздрібних магазинах можна очікувати більшого відхилення в обсягах продажів деяких продуктів, ніж в не-великих магазинах. Тому великі магазини представлені в вибірці непропорційно великою кількістю елементів. Коли дослідника в першу чергу цікавить виявлення відмінностей між шарами, зазвичай створюють однакові за обсягом вибірки з кожного шару.

Стратифікаційний метод забезпечує наявність у вибірці всіх важливих підгруп. Це особливо важливо, якщо досліджувана характеристика нерівномірно розподілена серед елементів генеральної сукупності. Наприклад, розподіл доходу сімей нерівномірно, так як річний дохід більшості сімей становить менше 50 тисяч доларів, і лише деякі се-мьі мають річний дохід, рівний 125 тисяч доларів і вище. Якщо застосувати просту слу-чайну вибірку, сім'ї з доходом 125 тисяч доларів і вище можуть не бути адекватно пред-ставлені. Стратифікована вибірка дозволяє забезпечити відповідну кількість таких сімей у вибірці. Вона поєднує в собі простоту методу простої випадкової з можливістю підвищення точності. Тому даний метод формування вибірки вельми популярний.

У кластерної вибірці вивчалася сукупність спочатку ділиться на взаємо-виключають і взаємодоповнюючі підгрупи, або кластери. Потім за допомогою ве-роятностного методу вибірки, формується випадкова вибірка кластерів. До вибірки включаються або всі елементи відібраного кластера, або проводиться їх відбір веро-ятностним методом. Якщо у вибірку включаються всі елементи кожного відібраного кластера, то така процедура називається одноступінчатої кластерної вибіркою. Якщо вибірка отримана за допомогою імовірнісного відбору з кожного обраного кластера, така процедура називає-ся двоступеневої кластерної вибіркою. Як показано на рис. існують два види двоступеневої кластерної вибірки - проста двоступенева кластерна вибірка із використанням користуванням простого випадкового методу і імовірнісна вибірка, пропорційна об'єму (PPS). Крім того, кластерна вибірка може складатися з декількох (більше двох) етапів, виступаючи як багато-ступінчаста кластерна вибірка.

Основна відмінність між кластерної і стратифікованої вибіркою полягає в тому, що в першому випадку використовуються тільки відібрані підгрупи (кластери), в той час як в стратифікованою вибіркою все підгрупи (шари) використовуються для подальшого відбирання-ра. Ці методи переслідують різні цілі. Мета кластерної вибірки - збільшити ефек-ність вибірки, зменшивши витрати на її проведення. Мета стратифікованою вибірки - збільшення точності. За однорідності і неоднорідності критерії формування класти-рів прямо протилежні критеріям формування шарів. Елементи кластера повинні бути максимально різнорідні, а самі кластери - якомога більш однорідними. В ідеалі кожен кластердолжен являти собою невелику модель генеральної сукупності. При кластерної вибірці основа вибіркового спостереження необхідна тільки для кластерів, які увійшли до вибірки.

Поширена форма кластерної вибірки - територіальна вибірка. в якій кластери складаються з географічних територій, таких як округу, житлові райони або квартали. Якщо відбір основних елементів проводиться в один етап (наприклад, дослідник вибирає деякі квартали, а потім все сім'ї, що живуть в цих кварталах, включаються в ви-підбірку), такий вибірковий метод називається одноступінчатої територіальної вибіркою. Ес-ли відбір основних елементів проводиться в два (або більше) етапу (дослідник вибирає квартали, а потім в кожному такому кварталі відбирає сім'ї, які будуть включені в вибір-ку), такий метод називається двоступеневої (або багатоступеневою) територіальної ви-Борки. Відмітна риса одноступінчатої територіальної вибірки полягає в тому, що всі сім'ї з обраних кварталів (або географічних регіонів) включаються до вибірки.

Як показано на рис. існує два типи двоетапної кластерної вибірки. В одному з них простий випадковий метод застосовується як на першому етапі (тобто при виборі кварталів), так і на другому (тобто при відборі сімей в кварталах). Цей метод називається простий двоступеневої кластерної вибіркою. При використанні цього методу кількість елементів (сімей), відібраних на вто-ром етапі, однаково для кожного обраного кластера (відібраного кварталу). Наступний приклад ілюструє застосування двоступеневої територіальної вибірки.

Цей метод підходить в тому випадку, коли всі кластери рівні за обсягом, тобто кожен кла-стер містить приблизно однакову кількість одиниць. Однак, якщо обсяги різні, проста двоступенева кластерна вибірка може привести до помилкових результатів. Іноді, об'єднавши різні кластери, можна зробити їх рівними за обсягом. Якщо обсягів по-дініть кластери можна, слід скористатися ймовірнісної вибіркою, пропорції-нальної обсягом (PPS).

При ймовірнісної вибіркою, пропорційної обсягом кластери відбираються з ймовірністю, пропорційною їх обсягу. Обсяг кластера визначається кількістю вхідних в нього одиниць вибірки. Тому на першому ця-пе великі за обсягом кластери мають велику ймовірність включення до вибірки. На другому етапі ймовірність відбору одиниці з обраного кластера обернено пропорційна його обсягів по-му. Тому ймовірність включення до вибірки буде рівною для всіх вибіркових одиниць, по-кільки нерівна ймовірність включення на першій стадії відбору компенсується нерівній ймовірністю включення на другій стадії.