Стратифікована вибірка - студопедія
Стратифікована, розщеплену вибірка (stratified sampling)-д вухетапний метод ймовірнісної вибірки, згідно з яким генеральна сукупність спочатку ділиться на підгрупи або споі (арати). Шари повинні взаємно виключати і взаємно доповнювати один одного, щоб кожен елемент сово-купності ставився до одного і тільки одного шару, і жоден елемент не був упущений.
Далі, з кожного шару випадковим чином вибираються елементи, при цьому зазвичай використовується ме-тод простий випадкової вибірки.
Формально, вибір елементів із кожного шару може здійс-вляться тільки за допомогою SRS. Однак на практиці іноді застосовується систематичний від-бор та інші ймовірні вибіркові методи. Відмінність стратифікованою вибірки від квотною полягає в тому, що елементи в ній вибираються скоріше випадково, а не з зручності або на підставі думки дослідника.
Головне завдання стратифікованою вибірки - збіль-чення точності без збільшення витрат.
Змінні, що використовуються для розподілу сукупності на шари, називаються стратифікації-ційними змінними.
Критерії для їх вибору: однорідність, неоднорідність, взаімосвя-занності і вартість.
Елементи, що відносяться до одного шару, повинні бути якомога більш однорідними, а відносяться до різних верств - навпаки, якомога більше різнорідними.
Крім того, стратифікаційних змінні повинні бути тісно пов'язані з досліджуваної ха-рактеристики. Чим більше змінні відповідають цим критеріям, тим ефективніше зменшення небажаних відхилень у вибірці. Зрештою, змінні повинні знижувати вартість процесу розшарування, будучи простими в оцінці та застосуванні. Як правило, для стратифікації використовують такі змінні, як демографічні характеристики (як показано на прикладі квотної вибірки), різновид покупця (власники кредитної картки або ті, хто її не має), величина фірми або галузь промисловості.
Для стра-тіфікаціі можна використовувати кілька змінних, однак більше двох застосовують ред-ко, оскільки це непрактично і економічно невиправдано. Незважаючи на те, що кількість шарів в расслоенной вибірці залишається предметом спору, досвід показує, що використовувати потрібно не більше шести. При використанні більше шести шарів будь-яке підвищення точності зводиться нанівець збільшенням вартості розшарування і відбору.
Інша важлива рішення пов'язане з використанням пропорційної або непропорціо-нальної вибірки.
При пропорційному стратификационном відборі обсяг вибірки, отриманої з кожного шару, пропорційний частці цього шару в обсязі генеральної сукупності.
При непропорційному стратификационном відборі обсяг вибірки, напів-ченной з кожного шару, пропорційний частці цього шару в обсязі генеральної сукупності і середньоквадратичного відхилення розподілу досліджуваної характеристики серед усіх елементів цього шару.
Логіка непропорційною вибірки проста.
По-перше, шари відноси-кові більшого розміру більше впливають на визначення середньої для генеральної сукупно-сті. Отже, ці шари більше впливають на формування результатів вибіркового на-блюдения. Таким чином, шари повинні бути представлені великою кількістю елементів.
По-друге, для підвищення точності оцінки слід відбирати більше елементів з шарів з великим середньоквадратичним відхиленням, і менше елементів - з шарів з меншим середньоквадратичним відхиленням. (Якщо всі елементи шару ідентичні, вибірка, що складається з одного елемента, забезпечить отримання повної інформації.) Зверніть увагу, що ці ме-тоди ідентичні за умови, що досліджувана характеристика має одне й те саме среднеквад-ратичних відхилення в кожному шарі.
При застосуванні непропорційного відбору необхідно розрахувати середньоквадратичне відхилення розподілу досліджуваної характеристики серед елементів шару. Оскільки ця інформація не завжди доступна, досліднику часто доводиться покладатися на інтуїцію і логіку, визначаючи обсяг вибірки для кожного шару. Наприклад, у великих роздрібних магазинах можна очікувати більшого відхилення в обсягах продажів деяких продуктів, ніж в не-великих магазинах. Тому великі магазини представлені в вибірці непропорційно великою кількістю елементів. Коли дослідника в першу чергу цікавить виявлення відмінностей між шарами, зазвичай створюють однакові за обсягом вибірки з кожного шару.
Стратифікаційний метод забезпечує наявність у вибірці всіх важливих підгруп. Це особливо важливо, якщо досліджувана характеристика нерівномірно розподілена серед елементів генеральної сукупності. Наприклад, розподіл доходу сімей нерівномірно, так як річний дохід більшості сімей становить менше 50 тисяч доларів, і лише деякі се-мьі мають річний дохід, рівний 125 тисяч доларів і вище. Якщо застосувати просту слу-чайну вибірку, сім'ї з доходом 125 тисяч доларів і вище можуть не бути адекватно пред-ставлені. Стратифікована вибірка дозволяє забезпечити відповідну кількість таких сімей у вибірці. Вона поєднує в собі простоту методу SRS з можливістю підвищення точності. Тому даний метод формування вибірки вельми популярний.