вторинна угруповання

Вторинні угруповання - результат об'єднання або розщеплення первинних угруповань, вони дозволяють долати несумісність вихідних даних в первинних угрупованнях і тим самим об'єднувати їх в одну загальну і виконувати порівняння, зіставлення даних, представлених в них після проведення вторинної угруповання.

При розробці первинної угруповання істотне значення має вибір числа груп. Число груп залежить від типу ознаки, покладеної в основу угруповання (підстави угруповання), від обсягу сукупності, ступеня варіації ознаки.

При побудові угруповань за якісною ознакою кількість груп відповідає кількості рівнів градації ознаки. При групуванні за кількісною ознакою все безліч значень ознаки ділиться на інтервали. При цьому можливо два підходи: угруповання з рівними і нерівними інтервалами.

Для визначення цих параметрів в першому випадку рекомендується формула Стерджесс:

n = 1 + (3,322 × lgN). (5.1)

де N - кількість спостережень.

У цьому випадку величина інтервалу:

I = (Хmax - Xmin) / n. (5.2)

Основні етапи побудови статистичних угруповань включають:

§ вибір группировочного ознаки;

§ визначення необхідного числа груп, на які слід розбити досліджувану сукупність;

§ встановлення меж інтервалів угруповання;

§ встановлення для кожної угруповання показників або їх системи, якими повинні характеризуватися виділені групи.

Угруповання з нерівними інтервалами породжує масу проблем при обробці даних, тому слід, у міру можливості, уникати таких угруповань.

Поруч розподілу називається упорядкований розподіл одиниць сукупності на групи за будь-якою ознакою. Види рядів розподілу:

Приклад 6.1. Атрибутивний ряд розподілу

Важливо пам'ятати: в інтервальному ряду в якості основного показника інтервалу використовується середина інтервалу х.

Для наочного уявлення варіаційних рядів використовують графічні методи: полігони частот, гістограми, кумулятивні криві і т.п. Лінійчаті і кругові діаграми будуються для відображення структури сукупності.

Поряд з діаграмами для наочного уявлення розподілу ознаки застосовують такі лінії, як полігон, кумулята, огива і ін.

Полігон - ламана крива, яка будується на основі прямокутної системи координат, коли по осі X відкладаються значення ознаки, а по осі Y - частоти.

Гладка крива, що з'єднує точки, - емпірична щільність розподілу.

Кумулята - ламана крива, яка будується на основі прямокутної системи координат, коли по осі X відкладаються значення ознаки, а по осі Y - накопичені частоти.

Для дискретних рядів на осі відкладаються самі значення ознаки, а для інтервальних - середини інтервалів.

На основі гістограм можна будувати діаграми накопичених частот з наступною побудовою інтегральної емпіричної функції розподілу.