Числові характеристики статистичного ряду

Головна | Про нас | Зворотній зв'язок

Основні поняття математичної статистики

У медико-біологічних задачах часто доводиться досліджувати розподіл тієї чи іншої ознаки для дуже великого числа індивідуумів. У різних індивідуумів ця ознака має різне значення, тому він є випадковою величиною. Наприклад, будь-який лікувальний препарату має різну ефективність при його застосуванні до різних пацієнтам. Однак для того, щоб скласти уявлення про ефективність даного препарату, немає необхідності застосовувати його до всіх хворих. Можна простежити результати застосування препарату до порівняно невеликій групі хворих і на підставі отриманих даних виявити суттєві риси (ефективність, протипоказання) процесу лікування. У зв'язку з цим вводяться два поняття - генеральна сукупність і вибірка.

Генеральна сукупність - підлягає вивченню сукупність однорідних елементів, якi характеризуються деяким ознакою.

Ця ознака може бути як безперервної, так і дискретної випадкової величиною.

Склад генеральної сукупності визначається цілями дослідження. Наприклад, якщо нас цікавить поширеність якого-небудь захворювання в деякому регіоні, то генеральна сукупність - все населення регіону. Якщо ж ми хочемо з'ясувати схильність до цього захворювання чоловіків і жінок окремо, то слід розглядати дві генеральні сукупності.

Для вивчення властивостей генеральної сукупності відбирають деяку частину її елементів.

Вибірка - частина генеральної сукупності, що обирається, для обстеження (лікування).

Якщо це не викликає непорозумінь, то вибіркою називають як сукупність об'єктів. відібраних для обстеження, так і сукупність значень досліджуваного ознаки, отриманих при обстеженні. Ці значення можуть бути представлені декількома способами.

Простий статистичний ряд - значення досліджуваної ознаки, записані в тому порядку, в якому вони були отримані.

Приклад простого статистичного ряду, отриманого при вимірюванні швидкості поверхневої хвилі (м / с) в шкірі чола у 20 пацієнтів, наведено в табл. 3.1.

Простий статистичний ряд

Просто статистичний - основний і найповніший спосіб запису результатів обстеження. Він може містити сотні елементів. Окинути таку сукупність одним поглядом досить важко. Тому великі вибірки зазвичай піддають розбиття на групи. Для цього область зміни ознаки розбивають на декілька (N) інтервалів рівної ширини і підраховують відносні частоти (ni / n) попадання ознаки в ці інтервали. Ширина кожного інтервалу дорівнює:

Межі інтервалів мають таке значення:

Якщо якийсь елемент вибірки є кордоном між двома сусідніми інтервалами, то його відносять до лівого інтервалу. Згруповані таким чином дані називають інтервальним статистичним рядом.

Інтервальний статистичний ряд - це таблиця, в якій наведено інтервали значень ознаки і відносні частоти потрапляння ознаки в ці інтервали.

У нашому випадку можна утворити, наприклад, такий інтервальний статистичний ряд (N = 5, D х = 4), табл. 3.2:

Інтервальний статистичний ряд

Тут до інтервалу 28-32 віднесені два значення рівні 28 (табл. 2), а до інтервалу 32-36 - значення 32, 33, 34 і 35.

Інтервальний статистичний ряд можна зобразити графічно. Для цього по осі абсцис відкладають інтервали значень ознаки і на кожному з них, як на підставі, будують прямокутник з висотою, що дорівнює відносній частоті. Отримана столбчатая діаграма називається гістограмою.

Мал. 3.1. Гістограма.

На гістограмі статистичні закономірності розподілу ознаки проглядаються досить чітко. При великому обсязі вибірки (кілька тисячь) і малої ширині стовпців форма гістограми близька до форми графіка щільності розподілу ознаки.

Число стовпців гістограми можна вибрати за такою формулою:

N = 1 + 3,3 × lg n. (3.1)

Побудова гістограми вручну - процес довгий і нудний. Тому розроблені комп'ютерні програми для автоматичної побудови.

Числові характеристики статистичного ряду

Багато статистичні проце6дури використовують вибіркові оцінки для математичного сподівання і дисперсії (або СКО) генеральної сукупності.

Вибіркове середнє () є середнє арифметичне всіх елементів простого статистичного ряду:

Для нашого прикладу = 37,05 (м / с).

Вибіркове середнє - це найкраща оцінка математичного очікування (М) генерального середнього.

Вибіркова дисперсія s 2 дорівнює сумі квадратів відхилень елементів від вибіркового середнього, поділеної на n - 1:

У нашому прикладі s 2 = 25,2 (м / с) 2.

Зверніть увагу, що при обчисленні вибіркової дисперсії в знаменнику формули коштує не обсяг вибірки n, а n-1. Це пов'язано з тим, що при обчисленні відхилень замість невідомого математичного очікування використовується його оцінка - вибіркове середнє.

Вибіркова дисперсія - це найкраща оцінка генеральної дисперсії (s 2).

Вибіркове середньоквадратичне відхилення (s) - це квадратний корінь з вибіркової дисперсії:

Для нашого прикладу s = 5,02 (м / с).

Вибіркове середньоквадратичне відхилення - це найкраща оцінка генерального СКО (s).