Емпіричні і вирівнюють (теоретичні) частоти
А. Дискретне розподіл. Розглянемо дискретну випадкову величину X, закон розподілу якої невідомий. Нехай вироблено п випробувань, в яких величина X прийняла n1 раз значення х1, n2 раз значення x2. nk раз значення xk, причому.
Емпіричними частотами називають фактично спостережувані частоти ni.
Нехай є підстави припустити, що досліджувана величина X розподілена по деякому певному закону. Щоб перевірити, чи узгоджується це припущення з даними спостережень, обчислюють частоти спостережуваних значень, т. Е. Знаходять теоретично частоту ni 'кожного з спостережуваних значень в припущенні, що величина X розподілена по передбачуваному закону.
Вирівнюючими (теоретичними) на відміну від фактично спостережуваних емпіричних частот називають частоти ni 'знайдені теоретично (обчисленням). Вирівнюючі частоти знаходять за допомогою рівності
де n - число випробувань; Рi - ймовірність спостережуваного значення хi, обчислена при допущенні, що X має передбачуваний розподіл.
Отже, вирівнює частота спостережуваного значення xi дискретного розподілу дорівнює добутку числа випробувань на ймовірність цього спостережуваного значення.
Приклад. В результаті експерименту, що складається з n = 520 випробувань, в кожному з яких реєструвалося число хi появ деякої події, отримано наступне емпіричне розподіл:
набл. значення. xi 0 1 2 34567
ЕМП. частота. ni 120 167 130 69 27 5 1 1
Знайти вирівнюють частоти ni 'в припущенні, що випадкова величина X (генеральна сукупність) розподілено згідно із законом Пуассона.
Рішення. Відомо, що параметр # 955 ;, яким визначається розподіл Пуассона, дорівнює математичному очікуванню цього розподілу. Оскільки в якості оцінки математичного очікування приймають вибіркову середню (див. Гл. XVI, § 5), то і в якості оцінки # 955; можна прийняти вибіркову середню. Легко знайти за умовою, що вибіркова середня дорівнює 1,5, отже, можна прийняти # 955; = 1,5.
Таким чином, формула Пуассона
Користуючись цією формулою, знайдемо ймовірності Р520 (К) при k = 0, 1, 2, 3, 4, 5, 6, 7 (для простоти запису індекс 520 далі опущений): Р (0) = 0,22313, Р (1 ) = 0,33469, Р (2) = 0,251 021, Р (3) = 0,125511, Р (4) = 0,047066, Р (5) = 0,014120, Р (6) = 0,003530, P (7) = 0,000755. Знайдемо вирівнюють частоти (результати множення округлені до одиниці):
Аналогічно знаходять і інші вирівнюють частоти. В результаті отримаємо:
ЕМП. частота. 123 167 130 69 27 5 1 1
вир. частота. 116 174 131 65 25 7 2 0
Порівняно невелике розходження емпіричних і вирівнюють частот підтверджує припущення, що розглядається розподіл підпорядковане закону Пуассона.
Зауважимо, що якщо підрахувати вибіркову дисперсію за даним розподілом, то виявиться, що вона дорівнює вибіркової середньої, тобто 1,5. Це служить ще одним підтвердженням зробленого припущення, оскільки для розподілу Пуассона # 955; = М (X) = D (X)
Порівняння емпіричних і теоретичних частот сну очей », звичайно, недостатньо. Щоб зробити це більш обгрунтовано, треба використовувати, наприклад, критерій Пірсона (див. Гл. XIX, § 23). Перевірка гіпотези про розподіл випадкової величини за законом Пуассона викладена в книзі: Гмурман В. Є. Керівництво вирішення задач з теорії ймовірностей і математичній статистиці. М. «Вища школа», 1972 (див. Гл. XIII, § 17).
Б. Безперервне розподіл. У разі безперервного розподілу, ймовірності окремих можливих значень дорівнюють нулю (див. Гл, X, § 2, наслідок 2). Тому весь інтервал можливих значень ділять на k непересічних інтервалів і обчислюють ймовірності Pi попадання X в i -й частковий інтервал, а потім, як і для дискретного розподілу, множать число випробувань на ці ймовірності.
Отже, вирівнюють частоти безперервного розподілу знаходять з рівності
де п - число випробувань; Рi - ймовірність попадання X в i -й частковий інтервал, обчислена при допущенні, що X має передбачуваний розподіл.
Зокрема, якщо є підстави припустити, що випадкова величина X (генеральна сукупність) розподілена нормально, то вирівнюють частоти можуть бути знайдені за формулою
де п - число випробувань (обсяг вибірки), h - довжина часткового інтервалу, # 963; в - вибіркове середнє квадратів-чеський відхилення, (xi - середина i -гo часткового інтервалу),
Приклад на застосування формули (*) наведено в § 7.
Пояснення. Пояснимо походження формули (*). Напишемо щільність загального нормального розподілу:
При а = 0 і # 963; = 1 отримаємо щільність нормованого розподілу:
або, змінивши позначення аргументу,
Порівнюючи (**) і (***), робимо висновок, що
Якщо математичне очікування а й середньоквадратичне відхилення # 963; невідомі, то в якості оцінок цих параметрів приймають відповідно вибіркову середню і вибіркове середнє квадратичне відхилення # 963; в (див. Гл. XVI, § 5,9). тоді
Нехай xi - середина i -гo інтервалу (на які розбита сукупність всіх спостережуваних значень нормально розподіленої випадкової величини X) довжиною h. Тоді ймовірність попадання X в цей інтервал приблизно дорівнює добутку довжини інтервалу на значення щільності розподілу f (x) в будь-якій точці інтервалу і, зокрема, при х = xi (див. Гл. XI, § 5):
Отже, вирівнює частота
де .Ми отримали формулу (*).