Орлов а

5. Основні проблеми прикладної статистики - опис даних, оцінювання і перевірка гіпотез

Спроможність, Незміщеність і ефективність оцінок

Як порівнювати методи оцінювання між собою? Порівняння проводять на основі таких показників якості методів оцінювання, як спроможність, Незміщеність, ефективність і ін.

Розглянемо оцінку # 952; n числового параметра # 952 ;, певну при n = 1, 2, ... Оцінка # 952; n називається заможної. якщо вона сходиться по ймовірності до значення оцінюваного параметра # 952; при безмежному зростанні обсягу вибірки. Висловимо сказане більш докладно. Статистика # 952; n є спроможною оцінкою параметра # 952; тоді і тільки тоді, коли для будь-якого позитивного числа # 949; справедливо граничне співвідношення

Приклад 3. Із закону великих чисел слід, що # 952; n = є спроможною оцінкою # 952; = М (Х) (у наведеній вище теоремі Чебишева передбачалося існування дисперсії D (X), а проте, як довів А.Я. Хинчин [6], досить виконання слабшого умови - існування математичного очікування М (Х)).

Приклад 4. Всі зазначені вище оцінки параметрів нормального розподілу є заможними.

Взагалі, все (за рідкісними винятками) оцінки параметрів, що використовуються в ймовірносно-статистичних методах прийняття рішень, є заможними.

Приклад 5. Так, відповідно до теореми В.І. Гливенко, емпірична функція розподілу Fn (x) є спроможною оцінкою функції розподілу результатів спостережень F (x).

При розробці нових методів оцінювання слід в першу чергу перевіряти спроможність пропонованих методів.

Друга важлива властивість оцінок - Незміщеність. несмещенная оцінка # 952; n - це оцінка параметра # 952 ;, математичне очікування якої дорівнює значенню оцінюваного параметра: М (# 952; n) = # 952 ;.

Приклад 6. З наведених вище результатів випливає, що і є незміщеними оцінками параметрів m і # 963; 2 нормального розподілу. Оскільки М () = М (m **) = m. то вибіркова медіана і полусумма крайніх членів варіаційного ряду m ** - також незсунені оцінки математичного очікування m нормального розподілу. Однак

тому оцінки s 2 і (# 963; 2) ** не є заможними оцінками дисперсії # 963; 2 нормального розподілу.

Оцінки, для яких співвідношення М (# 952; n) = # 952; невірно, називаються зміщеними. При цьому різниця між математичним очікуванням оцінки # 952; n і оцінюваним параметром # 952 ;, тобто М (# 952; n) - # 952 ;, називається зміщенням оцінки.

Приклад 7. Для оцінки s 2. як випливає зі сказаного вище, зсув дорівнює

Зсув оцінки s 2 прагне до 0 при n → ∞.

Оцінка, для якої зміщення прагне до 0, коли обсяг вибірки прагне до нескінченності, називається асимптотично несмещенной. У прикладі 7 показано, що оцінка s 2 є асимптотично несмещенной.

Практично всі оцінки параметрів, що використовуються в ймовірносно-статистичних методах прийняття рішень, є або незміщеними, або асимптотично незміщеними. Для незміщене оцінок показником точності оцінки служить дисперсія - чим дисперсія менше, тим оцінка краще. Для зміщених оцінок показником точності служить математичне очікування квадрата оцінки М (# 952; n - # 952;) 2. Як випливає з основних властивостей математичного очікування і дисперсії,

тобто математичне очікування квадрата помилки складається з дисперсії оцінки і квадрата її зміщення.

Для переважної більшості оцінок параметрів, використовуваних в ймовірносно-статистичних методах прийняття рішень, дисперсія має порядок 1 / n. а зміщення - не більше ніж 1 / n. де n - обсяг вибірки. Для таких оцінок при великих n другий доданок в правій частині (3) дуже малий в порівнянні з першим, і для них справедливо наближене рівність

де с - число, яке визначається методом обчислення оцінок # 952; n і істинним значенням оцінюваного параметра # 952 ;.

З дисперсією оцінки пов'язано третя важлива властивість методу оцінювання - ефективність. Ефективна оцінка - це несмещенная оцінка, що має найменшу дисперсію з усіх можливих незміщене оцінок даного параметра.

Доведено [11], що і є ефективними оцінками параметрів m і # 963; 2 нормального розподілу. У той же час для вибіркової медіани справедливо граничне співвідношення

Іншими словами, ефективність вибіркової медіани, тобто відношення дисперсії ефективної оцінки параметра m до дисперсії несмещенной оцінки цього параметра при великих n близька до 0,637. Саме через порівняно низьку ефективність вибіркової медіани в якості оцінки математичного очікування нормального розподілу зазвичай використовують вибіркове середнє арифметичне.

Поняття ефективності вводиться для незміщене оцінок, для яких М (# 952; n) = # 952; для всіх можливих значень параметра # 952 ;. Якщо не вимагати незсуненості, то можна вказати оцінки, при деяких # 952; мають меншу дисперсію і середній квадрат помилки, ніж ефективні.

Приклад 8. Розглянемо «оцінку» математичного очікування m1 ≡ 0. Тоді D (m1) = 0, тобто завжди менше дисперсії D () ефективної оцінки. Математичне сподівання середнього квадрата помилки dn (m1) = m2. тобто при маємо dn (m1)

Приклад 9. Більш цікавий приклад розглянуто американським математиком Дж. Ходжесом:

Ясно, що Tn - заможна, асимптотично несмещенная оцінка математичного очікування m. при цьому, як неважко обчислити,

Остання формула показує, що при m ≠ 0 оцінка Tn не гірше (при порівнянні по середньому квадрату помилки dn), а при m = 0 - в чотири рази краще.

Переважна більшість оцінок # 952; n. використовуваних в ймовірносно-статистичних методах, є асимптотично нормальними, тобто для них справедливі граничні співвідношення:

для будь-якого х. де Ф (х) - функція стандартного нормального розподілу з математичним очікуванням 0 і дисперсією 1. Це означає, що для великих обсягів вибірок (практично - кілька десятків або сотень спостережень) розподілу оцінок повністю описуються їх математичними очікуваннями і дисперсіями, а якість оцінок - значеннями середніх квадратів помилок dn (# 952; n).