Оцінювання параметрів і властивості вибіркових оцінок - студопедія
При дослідженні різних параметрів генеральної сукупності на основі вибірки можливо лише отримання оцінок цих параметрів. Необхідні оцінки будуються на основі обмеженого набору даних, що тягне за собою певну ймовірність похибки в статистичних висновках. Зауважимо, що значення оцінок можуть змінюватися від вибірки до вибірки.
Процес знаходження оцінок невідомого генерального параметра # 952 ;, від якого залежить розподіл СВ Х. будемо називати оцінюванням. Мета будь-якого оцінювання - отримання найбільш точного значення оцінюваної характеристики (найкращої оцінки). Зазвичай на початковому етапі економетричних досліджень беруться вибіркові числові характеристики, розглянуті в попередньому параграфі. Потім, досліджуючи відповідну оцінку, її уточнюють таким чином, щоб вона задовольняла основним цілям оцінювання. Розрізняють два види оцінок параметрів розподілу генеральної сукупності - точкові та інтервальні.
Точкової оцінкою параметра # 952; називається числове значення цього параметра, отримане за певними правилами за вибіркою обсягу n. Наприклад, оцінками параметрів нормального розподілу m і # 963; (Х) можуть бути і # 963; ст. Оцінка є функцією вибірки, відібраної для вивчення, і може розглядатися як СВ зі своїми числовими характеристиками. «Найкраща оцінка» повинна володіти мінімальним розсіюванням щодо оцінюваного параметра # 952 ;, т. Е. Повинна мати найменшу дисперсію серед всіх інших оцінок. число # 949; таке, що називається точністю (абсолютною похибкою) оцінки.
Розглянемо властивості, здійсненність яких бажана для того, щоб оцінка була визнана задовільною. Якість оцінок будемо характеризувати наступними основними параметрами: Незміщеність, ефективність і спроможність.
оцінка параметра # 952; називається несмещенной. якщо її математичне сподівання дорівнює оцінюваному параметру: М () = # 952 ;. Якщо це рівність не виконується, то оцінка є зміщеною і різниця М () - # 952; буде називатися зміщенням або систематичної помилкою оцінювання. Відповідно, оцінка буде в середньому занижувати (якщо М () - # 952; <0), либо завышать (если М ( ) - θ> 0) значення параметра # 952 ;.
Несмещенная оцінка називається ефективною оцінкою параметра # 952 ;, якщо вона має найменшу дисперсію серед всіх можливих незміщене оцінок при фіксованому обсязі вибірки n.
Оцінка називається асимптотично ефективною. якщо зі збільшенням обсягу вибірки її дисперсія прагне до нуля (Dn () ® 0, при n ® ¥).
оцінка параметра # 952; називається заможної. якщо вона сходиться по ймовірності до оцінюваного параметру:
для будь-якого як завгодно малого # 949;> 0.
Іншими словами, заможної є така оцінка, яка, відповідно до закону великих чисел, дає істинне значення параметра при досить великому обсязі вибірки.
Оцінки, які є лінійними функціями від вибіркових спостережень, називаються лінійними. Важливу роль в економетрики грають найкращі лінійні незсунені оцінки. які мають найменшу дисперсію серед всіх можливих оцінок даного класу.
Найбільш відомими методами знаходження точкових оцінок параметрів генеральної сукупності є метод моментів, метод максимальної правдоподібності, метод найменших квадратів. Тут ми коротко зупинимося на описі методу максимальної правдоподібності [16], оскільки метод найменших квадратів буде розглянуто в наступних розділах як основний метод знаходження оцінок параметрів регресійних економетричних моделей.
Нехай СВ Х представлена вибіркою x1. x2. ..., xn і має щільність розподілу f (x. # 952;), що залежить від невідомого параметра # 952 ;. Згідно з методом максимальної правдоподібності, як оцінки параметра # 952; приймається таке значення. яке максимізує функцію правдоподібності L:
виражає щільність ймовірностей спільного появи результатів вибірки x1. x2. ..., xn. У більшості випадків більш ефективно розглядати логарифмічну функцію правдоподібності l = lnL. Необхідною умовою максимуму є рівняння (), яке називається рівнянням правдоподібності. Для широкого класу задач оцінки методу максимальної правдоподібності є заможними і асимптотично ефективними. У той же час вони можуть бути усунутими. Недоліком методу є необхідність знати закон розподілу СВ.
Наприклад, за допомогою нескладних перетворень можна показати, що оцінками максимальної правдоподібності для нормальної генеральної сукупності є вибіркове середнє і вибіркова дисперсія. Вибіркове середнє є несмещенной і заможної оцінкою математичного очікування М (Х) генеральної сукупності. Вибіркова дисперсія є зміщеною оцінкою дисперсії генеральної сукупності D (X) = # 963; 2. так як доведено, що Dв = # 963; 2 · (n - 1) / n. Іншими словами, вибіркова дисперсія оцінює генеральну дисперсію D (X) з недоліком. Незміщеної і заможної оцінкою буде виправлена вибіркова дисперсія
Слід зауважити, що при n ® ¥ і оцінка Dв є асимптотично несмещенной. Різниця між Dв і S 2 при n> 30 практично відсутня. Тому при досить великому обсязі вибірки обидві дисперсії можна вважати незміщеними оцінками.
Відповідно до S 2 вводиться виправлене середнє квадратичне відхилення (емпіричний стандарт) S:
Відносна частота є несмещенной і заможної оцінкою ймовірності Р (Х = хі). Відповідно, емпірична функція розподілу (накопичена відносна частота) є несмещенной і заможної оцінкою теоретичної функції розподілу F (x) = P (X Поряд з точковими оцінками параметрів розглядають інтервальні оцінки, які дозволяють отримати інформацію про точність та надійності оцінювання невідомого параметра, що особливо важливо для вибірок невеликого обсягу. Інтервального оцінкою параметра # 952; називають числовий інтервал. який із заданою вірогідністю # 947; накриває невідоме точне значення оцінюваного параметра. При цьому зазначений інтервал називають довірчим інтервалом. а ймовірність # 947; - довірчою ймовірністю або надійністю оцінки. Величина довірчого інтервалу, що характеризує точність оцінки, залежить від обсягу вибірки n (зменшується зі зростанням n) і надійності # 947; (Збільшується з наближенням # 947; до одиниці). Найчастіше для визначення довірчого інтервалу заздалегідь вибирають число # 945; = 1 - # 947 ;, зване рівнем значущості, і знаходять два числа і. такі, що У цьому випадку говорять, що довірчий інтервал накриває невідомий параметр # 952; з ймовірністю 1 - # 945; або в 100 (1 - # 945;)% випадків. Межі інтервалу зазвичай знаходяться з умови Р (# 952; <) = P(θ> ) = # 945; / 2. вибір # 947; (або # 945;) визначається необхідної надійністю оцінки. зазвичай використовується # 945; = 0,1; 0,05; 0,01, що відповідає 90, 95 і 99% -м довірчим інтервалом. Оскільки в економетричних задачах часто доводиться знаходити довірчі інтервали параметрів СВ, наведемо приклади їх побудови. Довірчий інтервал для математичного очікування нормальної СВ. З генеральної сукупності нормально розподіленої СВ Х з параметрами m і # 963; витягується вибірка обсягу n. Як точкової оцінки математичного очікування m використовується вибіркове середнє. В силу властивостей багатовимірного нормального розподілу [2] величина (статистика). де - виправлене вибіркове середнє квадратичне відхилення, має розподіл Стьюдента з n - 1 ступенями свободи. Тоді, при необхідному рівні значущості # 945 ;, довірчий інтервал для математичного очікування, що накриває невідоме значення m з надійністю 1 - # 945 ;, визначаться з наступних співвідношень: Довірчий інтервал для дисперсії нормальної СВ. Для оцінки # 963; 2 витягується вибірка обсягу n. Як точкової оцінки дисперсії # 963; 2 = D (X) використовується виправлена вибіркова дисперсія S 2. З огляду на, що статистика має # 967; 2 -розподіл з n - 1 ступенями свободи, довірчий інтервал для невідомого значення генеральної дисперсії # 963; 2 на рівні значущості # 945; визначається за формулою: для заданого # 945; критичні точки визначаються за відповідними таблицями (Додатки 2-6).