Що таке мультиколінеарності
обчислити МНК оцінки
β = (X T X) - 1 X T Y. більш того, вони як і раніше будуть лінійними незміщеними і ефективними оцінками параметрів регресії. Проблема полягає в тому, що, якщо змінні майже лінійно залежні, то det (X T X) → 0. відповідно елементи
матриці (X T X) - 1 будуть прагнути до нескінченності, те ж саме буде відбуватися з елементами ковариационной матриці cov (β) = (X T X) - 1 σ 2. Великі дисперсії будуть
означати, що точність оцінки коефіцієнтів буде низька, і вони будуть незначущі. Це відбувається тому що, якщо фактори пов'язані, то важко окремо оцінити вплив кожного з них.
Матеріали по курсу економетрика-1. Підготував Видумкін Платон
Економічна теорія припускає залежність споживчих витрат від багатства і доходу. У таблиці 4.1 наведені результати оцінки такої регресії в логарифмічною формі (дані дивись в додатку 1). Як ми бачимо, коефіцієнти при пояснюють змінних не значимі. У той же час регресія адекватна, причому на будь-якому рівні значущості. Та й коефіцієнт детермінації досить великий. Відбувається це тому що дохід і багатство сильно корельовані (коефіцієнт кореляції = 0.99), та й спостережень у нас досить мало.
Ще раз звернемо увагу, з точки зору теорії у нас все добре. Оцінки не зміщені. Що означає властивість на практиці? Воно означає, що якщо у нас є багато вибірок і по кожній з них ми оцінимо параметри регресії, а потім порахуємо середню оцінку, то вона співпаде з істинним значенням. Але нам від цього не легше, у нас є тільки одна вибірка і по ній виходять погані результати.
Оцінки ефективні, вони мають найменшої дисперсією серед незміщене оцінок. Але знову нам від цього не легше, так як в нашому випадку ця найменша дисперсія, досить велика, щоб зробити точність оцінок неприйнятною.
Більш того, оцінки ще й заможні. Про це не говориться в теоремі ГауссаМаркова, але це так. Це означає, що, якщо розмір вибірки буде прагнути до нескінченності, то оцінки будуть прагнути до істинних значень параметрів, які ми оцінюємо. Це добре, але у нас розмір вибірки заданий, і змінити його ми не можемо.
Dependent Variable: LOG (CONSUMP) Method: Least Squares
Date: 02/27/07 Time: 16:42 Sample 1 10
Included observations: 10
Отже, з точки зору теорії все нормально, а з точки зору практики ми не можемо вирішити що стоїть перед нами завдання. У цьому проблема мультиколінеарності дуже схожа на ситуацію, коли у нас мало спостережень в вибірці. Не випадково деякі методи боротьби з мультіколлінеарності застосовуються і для випадку малих вибірок.
Так як проблема не теоретична, а практична, то методи її рішення будуть носити кустарний характер. Не випадково в більшості сучасних просунутих підручників з економетрики теми мультиколінеарності просто немає.
Ознаки мультиколінеарності.
Почнемо по порядку. Характерними ознаками, при яких зазвичай виникає підозра, що є мультиколінеарності, є
1) Незначні коефіцієнти і при цьому великий R 2 і адекватна регресія
2) Чутливість оцінок коефіцієнтів і оцінок дисперсій коефіцієнтів до додавання і виключення спостереження з вибірки.
Для продовження скачування необхідно зібрати картинку: