Презентація на тему гетероскедастичності лекція

2 Цілі лекції Природа проблеми гетероскедастичності Наслідки гетероскедастичності Засоби виявлення гетероскедастичності Засоби для вирішення або пом'якшення проблеми гетероскедастичності

3 Визначення гетероскедастичності гетероскедастичних - це неоднорідність спостережень. Вона характеризується тим, що не виконується передумова 2 0 використання МНК: Здійснимість передумови 2 0 називається гомоскедастичність.

4 Ілюстрація визначення гетероскедастичності

5 Моделі з гетероскедастичними залишками Причиною мінливості дисперсії економетричної моделі часто є її залежність від масштабу розглянутих явищ. У модель помилка входить якадитивну доданок. У той же час часто вона має відносний характер і визначається по відношенню до виміряного рівня розглянутих факторів.

6 Приклад моделі з гетероскедастичності випадковим членом y x

7 Приклади моделей з гетероскедастичності випадковим членом а) в) б) а) Дисперсія 2 зростає в міру збільшення значень пояснює змінної X б) Дисперсія 2 має найбільші значення при середніх значеннях X, зменшуючись у міру наближення до крайніх значень в) Дисперсія помилки найбільша при малих значеннях X, швидко зменшується і стає однорідною в міру збільшення X

8 Перехресні вибірки Найчастіше гетероскедастичності виникає в моделях, заснованих на перехресних вибірках, але зустрічаються і в тимчасових рядах. Типові «хвороби»: Перехресні вибірки - гетероскедастичності Тимчасові ряди - автокорреляция

9 Види гетероскедастичності 1. Справжня гетероскедастичності Викликається непостійністю дисперсії випадкового члена, її залежністю від різних факторів. 2. Хибна гетероскедастичності Викликається помилковою специфікацією моделі регресії.

10 Джерела гетероскедастичності - 1 Справжня гетероскедастичності виникає в перехресних вибірках при залежності масштабу змін залежної змінної від деякої змінної, званої фактором пропорційності (Z).

11 Джерела гетероскедастичності - 1 Найбільш поширений випадок істинної гетероскедастичності - 1: дисперсія зростає з ростом одного з факторів.

12 Джерела гетероскедастичності - 2 Справжня гетероскедастичності виникає також і в тимчасових рядах, коли залежна змінна має великий інтервал якісно неоднорідних значень або високий темп зміни (інфляція, технологічні зрушення, зміни в законодавстві, споживчі переваги і т.д.).

13 гетероскедастичних як наслідок помилки специфікації моделі. Приклад Якщо замість істинної (гомоскедастичність) моделі використовується лінійна модель, то дисперсія залишків лінійної моделі пропорційна квадрату змінної X j:

14 гетероскедастичних найпростішого виду Ми надалі будемо розглядати, головним чином, тільки гетероскедастичності найпростішого виду:

15 Наслідки гетероскедастичності 1. Справжня гетероскедастичності не приводить до зміщення оцінок коефіцієнтів регресії 2. Стандартні помилки коефіцієнтів (обчислені в припущенні. Гомоскедастичність) будуть занижені. Це призведе до завищення t-статистик і дасть неправильне (завищене) уявлення про точність оцінок.

16 Виявлення гетероскедастичності Виявлення гетероскедастичності в кожному конкретному випадку - досить складне завдання. Для знання необхідно знати розподіл випадкової величини Y / X = x i. На практиці часто для кожного конкретного значення x i відомо лише одне y i, що не дозволяє оцінити дисперсію випадкової величини Y / X = x i. Не існує будь-якого однозначного методу визначення гетероскедастичності.

17 Виявлення гетероскедастичності Попередня робота: 1. Чи немає очевидних помилок специфікації? 2. Чи можна змістовно припускати якийсь вид гетероскедастичності? 3. Розгляд графіків залишків:

18 Виявлення гетероскедастичності Тести: 1. Тест рангової кореляції Спірмена. 2. Тест Парку. 3. Тест Глейзера. 4. Тест Голдфелда-Квандта. 5. Тест Уайта. 6. Тест Бреуша-Пагана.

19 Тест рангової кореляції Спірмена При використанні даного тесту передбачається, що дисперсії відхилень залишків будуть монотонно змінюватися (збільшуватися або зменшуватися) зі збільшенням фактора пропорційності Z. Тому значення e i і z i будуть корельовані (можливо, нелінійно!).

20 Тест рангової кореляції Спірмена. Алгоритм застосування 1. Розраховуються ранги (порядкові номери) значень фактора пропорційності z i = x ik. 2. Розраховується рівняння і обчислюються залишки. 3. Розраховуються ранги залишків e i.

21 Тест рангової кореляції Спірмена. Алгоритм застосування 4. Розраховується коефіцієнт рангової кореляції Спірмена, D i - різниця рангів z і e. 5. Розраховують статистику, розподілену нормально N (0,1) при відсутності гетероскедастичності.

22 Тест Парку Тут передбачається, що дисперсії пов'язані з фактором пропорційності Z у вигляді: Оскільки дисперсії невідомі, то їх замінюють оцінками квадратів відхилень e i 2.

23 Тест Парку. Алгоритм застосування 1. Будується рівняння регресії: і обчислюються залишки. 2. Вибирається фактор пропорційності Z і оцінюють допоміжне рівняння регресії: 3. Перевіряють значимість коефіцієнта при

24 Тест Глейзера Тут передбачається, що дисперсії пов'язані з фактором пропорційності Z у вигляді: Оскільки середні квадратичні відхилення невідомі, то їх замінюють модулями оцінок відхилень.

25 Тест Глейзера. Алгоритм застосування 1. Будується рівняння регресії: і обчислюються залишки. 2. Вибирається фактор пропорційності Z і оцінюють допоміжне рівняння регресії: Змінюючи, будують кілька моделей: 3. Статистична значимість коефіцієнта 1 в кожному випадку означає наявність гетероскедастичності. 4. Якщо для декількох моделей буде отримана значуща оцінка 1, то характер гетероскедастичності визначають по найбільш значущою з них.

26 Тести Парку і Глейзера. Висновки Відзначимо, що як в тесті Парку, так і в тесті Глейзера для відхилень i може порушуватися умова гомоскедастичність. Однак, у багатьох випадках використовуються в тестах моделі є досить хорошими для визначення гетероскедастичності.

27 Тест Голдфелда-Квандта У цьому тесті передбачається: 1. Стандартні відхилення залишків пропорційні фактору пропорційності Z, тобто 2. Випадковий член має нормальний розподіл і відсутня автокорреляция залишків (передумова 3 0).

28 Тест Голдфелда-Квандта. Алгоритм застосування 1. Виділяють фактор пропорційності Z = X k. Дані упорядковуються в порядку зростання величини Z. 2. Відкидають середню третину упорядкованих спостережень. Для першої і останньої третини будуються дві окремі регресії, використовуючи ту ж специфікацію моделі регресії. 3. Кількість спостережень в цих підвибірках має бути однаково. Позначимо його l.

29 Тест Голдфелда-Квандта. Алгоритм застосування 4. Беруться суми квадратів залишків для регрессий по першій третині RSS 1 і останній третині RSS 3. Розраховують їх ставлення: 5. Використовуємо F-тест для перевірки гомоскедастичність. Якщо статистика GQ задовольняє нерівності то гіпотеза гомоскедастичність залишків відкидається на рівні значущості.

30 Тест Голдфелда-Квандта. Зауваження Тест Голдфелда-Квандта застосуємо і для випадку зворотної пропорційності: При цьому використовується та ж процедура, але тестова статистика дорівнює:

31 Тест Уайта Передбачається, що дисперсії пов'язані з пояснюють змінними у вигляді: де f () - квадратична функція від аргументів. Оскільки дисперсії невідомі, то їх замінюють оцінками квадратів відхилень e i 2.

32 Тест Уайта. Алгоритм застосування (на прикладі трьох змінних) 1. Будується рівняння регресії: і обчислюються залишки. 2. Оцінюють допоміжне рівняння регресії:

33 Тест Уайта. Алгоритм застосування (на прикладі трьох змінних) 3. Визначають з допоміжного рівняння тестову статистику 4. Перевіряють загальну значимість рівняння за допомогою критерію 2. Якщо то гіпотеза гомоскедастичність відкидається. Число ступенів свободи k дорівнює числу пояснюють змінних допоміжного рівняння. Зокрема, Для розглянутого випадку k = 9.

34 Тест Уайта. Зауваження Тест Уайта є більш загальним ніж тест Голдфелда-Квандта. Незручність використання тесту Уайта: Якщо відкидається нульова гіпотеза про наявність гомоскедастичність то неясно, що робити далі.

35 Тест Бреуша-Пагана Тест застосуємо в припущенні, що: Дисперсії залежать від деяких додаткових змінних:

36 Тест Бреуша-Пагана. Алгоритм застосування 1. Будується рівняння регресії: і обчислюються залишки: 2. Обчислюють оцінку дисперсії залишків: 3. Будують допоміжне рівняння регресії:

37 Тест Бреуша-Пагана. Алгоритм застосування 4. Для допоміжного рівняння регресії визначають пояснення частина варіації RSS. 5. Знаходимо тестову статистику: 6. Якщо вірна гіпотеза H 0. гомоскедастичність залишків, то статистика BP має розподіл. Тобто про наявність гетероскедастичності залишків на рівні значущості свідчить:

38 Тест Бреуша-Пагана. Зауваження При не існує природного перетворення, коригуючого гетероскедастичності При гетероскедастичності може бути скоригована:

39 Засоби при гетероскедастичності 1. Використовувати узагальнений метод найменших квадратів. 2. Відхилити змінні. 3. Обчислення стандартних помилок з поправкою на гетероскедастичності (метод Уайта).

40 Узагальнений метод найменших квадратів При порушенні гомоскедастичність і наявності автокореляції залишків рекомендується замість традиційного МНК використовувати узагальнений МНК. Його для випадку усунення гетероскедастичності часто називають методом зважених найменших квадратів. Заснований на розподілі кожного спостережуваного значення на відповідне йому стандартне відхилення залишків. Метод застосуємо, якщо відомі дисперсії для кожного спостереження.

41 Метод зважених найменших квадратів. Випадок парної регресії Отримали рівняння регресії без вільного члена, але з додатковою пояснює змінної Z і з «перетвореним» залишком. Можна показати, що для нього виконуються передумови 1 0 - 5 0 МНК.

42 Метод зважених найменших квадратів. Випадок парної регресії На практиці, значення дисперсії залишків, як правило, не відомі. Для застосування методу ВНК необхідно зробити реалістичні припущення про ці значеннях. Наприклад: Дисперсії пропорційні X i. Дисперсії пропорційні X i 2:

43 Кінець лекції