Причому, як не раз ми вже відзначали коефіцієнти b0 і b1 в цьому рівнянні невідомі

Причому, як не раз ми вже відзначали коефіцієнти b0 і b1 в цьому рівнянні невідомі. Використовуючи МНК, ми можемо знайти оцінки цих коефіцієнтів в0 і в1 і записати наступний вираз для у:

На наведеному малюнку (Рис.4) зображені фактичні значення змінної у, графік гіпотетичної функції регресії (яка, взагалі кажучи, нам невідома!) І графік емпіричної функції регресії, коефіцієнти якої знайдені з умови мінімуму суми квадратів помилок.

Рис.4. Графіки гіпотетичної і емпіричної функцій регресії.

Виходячи з логіки наших дій, виникають два питання:

# 9679; Чи можна з тією чи іншою ймовірністю знайти підтвердження, що вид функціональної залежності (мова поки йде тільки про лінійної функції) обраний коректно.

# 9679; Наскільки добре, зі статистичної точки зору, оцінки невідомих параметрів, отримані по МНК, наближають невідомі коефіцієнти.

Для відповідей на поставлені питання нам знадобиться, зокрема, поняття коефіцієнта детермінації. Перед тим як ввести це поняття розглянемо наступну суму:

Покажемо, що її можна представити у вигляді:

Через позначена функція регресії, отримана по МНК:.

Покажемо, що останній доданок в (1) дорівнює нулю, для цього запишемо його у вигляді:

В силу рівності (2), можна стверджувати, що воно дорівнює 0. Перетворимо тепер перший доданок:

Обидва доданків дорівнюють нулю в силу рівності (2) і (3).

Таким чином, ми показали, що має місце, наступне подання для даної суми:

Величину еi рівну:

будемо називати залишком. Отже, перший доданок в правій частині (2) є сума квадратів залишків:

Її називають залишковою сумою квадратів і позначають RSS (residualsumofsquares).

Друга сума це сума квадратів відхилень точок, розташованих на регресійній Прямій прямий у =. Цю суму називають сумою квадратів відхилень, пояснене регресією ЕSS (explainedsumofsquares).

У лівій частині рівності (2) знаходиться сума квадратів відхилень фактичних значень змінної у від прямої у =. Таку суму називають повною сумою квадратів і позначають TSS (totalsumofsquares).

Таким чином, повна сума квадратів TSS розбилася на дві складові:

# 9679; ESS- суму квадратів, обумовлених впливом основного чинника х;

# 9679; RSS - суму квадратів, обумовлених впливом інших, в тому числі і випадкових факторів.

Зауваження 1. Слід мати на увазі, що в літературі з економетрики, зокрема в [9], цю ж систему позначень використовують з точністю до навпаки, даючи їй інше пояснення. Суму, яка вище позначена як ЕSS позначають черезRSS і розшифровують так: regressionsumofsquares. І навпаки, суму, позначену нами як RSS називають ЕSS. errorsumofsquares. Ми будемо дотримуватися введеної вище термінології. ▲

Зауваження 2 .Розглянемо два окремих випадки. Припустимо, що x не робить ніякого впливу на y, тоді вибіркове умовне середнє збігається з вибірковим середнім, в такій ситуації ЕSS = 0 і

У тому випадку, коли на залежну змінну у не впливає ніякі інші фактори, крім х, сума RSS дорівнюватиме нулю і буде виконуватися рівність:

У загальному ж випадку, якщо оцінки параметрів функції регресії знайдені по МНК, завжди буде мати місце рівність (3). ▲

Визначення 1.Парнимкоеффіціентом детермінації (вибірковим) називають відношення:

Кажуть, що «коефіцієнт детермінації показує, яка частка дисперсії величини y визначається (детермінується) мінливістю (дисперсією) відповідної функції регресії y від x» [1].

Пояснимо сказане. Для цього повернемося до рівності (2) і розділимо обидві частини рівності на n, отримаємо: