Основні оцінки точності прогнозування часових рядів, математичне бюро

Оцінка помилки прогнозування часового ряду

Працюючи з науковими публікаціями, стикаюся з різними показниками помилок прогнозування часових рядів. Серед всіх можна зустріти оцінок помилки прогнозування варто відзначити дві, які в даний час, є найпопулярнішими: MAE і MAPE. Нехай помилка є різниця:
,
де Z (t) - фактичне значення часового ряду, а - прогнозне.
Тоді формули для оцінок помилки прогнозування часових рядів для N звітів можна записати в наступному вигляді.

MAPE - середня абсолютна помилка у відсотках

Якщо ж фактичні значення часового ряду близькі до 0, то в знаменнику виявиться дуже маленьке число, що зробить значення MAPE близьким до нескінченності - це не зовсім коректно. Наприклад, фактична ціна РСВ = 0.01 руб / МВт.год, a прогнозна = 10 руб / МВт.год, тоді MAPE = (0.01 - 10) /0.01 = 999%, хоча в дійсності ми не так вже сильно помилилися, всього на 10 руб / МВт.год. Для рядів, що містять значення близькі до нуля, застосовують наступну оцінку помилки прогнозу.

MAE - середня абсолютна помилка

Для оцінки помилки прогнозування цін РСВ і індикатора БР коректніше використовувати MAE.

8500). Для даного прогнозу значення MAPE = 1.5% ». При цьому, переглядаючи статті, можна скласти загальне враження про помилки прогнозування енергоспоживання, для якого MAPE зазвичай коливається від 1 до 5%; або помилки прогнозування цін на електроенергію, для якого MAPE коливається від 5 до 15% залежно від періоду і ринку. Отримавши значення MAPE для власного прогнозу, ви можете оцінити, наскільки здорово у вас виходить прогнозувати.

MSE - середньоквадратична помилка

RMSE - квадратний корінь з середньоквадратичної помилки

ME - середня помилка

SD - стандартне відхилення

, де ME - є середня помилка, визначена за формулою вище.

Зв'язок точності і помилки прогнозування

Точність прогнозування є поняття прямо протилежне помилку прогнозування. Якщо помилка прогнозування велика, то точність мала і навпаки, якщо помилка прогнозування мала, то точність велика. По суті справи оцінка помилки прогнозу MAPE є зворотна величина для точності прогнозування - залежність тут проста.

Точність прогнозу в% = 100% - MAPE

При цьому величина MAPE є кількісною оцінкою саме помилки. і ця величина нам ясно говорить і про точність прогнозування, виходячи з наведеної вище простої формули. Таким чином, оцінюючи помилку, ми завжди оцінюємо точність прогнозування.

Ось як! Цікава у вас історія вийшла!

Тут, звичайно, стандартними показниками бракує часу. Якщо ряд у вас стаціонарний (тобто середня величина не суттєво змінюється), то порахуйте середнє фактичне значення за деякий попередній період. І порахуйте середнє прогнозне значення. І порівняйте їх (тут і% можна отримати). Звичайно, коректної назвати цю оцінку не можна, але це хоч якісь прикидки.

А як же так у вас вийшло, що прогноз є, а факту ніякого немає. Як у вас модель прогнозування працює?

Я мав на увазі що прогнозування йде в розрізі номіналів і типів клієнтів і виходить багато різних прогнозів, але використовуються різні алгоритми. Потрібно оцінити кожен алгоритм. Виходить потрібно порахувати коефіцієнт для кожного розрізу або оцінювати один загальний прогноз? Чи не вийде так що я складу тепле з м'яким? А якщо коефіцієнт вважати для кожного розрізу, то як потім порахувати загальну точність прогнозу?

Основні оцінки точності прогнозування часових рядів, математичне бюро

Щоб отримати відповідь, питання стоїть спростити. Є 2 клієнта і 3 номіналу. Тоді ви робите 6 прогнозів алгоритмом А, 6 прогнозів алгоритмом B.

Виходить, що для кожного клієнта і кожного номіналу є прогноз А і прогноз Б, і є факт.

Тоді ви можете оцінювати як зручно: MAPE прогнозу А, MAPE прогнозу Б, MAPE обох прогнозів, MAPE по номіналах і по клієнтах. І всю цю купу проаналізувати. Загальна точність залежить від того, чого ви хочете Обощая (чого ви маєте на увазі під загальним). У вас завдання-то проста, що не ускладнюйте там, де просто достатньо все зробити послідовно.