Коваріація і кореляція як заходи зв’язку

Перевірка гіпотез про зв'язки. якщо мова йде про більш ніж однієї змінної, передбачає одночасні зміни і вимірювання їх безвідносно до вказівкам спрямованості впливів (яка з змінних розглядається як впливає на іншу). Статистичної мірою зв'язку служить при цьому вибірковий коефіцієнт коваріації Sxy. Він підраховується як середнє творів відхилень кожної змінної:

Саме ковариация характеризує зв'язок двох змінних Х і Y.

Коваріація дає кількісну характеристику діаграми розсіювання. на якій змінні позначені осями, а окремі спостереження, тобто отримані емпіричні дані, - точками в прямокутній системі координат. Безліч точок утворює «хмара», за формою якого судять про зв'язок змінних Х і Y.

Якщо зв'язок позитивна, то більш високих значень однієї змінної (X) частіше відповідають і більш високі значення іншої змінної (Y). Цей випадок представлений на рис. 12.1. Чим більше за величиною коефіцієнт кореляції, тим більше витягнутим виглядає на діаграмі розсіювання це «хмара» даних.

Зауважимо, що ковариация змінної з самою собою - це дисперсія.

Коваріація і кореляція як заходи зв'язку

Ріс.12.1. Діаграма розсіювання.

Під час обговорення трьох основних умов причинного виведення стосовно експериментальними даними мова йде також про ковариации незалежної і залежної змінних. Однак тут мається на увазі невипадковість характеру зв'язку між змінами цих змінних, а не необхідність підрахунку коефіцієнтів коваріації або кореляції. Для кількісної оцінки експериментально отриманих ефектів зазвичай використовуються заходи відмінностей. а не заходи зв'язків. У кореляційному за способом збору даних дослідженні перевага віддається коефіцієнту кореляції як більш зручного способу кількісної оцінки величини зв'язку.

Кореляція є відношення отриманого ковариации до максимально можливої:

де r - відсоток від максимально можливої ​​ковариации, яка в даному емпіричному дослідженні досягнута.

Інше визначення коефіцієнта кореляції: кореляція є коваріація стандартизованих змінних. Позначення r походить від поняття регресії. Ф. Гальтон і К. Пірсон використовували його в дослідженнях регресії фізичних вимірювань від одного покоління до іншого. Це позначення закріпилося за коефіцієнтом кореляції Пірсона, заснованому на підрахунку твори моментів, в той час як інші коефіцієнти кореляції закріпили за собою інші позначення (# 966; - «фе» коефіцієнт, # 964; - «тау» Кенделл і ін.). Коефіцієнт регресії також має різні позначення, в тому числі і r.

На відміну від коефіцієнтів коваріації і кореляції, які спрямовані на встановлення міри зв'язку між змінними, коефіцієнт рефессіі використовується для мети передбачення однієї змінної за даними іншого. При цьому стає важливим визначитися, значення якої з змінних - Х або Y - служить для передбачення значень інший. Це відбивається у вказівці послідовності х і у в індексі коефіцієнта регресії. Відповідно коефіцієнти регресії з різним порядком проходження змінних в індексації матимуть різні величини, в той час як для коефіцієнтів коваріації і кореляції вказівку послідовності змінних в індексі не має значення, так як це буде одна і та ж величина зв'язку.