Кореляційно-регресійний аналіз: області застосування, основні етапи

Поняття кореляційно-регресійного аналізу передбачає проведення ряду операцій, а саме: визначення тісноти зв`язку, її напрямки та встановлення рівняння, що описує форму зв`язку. Цей вид аналізу містить дві окремі складові: кореляційний і регресійний аналіз.

Значення і основні етапи процесу кореляційно-регресійного аналізу економічних явищ

Кореляційно-регресійний аналіз - це один із способів вирішення завдань і пошуку інформації. Він дозволяє визначити спільне вплив безлічі взаємопов`язаних і одноразово діючих ознак, а також окремий вплив кожної ознаки на економічне явище (процес). Завдяки цьому типу аналізу можна оцінити ступінь взаємозв`язку між кількома ознаками, між ознаками і отриманим результатом, а також змоделювати рівняння регресії, що описують форму взаємозв`язку.кореляційно регресійний аналіз

етапи аналізу

Кореляційно-регресійний аналіз економічних процесів розділяється на кілька етапів:

  1. Визначення аргументів і попередня обробка умовної інформації.
  2. Визначення тісноти і форми взаємозв`язку між кількома ознаками.
  3. Моделювання представленого економічного процесу і аналіз отриманої моделі.
  4. Застосування кінцевих результатів для удосконалення планування і менеджменту моделі.

Статистичну однорідність інформації можна визначити за допомогою двох прийомів. Для початку необхідно визначити і відкинути значення факторів, що різко відрізняються від всіх величин. Потім здійснюється статистичне дослідження однорідності за допомогою перевірки незалежності вибірки і її приналежності до єдиної сукупності з нормальним розподілом.кореляційно регресійний аналіз приклад

Модель регресії визначається через метод найменших квадратів, завдяки якому забезпечується найкраще наближення оцінки результату, визначеного через рівняння регресії, до його факторів.

Кореляційно-регресійний аналіз: параметри створеної моделі

Найголовнішими факторами, що визначають характеристики моделі, прийнято вважати:

  • Коефіцієнти парної кореляції (демонструють силу взаємозв`язку двох факторів).
  • Коефіцієнт множинної кореляції (визначає взаємозв`язок результату і факторів).
  • Коефіцієнти приватної детермінації (показують вплив варіації аргументу на варіацію шуканого ознаки).
  • Коефіцієнт множинної детермінації (показує питому вагу всіх аргументів на варіацію шуканого ознаки).
  • Приватні коефіцієнти еластичності (Характеризують вплив факторів на результат, виражене в єдиному масштабі в процентах).

метод кореляційно регресійного аналізу

мета аналізу

Основні завдання кореляційно-регресійного аналізу - це виявлення чинників, що впливає на економічний результат явища або процесу, та використання добутої інформації для удосконалення планування економічного процесу або явища.

Параметричні методи аналізу

Всі виробничі процеси перебувають у тісному взаємозв`язку. Цей взаємозв`язок буває стохастичною (результат залежить від безлічі факторів) і функціональної (результат зміниться на таку ж величину, як і фактор). Стохастична залежність найчастіше має кореляційний характер, тобто значенню фактора одночасно відповідає кілька значень результату, мають абсолютно різні напрямки.

завдання кореляційно регресійного аналізу

кореляційний решітка

Кореляційний взаємозв`язок може мати один або кілька факторів-ознак, володіти позитивною або негативною спрямованістю, бути прямолінійною або криволінійною (в залежності від вираження). Визначити, до якого саме типу відноситься зв`язок, можна за допомогою кореляційної решітки. Її будують в межах прямокутних осей координат.

Частоти, розміщені близько до діагоналям, свідчать про високу взаємозв`язку ознак. Частоти, розміщені близько до діагоналі, що проходить через лівий нижній і правий верхній кути, говорять про позитивному напрямку, а проходять через верхній лівий і правий нижній кут - про протилежному напрямку. Частоти, розташовані в формі дуги, свідчать про криволінійної взаємозв`язку, а безладно розкидані - про відсутність взаємозв`язку взагалі.

Основний метод кореляційного аналізу - це лінійний коефіцієнт кореляції. Він може приймати значення від -1 до +1. Чим ближче значення до 1, тим сильніше зв`язок між фактором і результатом. Позитивні значення свідчать про прямий взаємозв`язок, а негативні - про зворотну. Коефіцієнт приймає значення "нуль" в тому випадку, якщо між ознаками відсутній взаємозв`язок.

кореляційно регресійний аналіз в статистиці

Непараметричні методи аналізу

Ряд методів дозволяє оцінити взаємозв`язок явищ без кількісного вираження ознаки і, відповідно, параметрів розподілу. Їх називають непараметричних. Серед них виділяють:

  • Коефіцієнт рангової кореляції Кендалла (визначає взаємозв`язок кількісних і якісних значень показників, у разі якщо вони підлягають ранжирування).
  • Коефіцієнт рангової кореляції Спірмена (присвоює ранги кожному аргументу і результату, на основі яких визначаються різниці і обчислюється показник).
  • Коефіцієнт кореляції знаків Фехнера (визначає кількість збігів і розбіжностей відхилень аргументів і результатів від їх середнього значення).
  • Ще один важливий метод кореляційно-регресійного аналізу - Метод найменших квадратів, що дозволяє визначити аналітичний вираз взаємозв`язку результативної ознаки і його фактора. Він полягає в побудові системи рівнянь і визначенні параметрів цих рівнянь.


поняття кореляційно регресійного аналізу

Кореляційно-регресійний аналіз: приклад

У статистиці і економіці застосовуються найрізноманітніші види і об`єкти аналізу. Статистичні методи аналізу спрямовані на вивчення повторюваних процесів, для того щоб скласти тривалі прогнози поведінки економічних явищ.

Наприклад, для того щоб проаналізувати соціально-економічний розвиток території, необхідно вивчити показники рівня життя населення. Кореляційно-регресійний аналіз в статистиці дозволяє створити рівняння регресії і визначити коефіцієнти кореляції, що демонструють взаємозв`язок між рівнем життя і розвитком території. Рівень життя визначається доходами, а основне джерело доходів - зарплата. В такому випадку фактором виступає рівень зарплати, а результатом - чисельність населення з невисокими доходами.

Програмне забезпечення аналізу

Для полегшення розрахунків можна проводити кореляційний аналіз в Excel. У даній програмі існує ряд інструментів, що допомагають полегшити розрахунки. Серед них функція «Кореляція», що дозволяє сформувати матрицю з коефіцієнтів і різних параметрів. Вона зображується у формі таблиці. Як стовпців і рядків використовуються кореляційні коефіцієнти. На основі отриманих даних таблиці необхідно буде провести кореляційний аналіз. Приклад послідовності проведення аналізу:

  1. У команді «Сервіс» вибрати пункт «Аналіз даних».
  2. Як інструмент аналізу вибрати пункт «Кореляція».
  3. У вікні в рядку «Вхідний інтервал» вказати діапазон аналізованих даних, вибрати пункт «Угруповання» в рядку «Параметри виводу», ввести діапазон виведення результатів і натиснути «ОК».

В результаті вийде кореляційна матриця, розташована в діапазоні виведення. Всередині буде вказано коефіцієнт лінійної кореляції, що оцінює тісноту і форму зв`язку між показниками.

метод кореляційного аналізу

Проведення аналізу в Excel

В MS Excel використовується функція «Кореляція» для того, щоб провести кореляційно-регресійний аналіз. Приклад розрахунку коефіцієнтів розглянемо далі. Ця функція формує матрицю з коефіцієнтами тісноти взаємозв`язку між різними параметрами. В результаті формується квадратна таблиця, яка містить коефіцієнти кореляції на перетині рядків і стовпців.

Для проведення аналізу необхідно буде виконати ряд певних дій:

  1. Відкрити команду «Сервіс», а в ній пункт «Аналіз даних».
  2. У вікні вказати в переліку «Інструменти аналізу» пункт «Кореляція».
  3. У вікні, що розкрилося «Кореляція» вказати вхідний інтервал у вигляді діапазону комірок, що містять аналізовану інформацію (він повинен бути не менше двох стовпців), поставити галочку в пункті «Угруповання», а в полі «Параметри виводу» вибрати верхнє ліве вічко, де буде починатися кореляційна матриця.
  4. Натиснути на кнопку ОК.


В результаті обчислень з`явиться квадратна таблиця з коефіцієнтами кореляції.

Регресійний аналіз в MS Excel

Для того щоб обчислити рівняння лінійної регресії, що описують взаємозв`язок між факторами і результатом, в MS Excel застосовується статистична функція «лінійні». Для того щоб її використовувати, необхідно:

  1. Виділити порожню область, в яку будуть виведені результати аналізу.
  2. Відкрити «Майстер функцій», в ньому знайти категорію «Статистичні», а в ній функцію «лінійні» і натиснути ОК.
  3. В поле «Відомі значення у» ввести діапазон аналізованих результатів, в полі «Відомі значення х» - діапазон аналізованих факторів.
  4. В поле «Константа» вказується присутність вільного члена рівняння (1 - так, 0 - ні), а в полі «Статистика» - необхідність виведення додаткових відомостей (1 - з`явиться додаткова інформація, 0 - з`являться тільки оцінки параметрів). За замовчуванням можна вказувати в обох полях 1.
  5. Натиснути кнопку ОК.

Вгорі раніше виділеної області з`явиться початковий елемент таблиці. Для того щоб розкрити всі дані, необхідно натиснути F2, а потім одночасно комбінацію клавіш Ctrl + Shift + Enter.

В результаті регрессионная інформація буде зображуватися як таблиці з двох стовпців і п`яти рядків:

стовпець 1

стовпець 2

рядок 1

коефіцієнт b

коефіцієнт a

рядок 2

Середньоквадратичне відхилення b

Середньоквадратичне відхилення a

рядок 3

коефіцієнт детермінації

Середньоквадратичне відхилення y

рядок 4

F-статистика

Число ступенів свободи

рядок 5

Регресійна сума квадратів

Залишкова сума квадратів

Отримані результати необхідно підставити в лінійне рівняння регресії, яке виглядає наступним чином: y = a + bx. В якості коефіцієнта a підставляється значення з комірки на перетині рядка 1 і стовпці 2. В якості коефіцієнта b - значення на перетин рядка 1 і стовпці 1.

Коефіцієнт детермінації говорить про те, яка частина результату пояснюється за допомогою досліджуваного фактора. Частина, що залишилася результатів визначається факторами, неврахованими в лінійної моделі.



Увага, тільки СЬОГОДНІ!

Увага, тільки СЬОГОДНІ!