Кластерний аналіз: його метод і сфера застосування

Багато хто з нас чули словосполучення «кластерний аналіз», але ось що воно означає, представляють далеко не всі. До того ж звучить воно більш ніж загадково! Насправді це всього лише назва методу розбивки вибірки даних на категорії елементів за певними критеріями. Наприклад, кластерний аналіз дозволяє розділити людей на групи з високим, середнім і низькою самооцінкою. Простіше кажучи, кластер - це тип об`єктів, схожих за певною ознакою.

Кластерний аналіз: проблеми у використанні

кластерний аналізВирішивши застосувати в своєму дослідженні даний метод, потрібно пам`ятати, що виділені в його ході кластери можуть бути нестійкими. Тому, як і в випадку з факторний аналіз, потрібно перевірити результати на іншій групі об`єктів або через певний проміжок часу обчислити похибка вимірювання. Більш того, найкраще використовувати кластерний аналіз на великих вибірках, підібраних методом рандомізації або стратифікації, адже тільки так можна зробити науковий висновок, застосовуючи індукцію. Найкраще він показав себе в перевірці гіпотез, а не в їх створенні на порожньому місці.



Ієрархічний кластерний аналіз

ієрархічний кластерний аналізЯкщо вам потрібно класифікувати випадкові елементи швидко, то почати можна з розгляду кожного з них на початковому етапі як окремого кластера. В цьому і полягає суть одного з найпростіших для розуміння видів кластерного аналізу. Використовуючи його, дослідник на другому етапі утворює пари елементів, які є схожими по потрібному ознакою, а потім з`єднує їх між собою необхідну кількість разів. Кластери, що знаходяться на мінімальній відстані між собою, визначаються за допомогою інтегративної процедури. Повторюється вона до тих пір, поки не буде досягнуто відповідність одному з наступних критеріїв:

  • отримання заздалегідь запланованої кількості кластерів;
  • кожен з кластерів містить необхідну кількість елементів;
  • кожна група має потрібний співвідношенням різнорідності і однорідності всередині неї.


Для того щоб правильно обчислити відстань між кластерами, найчастіше використовують такі прийоми:

  • одиночної і повної зв`язку;
  • середньої взаємозв`язку Кінга;
  • центроїдного метод;
  • прийом групових середніх.

Для оцінки результатів кластеризації застосовують такі критерії:

  • індекс чіткості;
  • коефіцієнт розбиття;
  • звичайна, нормалізована і модифікована ентропія;
  • другий і третій функціонал Рубенса.

Методи кластерного аналізу

методи кластерного аналізуНайчастіше при аналізі вибірки об`єктів застосовують метод мінімальної відстані. Він полягає в тому, що в кластер об`єднують елементи з коефіцієнтом подібності, який більше порогового значення. При використанні методу локального відстані виділяються два кластери: відстань між точками першого з них максимальне, а другого - мінімальне. Центроїдного спосіб кластеризації передбачає обчислення відстаней між середніми значеннями показників в групах. А метод Ворда раціональніше всього застосовувати для групування близьких по досліджуваного параметру кластерів.



Увага, тільки СЬОГОДНІ!

Увага, тільки СЬОГОДНІ!