Тема 8.1. Виды корреляционного анализа
Корреляционным называется исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя и более) переменными. В психологии в качестве переменных могут выступать психические свойства, процессы, состояния и др.
«Корреляция» в прямом переводе означает «соотношение». Если изменение одной переменной сопровождается изменением другой, то можно говорить о корреляции этих переменных. Наличие корреляции двух переменных ничего не говорит о причинно-следственных зависимостях между ними, но дает возможность выдвинуть такую гипотезу. Отсутствие же корреляции позволяет отвергнуть гипотезу о причинно-следственной связи переменных. Различают несколько интерпретаций наличия корреляционной связи между двумя измерениями:
1.Прямая корреляционная связь. Уровень одной переменной непосредственно соответствует уровню другой. Примером является закон Хика: скорость переработки информации пропорциональна логарифму от числа альтернатив, или другой пример: корреляция высокой личностной пластичности и склонности к смене социальных установок.
2.Корреляция, обусловленная 3-й переменной. Две переменные а и с связаны одна с другой через 3-ю (в), не измеренную в ходе исследования. По правилу транзитивности, если есть R (a, b) и R (b, с), то R (а, с). Примером подобной корреляции является установленный психологами США факт связи уровня интеллекта с уровнем доходов. Если бы такое исследование проводилось в сегодняшней России, то результаты были бы иными. Очевидно, все дело в структуре общества. Скорость опознания изображения при быстром (тахистоскопическом) предъявлении и словарный запас испытуемых также положительно коррелируют. Скрытой переменной, обусловливающей эту корреляцию, является общий интеллект.
3. Случайная корреляция, не обусловленная никакой переменной.
4.Корреляция, обусловленная неоднородностью выборки. Представим себе, что выборка, которую мы будем обследовать, состоит из двух однородных групп. Например, мы хотим выяснить, связана ли принадлежность к определенному полу с уровнем экстраверсии. Считаем, что «измерение» пола трудностей не вызывает, экстраверсию же измеряем с помощью опросника Айзенка ETI-1. У нас 2 группы: мужчины-математики и женщины-журналистки. Неудивительно, если мы получим линейную зависимость между полом и уровнем экстраверсии—интроверсии: большинство мужчин будут интровертами, большинство женщин — экстравертами.
Корреляционные связи различаются по своему виду. Если повышение уровня одной переменной сопровождается повышением уровня другой, то речь идет о положительной корреляции. Чем выше личностная тревожность, тем больше риск заболеть язвой желудка. Возрастание громкости звука сопровождается ощущением повышения его тона. Если рост уровня одной переменной сопровождается снижением уровня другой, то мы имеем дело с отрицательной корреляцией. По данным Зайонца, число детей в семье отрицательно коррелирует с уровнем их интеллекта. Чем боязливей особь, тем меньше у нее шансов занять доминирующее положение в группе.
Рис. 22 Графическое отображение уровней и видов корреляции
На рисунке даны примеры распределения испытуемых в пространстве двух признаков на рисунке а) строгая положительная корреляция, б) сильная положительная корреляция, в) слабая положительная корреляция, г) нулевая корреляция, д) отрицательная корреляция, е) строгая отрицательная корреляция, ж) нелинейная корреляция, з) нелинейная корреляция
Тема 8.2. Разновидности методов
Коэффициенты корреляции Спирмена
Метод ранговой корреляции Спирмена позволяет определить тесноту (силу), а также направление корреляционной связи между двумя признаками.
Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы. Такими рядами значений могут быть:
1) два признака, измеренные в одной и той же группе испытуемых;
2) две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков (например, личностные профили по 16-факторному опроснику Р. Б. Кеттелла, иерархии ценностей по методике Р. Рокича, последовательности предпочтений в выборе из нескольких альтернатив и др.);
3) две групповые иерархии признаков;
4) индивидуальная и групповая иерархии признаков.
Вначале показатели ранжируются отдельно по каждому из признаков. Как правило, меньшему значению признака начисляется меньший ранг.
Во всех четырех случаях значимость полученного коэффициента корреляции определяется по количеству ранжированных значений N. В первом случае это количество будет совпадать с объемом выборки п. Во втором случае количеством наблюдений будет количество признаков, составляющих иерархию. В третьем и четвертом случае N - это также количество сопоставляемых признаков, а не количество испытуемых в группах.
Если абсолютная величина rs достигает критического значения или превышает его, корреляция достоверна.
Гипотезы
Возможны два варианта гипотез. Первый относится к случаю 1, второй - к трем остальным случаям.
Первый вариант гипотез
H0: Корреляция между переменными А и Б не отличается от нуля.
H1: Корреляция между переменными А и Б достоверно отличается от нуля.
Второй вариант гипотез
H0: Корреляция между иерархиями А и Б не отличается от нуля.
H1: Корреляция между иерархиями А и Б достоверно отличается от нуля.
Графическое представление метода ранговой корреляции
Чаще всего корреляционную связь представляют графически в виде облака точек или в виде линий, отражающих общую тенденцию размещения точек в пространстве двух осей: оси признака А и признака Б ( Рис. 23).
Попробуем изобразить ранговую корреляцию в виде двух рядов ранжированных значений, которые попарно соединены линиями (Рис. 23). Если ранги по признаку А и по признаку Б совпадают, то между ними оказывается горизонтальная линия, если ранги не совпадают, то линия становится наклонной. Чем больше несовпадение рангов, тем более наклонной становится линия. Слева на Рис. 23 отображена максимально высокая положительная корреляция (rв=+1,0) - практически это "лестница". В центре отображена нулевая корреляция - плетенка с неправильными переплетениями. Все ранги здесь перепутаны. Справа отображена максимально высокая отрицательная корреляция (rs=-1,0) -паутина с правильным переплетением линий.
Рис. 23 Графическое представление ранговой корреляции:
а) высокая положительная корреляция;
б) нулевая корреляция;
в) высокая отрицательная корреляция
Ограничения коэффициента ранговой корреляции
1. По каждой переменной должно быть представлено не менее 5 наблюдений. Верхняя граница выборки определяется имеющимися таблицами критических значений - N≤40.
2. Коэффициент ранговой корреляции Спирмена rs при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений. В случае, если это условие не соблюдается, необходимо вносить поправку на одинаковые ранги.
Пример
В исследовании, моделирующем деятельность авиадиспетчера группа испытуемых, студентов физического факультета ЛГУ проходила подготовку перед началом работы на тренажере. Испытуемые должны были решать задачи по выбору оптимального типа взлетно-посадочной полосы для заданного типа самолета. Связано ли количество ошибок, допущенных испытуемыми в тренировочной сессии, с показателями вербального и невербального интеллекта, измеренными по методике Д. Векслера?
Таблица 11
Показатели количества ошибок в тренировочной сессии и показатели уровня вербального и невербального интеллекта у студентов-физиков (N=10)
Испытуемый
|
Количество ошибок
|
Показатель вербального интеллекта
|
Показатель невербального интеллекта
|
1
|
Т.А.
|
29
|
131
|
106
|
2
|
П.А.
|
54
|
132
|
90
|
3
|
Ч.И.
|
13
|
121
|
95
|
4
|
Ц.А.
|
8
|
127
|
116
|
5
|
См.А.
|
14
|
136
|
127
|
6
|
К.Е.
|
26
|
124
|
107
|
7
|
К.А.
|
9
|
134
|
104
|
8
|
Б.Л.
|
20
|
136
|
102
|
9
|
И.А.
|
2
|
132
|
111
|
10
|
Ф.В.
|
17
|
136
|
99
|
Суммы
|
192
|
1309
|
1057
|
Средние
|
19,2
|
130,9
|
105,7
|
Сначала попробуем ответить на вопрос, связаны ли между собой показатели количества ошибок и вербального интеллекта.
Сформулируем гипотезы.
H0: Корреляция между показателем количества ошибок в тренировочной сессии и уровнем вербального интеллекта не отличается от нуля.
H1: Корреляция между показателем количества ошибок в тренировочной сессии и уровнем вербального интеллекта статистически значимо отличается от нуля.
Далее нам необходимо проранжировать оба показателя, Приписывая меньшему значению меньший ранг, затем подсчитать разности между рангами, которые получил каждый испытуемый по двум переменным (признакам), и возвести эти разности в квадрат. Произведем все необходимые расчеты в таблице 12.
В Табл.12 в первой колонке слева представлены значения по показателю количества ошибок; в следующей колонке - их ранги. В третьей колонке слева представлены значения по показателю вербального интеллекта; в следующем столбце - их ранги. В пятом слева представлены разности d между рангом по переменной А (количество ошибок) и переменной Б (вербальный интеллект). В последнем столбце представлены квадраты разностей - d2.
Таблица 12
Расчет d2 для рангового коэффициента корреляции Спирмена rs при сопоставлении показателей количества ошибок и вербального интеллекта у студентов-физиков (N=10)
Испытуемый
|
Переменная А
количество ошибок
|
Переменная Б
вербальный интеллект.
|
d (ранг А -
ранг Б)
|
d2
|
Индивидуальные
значения
|
Ранг
|
Индивидуальные
значения
|
Ранг
|
1
|
ТА.
|
29
|
9
|
131
|
4
|
5
|
25
|
2
|
ПА.
|
54
|
10
|
132
|
5.5
|
4,5
|
20.25
|
3
|
Ч.И.
|
13
|
4
|
121
|
1
|
3
|
9
|
4
|
Ц.А.
|
8
|
2
|
127
|
3
|
-1
|
1
|
5
|
См.А.
|
14
|
5
|
136
|
9
|
-4
|
16
|
6
|
К.Е.
|
26
|
8
|
124
|
2
|
6
|
36
|
7
|
К.А.
|
9
|
3
|
134
|
7
|
-4
|
16
|
8
|
Б.Л.
|
20
|
7
|
136
|
9
|
-2
|
4
|
9
|
И.А.
|
2
|
1
|
132
|
5,5
|
-4,5
|
20,25
|
10
|
Ф.В.
|
17
|
6
|
136
|
9
|
|
9
|
Суммы
|
|
55
|
|
55
|
0
|
156,5
|
Коэффициент ранговой корреляции Спирмена подсчитывается по формуле:
где d - разность между рангами по двум переменным для каждого испытуемого;
N - количество ранжируемых значений, в. данном случае количество испытуемых.
Рассчитаем эмпирическое значение rs:
Полученное эмпирическое значение гs близко к 0. И все же определим критические значения rs при N=10 по статистическим таблицам:
Ответ: H0 принимается. Корреляция между показателем количества ошибок в тренировочной сессии и уровнем вербального интеллекта не отличается от нуля.
АЛГОРИТМ
Расчет коэффициента ранговой корреляции Спирмена rs.
1. Определить, какие два признака или две иерархии признаков будут участвовать в сопоставлении как переменные А и В.
2. Проранжировать значения переменной А, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования. Занести ранги в первый столбец таблицы по порядку номеров испытуемых или признаков.
3. Проранжировать значения переменной В, в соответствии с теми же правилами. Занести ранги во второй столбец таблицы по порядку номеров испытуемых или признаков.
4. Подсчитать разности d между рангами А и В по каждой строке таблицы и занести в третий столбец таблицы.
5. Возвести каждую разность в квадрат: d2 . Эти значения занести в четвертый столбец таблицы.
6. Подсчитать сумму квадратов ∑d2.
7. При наличии одинаковых рангов рассчитать поправки.
8. Рассчитать коэффициент ранговой корреляции г5 по формуле:
а) при отсутствии одинаковых рангов
б) при наличии одинаковых рангов
где ∑d2 - сумма квадратов разностей между рангами
Та и Tb, - поправки на одинаковые ранги;
N - количество испытуемых или признаков, участвовавших в ранжировании.
9. Определить по Таблицам стандартных значений критические значения rs для данного N. Если rs превышает критическое значение или по крайней мере равен ему, корреляция достоверно отличается от 0.
Тема 8.3. Корреляционные планы исследования
План корреляционного исследования является разновидностью квазиэкспериментального плана при отсутствии воздействия независимой переменной на зависимые. В более строгом смысле: тестируемые группы должны быть в эквивалентных неизменных условиях. При корреляционном исследовании все измеряемые переменные — зависимые. Фактором, определяющим эту зависимость, может быть одна из переменных или скрытая, неизмеряемая переменная.
Корреляционное исследование разбивается на серию независимых друг от друга измерений в группе испытуемых Р. Различают простое и сравнительное корреляционные исследования. В первом случае группа испытуемых однородна. Во втором случае мы имеем несколько рандомизированных групп, различающихся по одному или нескольким определенным критериям. В общем виде план такого исследования описывается матрицей вида: Рх О (испытуемые х измерения). Результатом этого исследования является матрица корреляций. Обработку данных можно вести, сравнивая строки исходной матрицы или столбцы. Коррелируя между собой строки, мы сопоставляем друг с другом испытуемых; корреляции же интерпретируются как коэффициенты сходства—различия людей между собой. Разумеется, Р-корреляции можно вычислять лишь в том случае, если данные приведены к одной шкальной размерности, в частности с помощью Z-преобразования:
Коррелируя между собой столбцы, мы проверяем гипотезу о статистической связи измеряемых переменных. В этом случае их размерность не имеет никакого значения. Такое исследование называется структурным, так как в итоге мы получаем матрицу корреляций измеренных переменных, которая выявляет структуру связей между ними.
В исследовательской практике часто возникает задача выявить временные кореляции параметров или же обнаружить изменение структуры корреляций параметров во времени. Примером таких исследований являются лонгитюды.
План лонгитюдного исследования представляет собой серию отдельных замеров одной или нескольких переменных через определенные промежутки времени. Лонгитюдное исследование — это промежуточный вариант между квазиэкспериментом и корреляционным исследованием, так как время интерпретируется исследователем как независимая переменная, определяющая уровень зависимых (например, личностных черт).
Полный план корреляционного исследования представляет собой параллелепипед Рх ОхР, грани которого обозначаются как «испытуемые» «операции» «временные этапы».
Результаты исследования можно анализировать по-разному. Помимо вычисления Р- и О-корреляций возникает возможность сравнения матриц РхО, полученных в разные периоды времени, путем подсчета двухмерной корреляции — связи двух переменных с третьей. То же самое касается и матриц РхТxТхО.
Но чаще исследователи ограничиваются обработкой другого типа, проверяя гипотезы об изменении переменных во времени, анализируя матрицы РхТ по отдельным измерениям.
Перечислим основные типы корреляционного исследования.
1.Сравнение двух групп.
2.Одномерное исследование одной группы в разных условиях.
3.Корреляционное исследование попарно эквивалентных групп.
4.Для проверки гипотезы о статистической связи нескольких переменных, характеризующих поведение, проводится многомерное корреляционное исследование.
5.Структурное корреляционное исследование.
6.Лонгитюдное корреляционное исследование.
Данные структурного корреляционного исследования представляют собой одну или несколько матриц «испытуемые» х «тесты». Первичная обработка заключается в подсчете коэффициентов статистической связи между двумя и более переменными. Выбор меры связи определяется шкалой, с помощью которой произведены измерения.
1.Если измерения произведены по дихотомической шкале, то для подсчета тесноты связи признаков применяется коэффициент . Дихотомическая шкала — вырожденный вариант шкалы интервалов; для нее применимы все статистические методы шкалы интервалов.
2. Данные представлены в порядковой шкале. Мерой связи, которая соответствует шкале порядка, является коэффициент Кэнделла. Он основан на подсчете несовпадений в порядке следования ранжировок X и Y. Есть ряд испытуемых: сначала мы выстраиваем этот ряд в порядке убывания массы тела, а затем — в порядке убывания роста. Для каждой пары подсчитывается число совпадений и инверсий: совпадение, если их порядок по X и Y одинаков; инверсия, если порядок различен. Разница числа «совпадений» и числа «инверсий», деленная на п∙(п — 1)/2, дает коэффициент t. Часто для обработки данных, полученных с помощью шкалы порядка, используют коэффициент ранговой корреляции Спирмена, который является модификацией коэффициента Пирсона для натурального ряда чисел (рангов). Никакого отношения к порядковой шкале он не имеет. Но его рекомендуют применять в том случае, если одно измерение произведено по шкале порядков, а другое — по шкале интервалов.
3. Данные получены по шкале интервалов, или отношений. В этом случае применяется стандартный коэффициент корреляции Пирсона или коэффициент ранговой корреляции Спирмена. В том случае, если одна переменная является дихотомической, а другая — интервальной, используется так называемый бисериальный коэффициент корреляции.
Наконец, если исследователь полагает, что связи между переменными нелинейные, он вычисляет корреляционное отношение, характеризующее величину нелинейной статистической зависимости двух переменных.
Корреляционное исследование завершается выводом о статистической значимости установленных (или неустановленных) зависимостей между переменными. Однако исследователи не ограничиваются такой констатацией. Более подробно с корреляционным анализом можно познакомиться в источниках основной литературы [1,3]
Раздел 9. Дисперсионный анализ
Поделитесь с Вашими друзьями: |