Тема 7.3. Непараметрические критерии
Q - критерий Розенбаума
Критерий используется для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых. Он позволяет быстро оценить различия между двумя выборками по какому-либо признаку. Однако если критерий Q не выявляет достоверных различий, это еще не означает, что их действительно нет.
В этом случае стоит применить критерий φ* Фишера. Если же Q-критерий выявляет достоверные различия между выборками с уровнем значимости р<0,01, можно ограничиться только им и избежать трудностей применения других критериев.
Критерий применяется в тех случаях, когда данные представлены по крайней мере в порядковой шкале. Признак должен варьировать в каком-то диапазоне значений, иначе сопоставления с помощью Q -критерия просто невозможны. Например, если у нас только 3 значения признака, 1, 2 и 3, - нам очень трудно будет установить различия. Метод Розенбаума требует, следовательно, достаточно тонко измеренных признаков.
Применение критерия начинаем с того, что упорядочиваем значения признака в обеих выборках по нарастанию (или убыванию) признака. Лучше всего, если данные каждого испытуемого представлены на отдельной карточке. Тогда ничего не стоит упорядочить два ряда значений по интересующему нас признаку, раскладывая карточки на столе. Так мы сразу увидим, совпадают ли диапазоны значений, и если нет, то насколько один ряд значений "выше" (S1), а второй - "ниже" (S2). Для того, чтобы не запутаться, в этом и во многих других критериях рекомендуется первым рядом (выборкой, группой) считать тот ряд, где значения выше, а вторым рядом - тот, где значения ниже.
Гипотезы
H0: Уровень признака в выборке 1 не превышает уровня признака в выборке 2.
H1: Уровень признака в выборке 1 превышает уровень признака в выборке 2.
Графическое представление критерия Q
На Рис.11 представлены три варианта соотношения рядов значений в двух выборках. В варианте (а) все значения первого ряда выше всех значений второго ряда. Различия, безусловно, достоверны, при соблюдении условия, что n1, n2≥11.
В варианте (б), напротив, оба ряда находятся на одном и том же уровне: различия недостоверны. В варианте (в) ряды частично перекрещиваются, но все же первый ряд оказывается гораздо выше второго. Достаточно ли велики зоны S1 и S2, в сумме составляющие Q, можно определить по Таблице стандартных значений критерия. Чем величина Q больше, тем более достоверные различия мы сможем констатировать.
Рис. 11 Возможные соотношения рядов в двух выборкаx: S1 - зона значений 1-го ряда, которые выше максимального значения 2-го ряда; S2 - зона значений 2-го ряда, которые меньше минимального значения 1-го ряда; штриховой отмечены перекрещивающиеся зоны двух рядов
Ограничения критерия Q
1. В каждой из сопоставляемых выборок должно быть не менее 11 наблюдений. При этом объемы выборок должны примерно совпадать. Е.В. Гублером указываются следующие правила:
а) если в обеих выборках меньше 50 наблюдений, то абсолютная величина разности между n1 и n2 не должна быть больше 10 наблюдений;
б) если в каждой из выборок больше 51 наблюдения, но меньше 100, то абсолютная величина разности между щ и Л2 не должна быть больше 20 наблюдений;
в) если в каждой из выборок больше 100 наблюдений, то допускается, чтобы одна из выборок была больше другой не более чем в 1,5-2 раза.
2. Диапазоны разброса значений в двух выборках должны не совпадать между собой, в противном случае применение критерия бессмысленно. Между тем, возможны случаи, когда диапазоны разброса значений совпадают, но, вследствие разносторонней асимметрии двух распределений, различия в средних величинах признаков существенны (Рис. 12, 13).
Рис. 12 Вариант соотношения распределений признака в двух выборках, при котором критерий Q беспомощен
Рис.13 Вариант соотношения распределений признака в двух выборках, при котором критерий Q может быть применим
Рассмотрим пример
У предполагаемых участников психологического эксперимента, моделирующего деятельность воздушного диспетчера, был измерен уровень вербального и невербального интеллекта с помощью методики Д. Векслера. Было обследовано 26 юношей в возрасте от 18 до 24 лет (средний возраст 20,5 лет). 14 из них были студентами физического факультета, а 12 - студентами психологического факультета Ленинградского университета (Сидоренко Е.В.) показатели вербального интеллекта представлены в Табл. 6
Можно ли утверждать, что одна из групп превосходит другую по уровню вербального интеллекта?
Таблица 6
Индивидуальные значения вербального интеллекта в выборках студентов физического (n1=14) и психологического (n2=12) факультетов
№
|
Студенты-физики
|
№
|
Студенты - психологи
|
Код имени
испытуемого
|
Показатель вербального
интеллекта
|
Код имени
испытуемого
|
Показатель вербального
интеллекта
|
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
|
И.А
К.А.
К.Е.
П.А.
С.А.
СТ.А.
Т.А.
Ф.А.
Ч.И.
Ц.А.
СМ.А.
К.АН.
Б.Л.
Ф.В.
|
132
134
124
132
135
132
131
132
121
127
136
129
136
136
|
1.
2.
3.
4.
5.
6.
7.
8.
9.
10
11
12
|
Н.Т.
О.В.
Е.В.
Ф.О.
И.Н.
И.Ч.
И.В.
К.О.
P.P.
Р.И.
O.K.
Н.К.
|
126
127
132
120
119
126
120
123
120
116
123
115
|
Упорядочим значения в обеих выборках, а затем сформулируем гипотезы:
H0: Студенты-физики не превосходят студентов-психологов по уровню вербального интеллекта.
H1: Студенты-физики превосходят студентов-психологов по уровню вербального интеллекта.
Таблица 7
Упорядоченные по убыванию вербального интеллекта ряды индивидуальных значений в двух студенческих выборках
Как видно из Табл. 7, мы правильно обозначили ряды: первый, тот, что "выше" - ряд физиков, а второй, тот, что "ниже" - ряд психологов.
По Табл. 7 определяем количество значений первого ряда, которые больше максимального значения второго ряда: S1=5.
Теперь определяем количество значений второго ряда, которые меньше минимального значения первого ряда: S2=6.
Вычисляем Qэмп по формуле:
Qэмп = S1+S2=5+6=11
По статистическим таблицам определяем критические значения Q для n1=14, n2=12:
Ясно, что чем больше расхождения между выборками, тем больше величина Q. Но отклоняется при Qэмп>Qкp, а при Qэмп <Qкp мы будем вынуждены принять Но.
Построим "ось значимости".
Рис. 14 Ось значимости
По рис. 14 Qэмп>Qкp, р=0,01.
H0 отклоняется и принимается H1. Студенты-физики превосходят студентов-психологов по уровню вербального интеллекта (р<0,01). Отметим, что в тех случаях, когда эмпирическая величина критерия оказывается на границе зоны незначимости, мы имеем право утверждать лишь, что различия достоверны при р<0,05, если же оно оказывается между двумя критическими значениями, то мы можем утверждать, что р< 0,05.
Если эмпирическое значение критерия оказывается на границе зоны значимости, р<0,01, в зоне значимости - что р<0,01
Поскольку уровень значимости выявленных различий достаточно высок (р<0,01), мы могли бы на этом остановиться. Однако если исследователь сам психолог, а не физик, вряд ли он на этом остановится. Он может попробовать сопоставить выборки по уровню невербального интеллекта, поскольку именно невербальный интеллект определяет уровень интеллекта в целом и степень его организованности.
АЛГОРИТМ
Подсчет критерия Q Розенбаума
1. Проверить, выполняются ли ограничения: n1,n2 ≥11,
n1 n2≈n2. Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше, а выборкой 2 - ту, где значения предположительно ниже.
3. Определить самое высокое (максимальное) значение в выборке 2.
4. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как S1.
5. Определить самое низкое (минимальное) значение в выборке 1.
6. Подсчитать количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как S2.
7. Подсчитать эмпирическое значение Q по формуле: Q=S1+S2
8. По Таблице статистических значений критерия определить критические значения Q для данных n1 и n2. Если Qэмп равно Q0,05 или превышает его, Н0 отвергается.
9. При n1,n2>26 сопоставить полученное эмпирическое значение с Qкp=8 (р≤0,05) и Qкp=10(p≤0,01). Если Qэмп превышает или по крайней мере равняется Qкp=8, H0 отвергается.
U - критерий Манна-Уитни
Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1,n2≥3 или n1=2, n2≥5, и является более мощным, чем критерий Розенбаума.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами.
Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше Uэмп, тем более вероятно, что различия достоверны.
Гипотезы:
Н0: Уровень признака в группе 2 не ниже уровня признака в группе 1.
H1: Уровень признака в группе 2 ниже уровня признака в группе 1.
Графическое представление критерия U
На Рис. 15 представлены три из множества возможных вариантов соотношения двух рядов значений.
В варианте (а) второй ряд ниже первого, и ряды почти не перекрещиваются. Область наложения слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что различия между ними достоверны. Точно определить это мы сможем с помощью критерия U.
В варианте (б) второй ряд тоже ниже первого, но и область перекрещивающихся значений у двух рядов достаточно обширна. Она может еще не достигать критической величины, когда различия придется признать несущественными. Но так ли это, можно определить только путем точного подсчета критерия U.
В варианте (в) второй ряд ниже первого, но область наложения настолько обширна, что различия между рядами скрадываются.
Рис. 15 Возможные варианты соотношений рядов значений в двух выборках; штриховкой обозначены зоны наложения
Ограничения критерия U
1. В каждой выборке должно быть не менее 3 наблюдений: n1,n2≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.
2. В каждой выборке должно быть не более 60 наблюдений; n1,n2≤60. Однако уже при n1,n2>20 ранжирование становиться достаточно трудоемким.
В случае, если n1,n2>20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбинации с критерием λ,, позволяющим выявить критическую точку, в которой накапливаются максимальные различия между двумя сопоставляемыми выборками. Формулировка звучит сложно, но сам метод достаточно прост. Каждому исследователю лучше попробовать разные пути и выбрать тот, который кажется ему более подходящим.
Пример.
Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального интеллекта. С помощью критерия Q-Розенбаума мы смогли с высоким уровнем значимости определить, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот результат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в Табл. 8.
Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?
Таблица 8
Индивидуальные значения невербального интеллекта в выборках студентов физического (n1=14) и психологического (n2=12) факультетов
Студенты-физики
|
Студенты-психологи
|
Код имени
испытуемого
|
Показатель невербального
интеллекта
|
Код
имени
испытуемого
|
Показатель невербального
интеллекта
|
1. ИА.
|
111
|
1.Н.Т.
|
113
|
2. К.А.
|
104
|
2.О.В.
|
107
|
3.К.Е.
|
107
|
3.Е.В.
|
123
|
4.П.А.
|
90
|
4.Ф.О.
|
122
|
5.С.А.
|
115
|
5.И.Н.
|
117
|
6.Ст.А.
|
107
|
6.И.Ч.
|
112
|
7.Т.А.
|
106
|
7.И.В.
|
105
|
8.Ф.А.
|
107
|
8.К.О.
|
108
|
9.Ч.И.
|
95
|
9.P.P.
|
111
|
10.ЦА.
|
116
|
10.Р.И.
|
114
|
11.См.А.
|
127
|
11.O.K.
|
102
|
12.К.Ан.
|
115
|
12.Н.К.
|
104
|
13.Б.Л.
|
102
|
|
|
14.Ф.В.
|
99
|
|
|
Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.
Правила ранжирования
1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.
Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех случаев, которые предусмотрены правилом 2.
2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны.
Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получает средний ранг:
Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:
и т.д.
3. Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле:
где N - общее количество ранжируемых наблюдений (значений). Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.
АЛГОРИТМ
Подсчет критерия U Манна-Уитни.
1. Перенести все данные испытуемых на индивидуальные карточки.
2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 - другим, например, синим.
3. Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой.
4. Проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Всего рангов получится столько, сколько у нас (n1+п2).
5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд, синие - в другой.
6. Подсчитать сумму рангов отдельно на красных карточках (выборка 1) и на синих карточках (выборка 2). Проверить, совпадает ли общая сумма рангов с расчетной.
7. Определить большую из двух ранговых сумм.
8. Определить значение U по формуле:
где n1 - количество испытуемых в выборке 1;
n2 - количество испытуемых в выборке 2;
Тх - большая из двух ранговых сумм;
nх - количество испытуемых в группе с большей суммой рангов.
9. Определить критические значения U по Таблице стандартных значений критерия. Если Uэмп.>Uкp 005, Но принимается. Если Uэмп≤Uкp_005, Но отвергается. Чем меньше значения U, тем достоверность различий выше.
Теперь проделаем всю эту работу на материале данного примера. В результате работы по 1-6 шагам алгоритма построим таблицу 9.
Таблица 9
Подсчет ранговых сумм по выборкам студентов физического и психологического факультетов
Студенты-физики (n1=14)
|
Студенты-психологи (n2=12)
|
Показатель невербального
интеллекта
|
Ранг
|
Показатель невербального
интеллекта
|
Ранг
|
127
|
26
|
|
|
|
|
123
|
25
|
|
|
122
|
24
|
|
|
117
|
23
|
116
|
22
|
|
|
115
|
20,5
|
|
|
115
|
20,5
|
|
|
|
|
114
|
19
|
|
|
113
|
18
|
|
|
112
|
17
|
111
|
15,5
|
111
|
15.5
|
|
|
108
|
14'
|
107
|
11.5
|
107
|
11,5
|
107
|
11,5
|
|
|
107
|
11,5
|
|
|
106
|
9
|
|
|
|
|
105
|
8
|
104
|
6.5
|
104
|
6,5
|
102
|
4,5
|
102
|
4,5
|
99
|
3
|
|
|
95
|
2
|
|
|
90
|
1
|
|
|
Суммы
|
1501
|
165
|
1338
|
186
|
Средние
|
107,2
|
|
111,5
|
|
Общая сумма рангов: 165+186=351. Расчетная сумма:
Равенство реальной и расчетной сумм соблюдено.
Мы видим, что по уровню невербального интеллекта более "высоким" рядом оказывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186.
Теперь мы готовы сформулировать гипотезы:
H0: Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.
Н1: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта.
В соответствии со следующим шагом алгоритма определяем эмпирическую величину U:
Подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу соответствующее ей пх:
Для сопоставления с критическим значением выбираем меньшую величину U: Uэмп=60.
По Таблице стандартных значений критерия определяем критические значения для n1=14, n2=12.

Критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если Uэмп≤Uкp
Построим "ось значимости".
Рис. 16 Ось значимости для U - критерия
Uэмп=60
Uэмп>Uкp
Ответ: H0 принимается. Группа студентов-психологов не превосходит группы студентов-физиков по уровню невербального интеллекта.
Т - критерий Вилкоксона
Критерий применяется для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых.
Он позволяет установить не только направленность изменений, но и их выраженность. С его помощью мы определяем, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом.
Этот критерий применим в тех случаях, когда признаки измерены, по крайней мере, по шкале порядка; и сдвиги между вторым и первым замерами тоже могут быть упорядочены. Для этого они должны варьировать в достаточно широком диапазоне. В принципе, можно применять критерий Т и в тех случаях, когда сдвиги принимают только три значения: —1, 0 и +1, но тогда критерий Т вряд ли добавит что-нибудь новое к тем выводам, которые можно было бы получить с помощью критерия знаков. Вот если сдвиги изменяются, скажем, от —30 до +45, тогда имеет смысл их ранжировать и потом суммировать ранги.
Суть метода состоит в том, что мы сопоставляем выраженность сдвигов в том и ином направлениях по абсолютной величине. Для этого мы сначала ранжируем все абсолютные величины сдвигов, а потом суммируем ранги. Если сдвиги в положительную и в отрицательную сторону происходят случайно, то суммы рангов абсолютных значений их будут примерно равны. Если же интенсивность сдвига в одном из направлений перевешивает, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.
Первоначально мы исходим из предположения о том, что типичным сдвигом будет сдвиг в более часто встречающемся направлении, а нетипичным, или редким, сдвигом - сдвиг в более редко встречающемся направлении.
Гипотезы
Н0: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.
H1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.
Графическое представление Т критерия Вилкоксона
Сдвиги в противоположные стороны мы можем представить себе в виде двух облаков, как и в критерии знаков. Величина облака зависит не только от количества соответствующих сдвигов, но и от их интенсивности, отраженной в длине стрелок (Рис. 17). В сущности, облака: противостоят друг другу, как два воздушных фронта: они не просто соревнуются по величине, они меряются силами! При определенных п, а именно при n≥18, мы вообще можем отказаться от понятия типичного сдвига. Сдвигов в ту и другую сторону может оказаться поровну, но если 9 меньших сдвигов будут относиться к одному направлению, а 9 больших сдвигов - к противоположному, то мы можем констатировать достоверное преобладание этого противоположного направления сдвигов. Вспомним, что критерий знаков в этом случае не выявил бы никаких достоверных различий.
Рис. 17 Варианты соотношения «светлого» и «темного фронтов» - сдвигов двух разных направленностей в Т - критерии Вилкоксона
На Рис. 17 (а) "светлый фронт" преобладает над "темным фронтом" и по количеству сдвигов, и по их интенсивности. На Рис. 17 (б) «светлый фронт» преобладает только по интенсивности сдвигов, но не по их количеству; на Рис.17 (в) в "светлом фронте" наблюдаются более интенсивные сдвиги, но их меньше, чем в "темном фронте". Здесь критерий знаков мог бы констатировать преобладание изменений, соответствующих "темному фронту". Между тем, интенсивность противоположных, хотя и редких, сдвигов, столь велика, что делать какие-то однозначные выводы было бы опрометчиво.
Ограничения во временен Т- критерия Вилкоксона
1. Минимальное количество испытуемых, прошедших измерения в двух условиях - 5 человек. Максимальное количество испытуемых - 50 человек, что диктуется верхней границей имеющихся таблиц. Критические значения Т приведены в статистических таблицах.
2. Нулевые сдвиги из рассмотрения исключаются, и количество наблюдений n уменьшается на количество этих нулевых сдвигов. Можно обойти это ограничение, сформулировав гипотезы, включающие отсутствие изменений, например: "Сдвиг в сторону увеличения значений превышает сдвиг в сторону уменьшения значений и тенденцию сохранения их на прежнем уровне".
Пример.
В выборке курсантов военного училища (юноши в возрасте от 18 до 20 лет) измерялась способность к удержанию физического волевого усилия на динамометре. Сначала у испытуемых измерялась максимальная мышечная сила каждой из рук, а на следующий день им предлагалось выдерживать, на динамометре с подвижной стрелкой мышечное усилие, равное 1/2 максимальной мышечной силы данной руки. Почувствовав усталость, испытуемый должен был сообщить об этом экспериментатору, но не прекращать опыт, преодолевая усталость и неприятные ощущения - "бороться, пока воля не иссякнет". Опыт проводился дважды; вначале с обычной инструкцией, а затем, после того, как испытуемый заполнял опросник самооценки волевых качеств по методике А.Ц. Пуни. Ему предлагалось представить себе, что он уже добился идеала в развитии волевых качеств, и продемонстрировать соответствующее идеалу волевое усилие. Подтвердилась ли гипотеза экспериментатора о том, что обращение к идеалу способствует возрастанию волевого усилия? Данные представлены в Табл. 10
Таблица 10
Расчет критерия Т при сопоставлении замеров
физического волевого усилия
Код имени испытуемого
|
Длительность удержания усилия на динамометре (с)
|
Разность
(fпосле- fдо)
|
Абсолютное значение разности
|
Ранговый номер разности
|
До измерения волевых качеств и обращения к идеалу (fдо)
|
После измерения волевых качеств и обращения к идеалу (fпосле)
|
|
1
2
3
4
5
6
7
8
9
10 11
|
Г.
Кос. Крив. Кур.
Л.
М.
Р.
С.
Т.
X.
Ю.
|
64
77
74
95
105
83
73
75
101
97
78
|
25
50
77
76
67
75
77
71
63
122
60
|
- 39
- 27
+ 3
- 19
- 38
- 8
+ 4
- 4
- 38
+ 25
- 18
|
39
27
5
19
38
8
4
4
38
25
18
|
11
8
1
6
9,5
4
2,5
2,5
9,5
7
5
|
Сумма
|
|
66
|
Для подсчета этого критерия нет необходимости упорядочивать ряды значений по нарастанию признака. Мы можем использовать алфавитный список испытуемых, как в данном случае.
Первый шаг в подсчете критерия Т - вычитание каждого индивидуального значения "до" из значения "после". Мы видим из Табл.10, что 8 полученных разностей - отрицательные и лишь 3 - положительные. Это означает, что у 8 испытуемых длительность удержания мышечного усилия во втором замере уменьшилась, а у 3 - увеличилась. Мы столкнулись с тем случаем, когда уже сейчас мы не можем сфомулировать статистическую гипотезу, соответствующую первоначальному предположению исследователя. Предполагалось, что обращение к идеалу будет увеличивать длительность мышечного усилия, а экспериментальные данные свидетельствуют, что лишь в 3 случаях из 11 этот показатель действительно увеличился. Мы можем сформулировать лишь гипотезу, предполагающую несущественность сдвига этого показателя в сторону снижения.
Сформулируем гипотезы.
Н0: Интенсивность сдвигов в сторону уменьшения длительности мышечного усилия не превышает интенсивности сдвигов в сторону ее увеличения.
H1: Интенсивность сдвигов в сторону уменьшения длительности мышечного усилия превышает интенсивность сдвигов в сторону ее увеличения.
На следующем шаге все сдвиги, независимо от их знака, должны быть проранжированы по выраженности. В Табл.10 в четвертом слева столбце приведены абсолютные величины сдвигов, а в последнем столбце (справа) - ранги этих абсолютных величин. Меньшему значению соответствует меньший ранг. При этом сумма рангов равна 66, что соответствует расчетной:
Теперь отметим те сдвиги, которые являются нетипичными, в данном случае - положительными. В Табл.10 эти сдвиги и соответствующие им ранги выделены жирным шрифтом. Сумма рангов этих "редких" сдвигов и составляет эмпирическое значение критерия Т:
где Rr - ранговые значения сдвигов с более редким знаком.
Итак, в данном случае,
Тэмn=1+2,5+7=10,5
По Таблице стандартных значениев критерия определяем критические значения Т для n=11:
Рис. 18 Ось значимости для Т-критерия Вилкоксона
Зона значимости в данном случае простирается влево. Действительно, если бы "редких", в данном случае положительных, сдвигов не было совсем, то и сумма их рангов равнялась бы нулю. В данном же случае эмпирическое значение Т попадает в зону неопределенности:
Тэмп<Ткр (0,05)
Ответ: Н0 отвергается. Интенсивность отрицательного сдвига показателя физического волевого усилия превышает интенсивность положительного сдвига (р<0,05).
Попытаемся графически отобразить интенсивность отрицательных и положительных сдвигов. На Рис. 19 слева сдвиги представлены в секундах, а справа - в своих ранговых значениях. Мы видим, что ранжирование несколько уменьшает площади сопоставляемых облаков, или "фронтов".
Рис. 19 Графическое представление отрицательных и положительных сдвигов в длительности удержания мышечного усилия; слева – в секундах, справа – в ранговых значениях
Таким образом, исследователю придется признать, что продолжительность удержания мышечного волевого усилия во втором замере снижается, и этот сдвиг неслучаен. Инструкция, ориентирующая испытуемого на соответствие идеалу в развитии воли, оказалась гораздо менее мощным фактором, чем какая-то иная сила - возможно, мышечное утомление, может быть, разочарование в себе или в возможностях данного психологического эксперимента. А может быть, в момент второго замера просто перестает действовать какой-то мощный фактор, который был активен вначале? На все эти вопросы статистические методы не могут ответить, если в схему эксперимента не включена контрольная группа, в данном случае, выборка, уравновешенная с экспериментальной группой по всем значимым характеристикам (полу, возрасту, профессии, месту обучения). У которой просто измерили бы вторично волевое усилие через такой же промежуток времени, не призывая соответствовать идеалу в развитии воли.
АЛГОРИТМ
Подсчет Т- критерия Вилкоксона
1. Составить список испытуемых в любом порядке, например, алфавитном.
2. Вычислить разность между индивидуальными значениями во втором и первом замерах ("после" - "до"). Определить, что будет считаться "типичным" сдвигом и сформулировать соответствующие гипотезы.
3. Перевести разности в абсолютные величины и записать их отдельным столбцом (иначе трудно отвлечься от знака разности).
4. Проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг. Проверить совпадение полученной суммы рангов с расчетной.
5. Отметить кружками или другими знаками ранги, соответствующие сдвигам в "нетипичном" направлении.
6. Подсчитать сумму этих рангов по формуле:
где Rr - ранговые значения сдвигов с более редким знаком.
7. Определить критические значения Т для данного п по Таблице стандартных значений критерия. Если Тэмп меньше или равен Ткр, сдвиг в "типичную" сторону по интенсивности достоверно преобладает.
χ2 критерий Пирсона
Критерий χ2 применяется в двух целях;
1) для сопоставления эмпирического распределения признака с теоретическим - равномерным, нормальным или каким-то иным;
2) для сопоставления двух, трех или более эмпирических распределений одного и того же признака.
Критерий χ2 отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.
Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований . В самом простом случае альтернативного распределения "да - нет", "допустил брак - не допустил брака", "решил задачу - не решил задачу" и т. п. мы уже можем применить критерий χ2.
Допустим, некий наблюдатель фиксирует количество пешеходов, выбравших правую или левую из двух симметричных дорожек на пути из точки А в точку Б .
Допустим, в результате 70 наблюдений установлено, что 51 человек выбрали правую дорожку, и лишь 19 - левую. С помощью критерия χ2 мы можем определить, отличается ли данное распределение выборов от равномерного распределения, при котором обе дорожки выбирались бы с одинаковой частотой. Это вариант сопоставления полученного эмпирического распределения с теоретическим..
Но представим себе, что наблюдатель решает совершенно другую задачу: он занят проблемами билатерального регулирования. Совпадение полученного распределения с равномерным его интересует гораздо в меньшей степени, чем совпадение или несовпадение его данных с данными других исследователей. Ему известно, что люди с преобладанием правой ноги склонны делать круг против часовой стрелки, а люди с преобладанием левой ноги - круг по ходу часовой стрелки, и что в исследовании коллег преобладание левой ноги было обнаружено у 26 человек из 100 обследованных.
С помощью метода χ2 можно сопоставить два эмпирических распределения.
Аналогичным образом мы можем сопоставлять распределения выборов из трех и более альтернатив. Например, если в выборке из 50 человек 30 выбрали ответ (а), 15 человек - ответ (б) и 5 человек -ответ (в), то мы можем с помощью метода χ2 проверить, отличается ли это распределение от равномерного распределения или от распределения ответов в другой выборке, где ответ (а) выбрали 10 человек, ответ (б) -25 человек, ответ (в) - 15 человек.
В тех случаях, если признак измеряется количественно, скажем, в баллах, секундах или миллиметрах, нам, быть может, придется объединить все обилие значений признака в несколько разрядов. Например, если время решения задачи варьирует от 10 до 300 секунд, то мы можем ввести 10 или 5 разрядов, в зависимости от объема выборки. Например, это будут разряды: 0-50 секунд; 51-100 секунд; 101-150 секунд, и т. д. Затем мы с помощью метода χ2 будет сопоставлять частоты встречаемости разных разрядов признака, но в остальном принципиальная схема не меняется.
При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теоретическими частотами.
При сопоставлении двух эмпирических распределений мы определяем степень расхождения между эмпирическими частотами и теоретическими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений. Формулы расчета теоретических частот будут специально даны для каждого варианта сопоставлений.
Графическое представление критерия
Проиллюстрируем пример с выбором правой или левой дорожек на пути из точки А в точку Б. На Рис. 20 частота выбора левой дорожки представлена левым столбиком, а частота выбора правой дорожки - правым столбиком гистограммы. На оси ординат отмеряются относительные частоты выбора, то есть частоты выбора той или иной доожки, отнесенные к общему количеству наблюдений. Для левой дорожки относительная частота, которая называется также частотою, составляет 19/70, то есть 0,27, а для правой дорожки 51/70, то есть 0,73.
Рис. 20 Частоты выбора левой и правой дорожек: теоретическая частота представлена в виде горизонтальной планки, стрелками обозначены области расхождения между эмпирическими и теоретическими частотами (χ2-критерий Пирсона)
Если бы обе дорожки выбирались равновероятно, то половина испытуемых выбрала бы правую дорожку, а половина - левую. Вероятность выбора каждой из дорожек составляла бы 0,50.
Мы видим, что отклонения эмпирических частот от этой величины довольно значительны. Возможно, различия между эмпирическим и теоретическим распределением окажутся достоверными.
На Рис. 21 фактически представлены две гистограммы, но столбики сгруппированы так, что слева сопоставляются частоты предпочтения левой дорожки в выборе нашего наблюдателя (1) и в выборке Т.А. Доброхотовой и Н.Н. Брагиной (2), а справа - частоты предпочтения правой дорожки в этих же двух выборках.
Рис. 21 Частоты выбора левой и правой дорожек в двух выборках испытуемых
1-Выборка наблюдателя;
2-Выборка других исследователей.
Мы видим, что расхождения между выборками очень незначительны. Критерий χ2, скорей всего, подтвердит совпадение двух распределений.
Ограничения критерия
1. Объем выборки должен быть достаточно большим: п≥30. При п<30 критерий χ2 дает весьма приближенные значения. Точность критерия повышается при больших п.
2. Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: f>5. Это означает, что если число разрядов задано заранее и не может быть изменено, то мы не можем применять метод χ2, не накопив определенного минимального числа наблюдений. Если, например, мы хотим проверить наши предположения о том, что частота обращений в телефонную службу Доверия неравномерно распределяются по 7 дням недели, то нам потребуется 5*7=35 обращений. Таким образом, если количество разрядов (k) задано заранее, как в данном случае, минимальное число наблюдений (nmin) определяется по формуле: nmin=k*5.
3. Выбранные разряды должны "вычерпывать" все распределение, то есть охватывать весь диапазон вариативности признаков. При этом группировка на разряды должна быть одинаковой во всех сопоставляемых распределениях.
4. Необходимо вносить "поправку на непрерывность" при сопоставлении распределений признаков, которые принимают всего 2 значения. При внесении поправки значение χ2 уменьшается.
5. Разряды должны быть неперекрещивающимися: если наблюдение отнесено к одному разряду, то оно уже не может быть отнесено ни к какому другому разряду.
Сумма наблюдений по разрядам всегда должна быть равна общему количеству наблюдений.
АЛГОРИТМ
Расчет критерия χ2
1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).
2. Рядом с каждой эмпирической частотой записать теоретическую частоту (второй столбец).
3. Подсчитать разности между эмпирической и теоретической частотой по каждому разряду (строке) и записать их в третий столбец.
4. Определить число степеней свободы по формуле:
ν = κ-1
где κ - количество разрядов признака.
Если ν=1, внести поправку на "непрерывность".
5. Возвести в квадрат полученные разности и занести их в четвертый столбец.
6. Разделить полученные квадраты разностей на теоретическую частоту и записать результаты в пятый столбец.
7. Просуммировать значения пятого столбца. Полученную сумму обозначить как χ2ЭМП.
8. Определить по по таблице стандартных значений критерия критические значения для данного числа степеней свободы ν.
Если χ2эмп меньше критического значения, расхождения между распределениями статистически недостоверны.
Если χ2эмп равно критическому значению или превышает его, расхождения между распределениями статистически достоверны.
Алгоритм вычислений, таким образом, выражается формулой:
где fэj - эмпирическая частота по j-тому разряду признака; fт - теоретическая частота; j - порядковый номер разряда; k - количество разрядов признака.
Раздел 8. Корреляционный анализ
30>
Поделитесь с Вашими друзьями: |