Конспект лекций раздел Предмет и методы математической статистики Тема Место и роль статистического анализа в экспериментально-психологическом исследовании и психологической практике


Тема 7.3. Непараметрические критерии



страница3/7
Дата15.05.2016
Размер2.83 Mb.
#12898
ТипКонспект
1   2   3   4   5   6   7
Тема 7.3. Непараметрические критерии

Q - критерий Розенбаума

Критерий используется для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых. Он позволяет быстро оценить различия между двумя выборками по какому-либо признаку. Однако если критерий Q не выявляет достоверных различий, это еще не означает, что их действительно нет.

В этом случае стоит применить критерий φ* Фишера. Если же Q-критерий выявляет достоверные различия между выборками с уровнем значимости р<0,01, можно ограничиться только им и избежать трудностей применения других критериев.

Критерий применяется в тех случаях, когда данные представлены по крайней мере в порядковой шкале. Признак должен варьировать в каком-то диапазоне значений, иначе сопоставления с помощью Q -критерия просто невозможны. Например, если у нас только 3 значения признака, 1, 2 и 3, - нам очень трудно будет установить различия. Метод Розенбаума требует, следовательно, достаточно тонко измеренных признаков.

Применение критерия начинаем с того, что упорядочиваем значения признака в обеих выборках по нарастанию (или убыванию) признака. Лучше всего, если данные каждого испытуемого представлены на отдельной карточке. Тогда ничего не стоит упорядочить два ряда значений по интересующему нас признаку, раскладывая карточки на столе. Так мы сразу увидим, совпадают ли диапазоны значений, и если нет, то насколько один ряд значений "выше" (S1), а второй - "ниже" (S2). Для того, чтобы не запутаться, в этом и во многих других критериях рекомендуется первым рядом (выборкой, группой) считать тот ряд, где значения выше, а вторым рядом - тот, где значения ниже.

Гипотезы

H0: Уровень признака в выборке 1 не превышает уровня признака в выборке 2.

H1: Уровень признака в выборке 1 превышает уровень признака в вы­борке 2.



Графическое представление критерия Q

На Рис.11 представлены три варианта соотношения рядов значений в двух выборках. В варианте (а) все значения первого ряда выше всех значений второго ряда. Различия, безусловно, достоверны, при соблюдении условия, что n1, n2≥11.

В варианте (б), напротив, оба ряда находятся на одном и том же уровне: различия недостоверны. В варианте (в) ряды частично пере­крещиваются, но все же первый ряд оказывается гораздо выше второго. Достаточно ли велики зоны S1 и S2, в сумме составляющие Q, можно определить по Таблице стандартных значений критерия. Чем величина Q больше, тем более достоверные различия мы сможем констатировать.

Рис. 11 Возможные соотношения рядов в двух выборкаx: S1 - зона значений 1-го ряда, которые выше максимального значения 2-го ряда; S2 - зона значений 2-го ряда, которые меньше минимального значения 1-го ряда; штриховой отмечены перекрещивающиеся зоны двух рядов


Ограничения критерия Q

1. В каждой из сопоставляемых выборок должно быть не менее 11 на­блюдений. При этом объемы выборок должны примерно совпадать. Е.В. Гублером указываются следующие правила:

а) если в обеих выборках меньше 50 наблюдений, то абсолютная величина разности между n1 и n2 не должна быть больше 10 наблюдений;

б) если в каждой из выборок больше 51 наблюдения, но меньше 100, то абсолютная величина разности между щ и Л2 не должна быть больше 20 наблюдений;

в) если в каждой из выборок больше 100 наблюдений, то допускается, чтобы одна из выборок была больше другой не более чем в 1,5-2 раза.

2. Диапазоны разброса значений в двух выборках должны не совпадать между собой, в противном случае применение критерия бессмысленно. Между тем, возможны случаи, когда диапазоны разброса значе­ний совпадают, но, вследствие разносторонней асимметрии двух рас­пределений, различия в средних величинах признаков существенны (Рис. 12, 13).




Рис. 12 Вариант соотношения распределений признака в двух выборках, при котором критерий Q беспомощен

Рис.13 Вариант соотношения распределений признака в двух выборках, при котором критерий Q может быть применим


Рассмотрим пример

У предполагаемых участников психологического эксперимента, моделирующего деятельность воздушного диспетчера, был измерен уровень вербального и невербального интеллекта с помощью методики Д. Векслера. Было обследовано 26 юношей в возрасте от 18 до 24 лет (средний возраст 20,5 лет). 14 из них были студентами физического факультета, а 12 - студентами психологического факультета Ленинградского университета (Сидоренко Е.В.) показатели вербального интеллекта представлены в Табл. 6

Можно ли утверждать, что одна из групп превосходит другую по уровню вербального интеллекта?

Таблица 6


Индивидуальные значения вербального интеллекта в выборках студен­тов физического (n1=14) и психологического (n2=12) факультетов




Студенты-физики



Студенты - психологи

Код имени

испытуемого



Показатель вербального

интеллекта



Код имени

испытуемого



Показатель вербального

интеллекта



1.

2.

3.



4.

5.

6.



7.

8.

9.



10.

11.


12.

13.


14.

И.А

К.А.


К.Е.

П.А.


С.А.

СТ.А.


Т.А.

Ф.А.


Ч.И.

Ц.А.


СМ.А.

К.АН.


Б.Л.

Ф.В.


132

134


124

132


135

132


131

132


121

127


136

129


136

136


1.

2.

3.



4.

5.

6.



7.

8.

9.



10

11

12



Н.Т.

О.В.


Е.В.

Ф.О.


И.Н.

И.Ч.


И.В.

К.О.


P.P.

Р.И.


O.K.

Н.К.


126

127


132

120


119

126


120

123


120

116


123

115

Упорядочим значения в обеих выборках, а затем сформулируем гипотезы:

H0: Студенты-физики не превосходят студентов-психологов по уровню вербального интеллекта.

H1: Студенты-физики превосходят студентов-психологов по уровню вербального интеллекта.


Таблица 7

Упорядоченные по убыванию вербального интеллекта ряды индивидуальных значений в двух студенческих выборках


Как видно из Табл. 7, мы правильно обозначили ряды: пер­вый, тот, что "выше" - ряд физиков, а второй, тот, что "ниже" - ряд психологов.

По Табл. 7 определяем количество значений первого ряда, ко­торые больше максимального значения второго ряда: S1=5.

Теперь определяем количество значений второго ряда, которые меньше минимального значения первого ряда: S2=6.

Вычисляем Qэмп по формуле:



Qэмп = S1+S2=5+6=11

По статистическим таблицам определяем критические значения Q для n1=14, n2=12:




Ясно, что чем больше расхождения между выборками, тем боль­ше величина Q. Но отклоняется при Qэмп>Qкp, а при Qэмп <Qкp мы будем вынуждены принять Но.

Построим "ось значимости".




Рис. 14 Ось значимости

По рис. 14 Qэмп>Qкp, р=0,01.

H0 отклоняется и принимается H1. Студенты-физики превосходят студентов-психологов по уровню вербального интеллекта (р<0,01). Отметим, что в тех случаях, когда эмпирическая величина критерия оказывается на границе зоны незначимости, мы имеем право утверждать лишь, что различия достоверны при р<0,05, если же оно оказывается между двумя критическими значениями, то мы можем утверждать, что р< 0,05.

Если эмпирическое значение критерия оказывается на границе зоны значимости, р<0,01, в зоне значимости - что р<0,01

Поскольку уровень значимости выявленных различий достаточно высок (р<0,01), мы могли бы на этом остановиться. Однако если ис­следователь сам психолог, а не физик, вряд ли он на этом остановится. Он может попробовать сопоставить выборки по уровню невербального интеллекта, поскольку именно невербальный интеллект определяет уро­вень интеллекта в целом и степень его организованности.

АЛГОРИТМ

Подсчет критерия Q Розенбаума

1. Проверить, выполняются ли ограничения: n1,n2 ≥11,



n1 n2n2. Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше, а выборкой 2 - ту, где значения предположительно ниже.

3. Определить самое высокое (максимальное) значение в выборке 2.

4. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как S1.

5. Определить самое низкое (минимальное) значение в выборке 1.

6. Подсчитать количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как S2.

7. Подсчитать эмпирическое значение Q по формуле: Q=S1+S2

8. По Таблице статистических значений критерия определить критические значения Q для данных n1 и n2. Если Qэмп равно Q0,05 или превышает его, Н0 от­вергается.

9. При n1,n2>26 сопоставить полученное эмпирическое значение с Qкp=8 (р≤0,05) и Qкp=10(p0,01). Если Qэмп превышает или по крайней мере равняется Qкp=8, H0 отвергается.


U - критерий Манна-Уитни

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1,n23 или n1=2, n2≥5, и является более мощным, чем критерий Розенбаума.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше Uэмп, тем более вероятно, что различия достоверны.



Гипотезы:

Н0: Уровень признака в группе 2 не ниже уровня признака в группе 1.

H1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Графическое представление критерия U

На Рис. 15 представлены три из множества возможных вариантов соотношения двух рядов значений.

В варианте (а) второй ряд ниже первого, и ряды почти не перекрещиваются. Область наложения слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что различия между ними досто­верны. Точно определить это мы сможем с помощью критерия U.

В варианте (б) второй ряд тоже ниже первого, но и область пе­рекрещивающихся значений у двух рядов достаточно обширна. Она может еще не достигать критической величины, когда различия придет­ся признать несущественными. Но так ли это, можно определить толь­ко путем точного подсчета критерия U.

В варианте (в) второй ряд ниже первого, но область наложения настолько обширна, что различия между рядами скрадываются.

Рис. 15 Возможные варианты соотношений рядов значений в двух выборках; штриховкой обозначены зоны наложения



Ограничения критерия U

1. В каждой выборке должно быть не менее 3 наблюдений: n1,n2≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n1,n2≤60. Однако уже при n1,n2>20 ранжирование становиться достаточно трудоемким.

В случае, если n1,n2>20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбина­ции с критерием λ,, позволяющим выявить критическую точку, в кото­рой накапливаются максимальные различия между двумя сопоставляе­мыми выборками. Формулировка звучит сложно, но сам метод достаточно прост. Каждому исследователю лучше попробовать разные пути и выбрать тот, который кажется ему более подходящим.



Пример.

Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального интеллекта. С помощью критерия Q-Розенбаума мы смогли с высоким уровнем значимости определить, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот результат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в Табл. 8.

Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?

Таблица 8



Индивидуальные значения невербального интеллекта в выборках студентов физического (n1=14) и психологического (n2=12) факультетов


Студенты-физики

Студенты-психологи

Код имени

испытуемого



Показатель невербального

интеллекта



Код

имени


испытуемого

Показатель невербального

интеллекта



1. ИА.

111

1.Н.Т.

113

2. К.А.

104

2.О.В.

107

3.К.Е.

107

3.Е.В.

123

4.П.А.

90

4.Ф.О.

122

5.С.А.

115

5.И.Н.

117

6.Ст.А.

107

6.И.Ч.

112

7.Т.А.

106

7.И.В.

105

8.Ф.А.

107

8.К.О.

108

9.Ч.И.

95

9.P.P.

111

10.ЦА.

116

10.Р.И.

114

11.См.А.

127

11.O.K.

102

12.К.Ан.

115

12.Н.К.

104

13.Б.Л.

102







14.Ф.В.

99






Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.



Правила ранжирования

1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.

Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех случаев, которые предусмотрены правилом 2.

2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны.

Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получает средний ранг:

Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:



и т.д.
3. Общая сумма рангов должна совпадать с расчетной, которая опре­деляется по формуле:


где N - общее количество ранжируемых наблюдений (значений). Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.

АЛГОРИТМ

Подсчет критерия U Манна-Уитни.

1. Перенести все данные испытуемых на индивидуальные карточки.

2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 - другим, например, синим.

3. Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой.

4. Проранжировать значения на карточках, приписывая меньшему зна­чению меньший ранг. Всего рангов получится столько, сколько у нас (n1+п2).

5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд, синие - в другой.

6. Подсчитать сумму рангов отдельно на красных карточках (выборка 1) и на синих карточках (выборка 2). Проверить, совпадает ли общая сумма рангов с расчетной.

7. Определить большую из двух ранговых сумм.

8. Определить значение U по формуле:




где n1 - количество испытуемых в выборке 1;

n2 - количество испытуемых в выборке 2;

Тх - большая из двух ранговых сумм;

nх - количество испытуемых в группе с большей суммой рангов.

9. Определить критические значения U по Таблице стандартных значений критерия. Если Uэмп.>Uкp 005, Но принимается. Если UэмпUкp_005, Но отвергается. Чем меньше значения U, тем достоверность различий выше.

Теперь проделаем всю эту работу на материале данного примера. В результате работы по 1-6 шагам алгоритма построим таблицу 9.

Таблица 9

Подсчет ранговых сумм по выборкам студентов физического и психологического факультетов


Студенты-физики (n1=14)

Студенты-психологи (n2=12)

Показатель невербального

интеллекта



Ранг

Показатель невербального

интеллекта



Ранг

127

26













123

25







122

24







117

23

116

22







115

20,5







115

20,5













114

19







113

18







112

17

111

15,5

111

15.5







108

14'

107

11.5

107

11,5

107

11,5







107

11,5







106

9













105

8

104

6.5

104

6,5

102

4,5

102

4,5

99

3







95

2







90

1







Суммы

1501

165

1338

186

Средние

107,2




111,5



Общая сумма рангов: 165+186=351. Расчетная сумма:



Равенство реальной и расчетной сумм соблюдено.

Мы видим, что по уровню невербального интеллекта более "высоким" рядом оказывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186.

Теперь мы готовы сформулировать гипотезы:



H0: Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.

Н1: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта.

В соответствии со следующим шагом алгоритма определяем эмпи­рическую величину U:


Подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу соответствующее ей пх:

Для сопоставления с критическим значе­нием выбираем меньшую величину U: Uэмп=60.

По Таблице стандартных значений критерия определяем критические значения для n1=14, n2=12.


Критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если UэмпUкp

Построим "ось значимости".


Рис. 16 Ось значимости для U - критерия



Uэмп=60

Uэмп>Uкp

Ответ: H0 принимается. Группа студентов-психологов не превос­ходит группы студентов-физиков по уровню невербального интеллекта.
Т - критерий Вилкоксона

Критерий применяется для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых.

Он позволяет установить не только направленность изменений, но и их выраженность. С его помощью мы определяем, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом.

Этот критерий применим в тех случаях, когда признаки измерены, по крайней мере, по шкале порядка; и сдвиги между вторым и первым замерами тоже могут быть упорядочены. Для этого они должны варьи­ровать в достаточно широком диапазоне. В принципе, можно применять критерий Т и в тех случаях, когда сдвиги принимают только три значения: —1, 0 и +1, но тогда критерий Т вряд ли добавит что-нибудь новое к тем выводам, которые можно было бы получить с помощью критерия знаков. Вот если сдвиги изменяются, скажем, от —30 до +45, тогда имеет смысл их ранжировать и потом суммировать ранги.

Суть метода состоит в том, что мы сопоставляем выраженность сдвигов в том и ином направлениях по абсолютной величине. Для этого мы сначала ранжируем все абсолютные величины сдвигов, а потом суммируем ранги. Если сдвиги в положительную и в отрицательную сторону происходят случайно, то суммы рангов абсолютных значений их будут примерно равны. Если же интенсивность сдвига в одном из направлений перевешивает, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Первоначально мы исходим из предположения о том, что типичным сдвигом будет сдвиг в более часто встречающемся направлении, а нетипичным, или редким, сдвигом - сдвиг в более редко встречающемся направлении.



Гипотезы

Н0: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.

H1: Интенсивность сдвигов в типичном направлении превышает интен­сивность сдвигов в нетипичном направлении.

Графическое представление Т критерия Вилкоксона

Сдвиги в противоположные стороны мы можем представить себе в виде двух облаков, как и в критерии знаков. Величина облака зависит не только от количества соответствующих сдвигов, но и от их интенсивности, отраженной в длине стрелок (Рис. 17). В сущности, облака: противостоят друг другу, как два воздушных фронта: они не просто соревнуются по величине, они меряются силами! При определенных п, а именно при n≥18, мы вообще можем отказаться от понятия типич­ного сдвига. Сдвигов в ту и другую сторону может оказаться поровну, но если 9 меньших сдвигов будут относиться к одному направлению, а 9 больших сдвигов - к противоположному, то мы можем констатиро­вать достоверное преобладание этого противоположного направления сдвигов. Вспомним, что критерий знаков в этом случае не выявил бы никаких достоверных различий.



Рис. 17 Варианты соотношения «светлого» и «темного фронтов» - сдвигов двух разных направленностей в Т - критерии Вилкоксона

На Рис. 17 (а) "светлый фронт" преобладает над "темным фрон­том" и по количеству сдвигов, и по их интенсивности. На Рис. 17 (б) «светлый фронт» преобладает только по интенсивности сдвигов, но не по их количеству; на Рис.17 (в) в "светлом фронте" наблюдаются более интенсивные сдвиги, но их меньше, чем в "темном фронте". Здесь критерий знаков мог бы констатировать преобладание изменений, соответствующих "темному фронту". Между тем, интенсивность противоположных, хотя и редких, сдвигов, столь велика, что делать какие-то однозначные выводы было бы опрометчиво.

Ограничения во временен Т- критерия Вилкоксона

1. Минимальное количество испытуемых, прошедших измерения в двух условиях - 5 человек. Максимальное количество испытуемых - 50 человек, что диктуется верхней границей имеющихся таблиц. Критические значения Т приведены в статистических таблицах.

2. Нулевые сдвиги из рассмотрения исключаются, и количество наблю­дений n уменьшается на количество этих нулевых сдвигов. Можно обойти это ограничение, сформулировав гипотезы, включающие отсутствие изменений, например: "Сдвиг в сторону увеличения значений превышает сдвиг в сторону уменьшения значений и тенденцию сохранения их на прежнем уровне".

Пример.

В выборке курсантов военного училища (юноши в возрасте от 18 до 20 лет) измерялась способность к удержанию физического волевого усилия на динамометре. Сначала у испытуемых измерялась максимальная мышечная сила каждой из рук, а на следующий день им предлагалось выдерживать, на динамометре с подвижной стрелкой мышечное усилие, равное 1/2 максимальной мышечной силы данной руки. Почувствовав усталость, испытуемый должен был сообщить об этом экспериментатору, но не прекращать опыт, преодолевая усталость и неприятные ощущения - "бороться, пока воля не иссякнет". Опыт проводился дважды; вначале с обычной инструкцией, а затем, после того, как испытуемый заполнял опросник самооценки волевых качеств по методике А.Ц. Пуни. Ему предлагалось представить себе, что он уже добился идеала в развитии волевых качеств, и продемонстрировать соответствующее идеалу волевое усилие. Подтвердилась ли гипотеза экспериментатора о том, что обращение к идеалу способствует возрастанию волевого усилия? Данные представлены в Табл. 10

Таблица 10

Расчет критерия Т при сопоставлении замеров

физического волевого усилия


Код имени испытуемого



Длительность удержания усилия на динамометре (с)

Разность

(fпосле- fдо)





Абсолютное значение разности



Ранговый номер разности

До измерения волевых качеств и обращения к идеалу (fдо)

После измерения волевых качеств и обращения к идеалу (fпосле)



1

2

3

4

5

6



7

8

9



10 11

Г.

Кос. Крив. Кур.

Л.

М.

Р.



С.

Т.

X.

Ю.


64

77

74

95

105


83

73

75

101



97

78


25

50

77

76

67

75



77

71

63



122

60


- 39

- 27


+ 3

- 19


- 38

- 8


+ 4

- 4


- 38

+ 25

- 18


39

27

5

19

38

8



4

4

38



25

18


11

8

1

6

9,5


4

2,5

2,5


9,5

7

5


Сумма




66

Для подсчета этого критерия нет необходимости упорядочивать ряды значений по нарастанию признака. Мы можем использовать алфавитный список испытуемых, как в данном случае.

Первый шаг в подсчете критерия Т - вычитание каждого индивидуального значения "до" из значения "после". Мы видим из Табл.10, что 8 полученных разностей - отрицательные и лишь 3 - положительные. Это означает, что у 8 испытуемых длительность удержания мышечного усилия во втором замере уменьшилась, а у 3 - увеличилась. Мы столкнулись с тем случаем, когда уже сейчас мы не можем сфо­мулировать статистическую гипотезу, соответствующую первоначальному предположению исследователя. Предполагалось, что обращение к идеалу будет увеличивать длительность мышечного усилия, а экспериментальные данные свидетельствуют, что лишь в 3 случаях из 11 этот показатель действительно увеличился. Мы можем сформулировать лишь гипотезу, предполагающую несущественность сдвига этого показателя в сторону снижения.

Сформулируем гипотезы.

Н0: Интенсивность сдвигов в сторону уменьшения длительности мы­шечного усилия не превышает интенсивности сдвигов в сторону ее увеличения.

H1: Интенсивность сдвигов в сторону уменьшения длительности мы­шечного усилия превышает интенсивность сдвигов в сторону ее увеличения.

На следующем шаге все сдвиги, независимо от их знака, должны быть проранжированы по выраженности. В Табл.10 в четвертом слева столбце приведены абсолютные величины сдвигов, а в последнем столбце (справа) - ранги этих абсолютных величин. Меньшему значению соответствует меньший ранг. При этом сумма рангов равна 66, что соответствует расчетной:


Теперь отметим те сдвиги, которые являются нетипичными, в данном случае - положительными. В Табл.10 эти сдвиги и соответствующие им ранги выделены жирным шрифтом. Сумма рангов этих "редких" сдвигов и составляет эмпирическое значение критерия Т:


где Rr - ранговые значения сдвигов с более редким знаком.

Итак, в данном случае,

Тэмn=1+2,5+7=10,5

По Таблице стандартных значениев критерия определяем критические значения Т для n=11:



Рис. 18 Ось значимости для Т-критерия Вилкоксона


Зона значимости в данном случае простирается влево. Действительно, если бы "редких", в данном случае положительных, сдвигов не было совсем, то и сумма их рангов равнялась бы нулю. В данном же случае эмпирическое значение Т попадает в зону неопределенности:

Тэмпкр (0,05)

Ответ: Н0 отвергается. Интенсивность отрицательного сдвига показателя физического волевого усилия превышает интенсивность положительного сдвига (р<0,05).

Попытаемся графически отобразить интенсивность отрицательных и положительных сдвигов. На Рис. 19 слева сдвиги представлены в секундах, а справа - в своих ранговых значениях. Мы видим, что ран­жирование несколько уменьшает площади сопоставляемых облаков, или "фронтов".



Рис. 19 Графическое представление отрицательных и положительных сдвигов в длительности удержания мышечного усилия; слева – в секундах, справа – в ранговых значениях


Таким образом, исследователю придется признать, что продолжительность удержания мышечного волевого усилия во втором замере снижается, и этот сдвиг неслучаен. Инструкция, ориентирующая испытуемого на соответствие идеалу в развитии воли, оказалась гораздо менее мощным фактором, чем какая-то иная сила - возможно, мышечное утомление, может быть, разочарование в себе или в возможностях дан­ного психологического эксперимента. А может быть, в момент второго замера просто перестает действовать какой-то мощный фактор, который был активен вначале? На все эти вопросы статистические методы не могут ответить, если в схему эксперимента не включена контрольная группа, в данном случае, выборка, уравновешенная с экспериментальной группой по всем значимым характеристикам (полу, возрасту, профессии, месту обучения). У которой просто измерили бы вторично волевое усилие через такой же промежуток времени, не призывая соответствовать идеалу в развитии воли.

АЛГОРИТМ

Подсчет Т- критерия Вилкоксона

1. Составить список испытуемых в любом порядке, например, алфавитном.

2. Вычислить разность между индивидуальными значениями во втором и первом замерах ("после" - "до"). Определить, что будет считаться "типичным" сдвигом и сформулировать соответствующие гипоте­зы.

3. Перевести разности в абсолютные величины и записать их отдельным столбцом (иначе трудно отвлечься от знака разности).

4. Проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг. Проверить совпадение полученной суммы рангов с расчетной.

5. Отметить кружками или другими знаками ранги, соответствующие сдвигам в "нетипичном" направлении.

6. Подсчитать сумму этих рангов по формуле:

где Rr - ранговые значения сдвигов с более редким знаком.

7. Определить критические значения Т для данного п по Таблице стандартных значений критерия. Если Тэмп меньше или равен Ткр, сдвиг в "типичную" сторону по интенсивности достоверно преобладает.

χ2 критерий Пирсона

Критерий χ2 применяется в двух целях;

1) для сопоставления эмпирического распределения признака с теоре­тическим - равномерным, нормальным или каким-то иным;

2) для сопоставления двух, трех или более эмпирических распределений одного и того же признака.

Критерий χ2 отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.

Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований . В самом простом случае альтернативного распределения "да - нет", "допустил брак - не допустил бра­ка", "решил задачу - не решил задачу" и т. п. мы уже можем приме­нить критерий χ2.

Допустим, некий наблюдатель фиксирует количество пешеходов, выбравших правую или левую из двух симметричных дорожек на пути из точки А в точку Б .

Допустим, в результате 70 наблюдений установлено, что 51 человек выбрали правую дорожку, и лишь 19 - левую. С помощью критерия χ2 мы можем определить, отличается ли данное распределение выборов от равномерного распределения, при котором обе дорожки выбирались бы с одинаковой частотой. Это вариант сопоставления полученного эмпирического распределения с теоретическим..

Но представим себе, что наблюдатель решает совершенно другую задачу: он занят проблемами билатерального регулирования. Совпадение полученного распределения с равномерным его интересует гораздо в меньшей степени, чем совпадение или несовпадение его данных с данными других исследователей. Ему известно, что люди с преобладанием правой ноги склонны делать круг против часовой стрелки, а люди с преобладанием левой ноги - круг по ходу часовой стрелки, и что в исследовании коллег преобладание левой ноги было обнаружено у 26 человек из 100 обследованных.

С помощью метода χ2 можно сопоставить два эмпирических распределения.

Аналогичным образом мы можем сопоставлять распределения выборов из трех и более альтернатив. Например, если в выборке из 50 человек 30 выбрали ответ (а), 15 человек - ответ (б) и 5 человек -ответ (в), то мы можем с помощью метода χ2 проверить, отличается ли это распределение от равномерного распределения или от распределения ответов в другой выборке, где ответ (а) выбрали 10 человек, ответ (б) -25 человек, ответ (в) - 15 человек.

В тех случаях, если признак измеряется количественно, скажем, в баллах, секундах или миллиметрах, нам, быть может, придется объединить все обилие значений признака в несколько разрядов. Например, если время решения задачи варьирует от 10 до 300 секунд, то мы можем ввести 10 или 5 разрядов, в зависимости от объема выборки. На­пример, это будут разряды: 0-50 секунд; 51-100 секунд; 101-150 секунд, и т. д. Затем мы с помощью метода χ2 будет сопоставлять частоты встречаемости разных разрядов признака, но в остальном принципиаль­ная схема не меняется.

При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теорети­ческими частотами.

При сопоставлении двух эмпирических распределений мы определяем степень расхождения между эмпирическими частотами и теоретическими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений. Формулы расчета теоретических частот будут специально даны для каждого варианта сопоставлений.



Графическое представление критерия

Проиллюстрируем пример с выбором правой или левой дорожек на пути из точки А в точку Б. На Рис. 20 частота выбора левой дорожки представлена левым столбиком, а частота выбора правой дорожки - правым столбиком гистограммы. На оси ординат отмеряются относительные частоты выбора, то есть частоты выбора той или иной до­ожки, отнесенные к общему количеству наблюдений. Для левой дорожки относительная частота, которая называется также частотою, составляет 19/70, то есть 0,27, а для правой дорожки 51/70, то есть 0,73.




Рис. 20 Частоты выбора левой и правой дорожек: теоретическая частота представлена в виде горизонтальной планки, стрелками обозначены области расхождения между эмпирическими и теоретическими частотами (χ2-критерий Пирсона)
Если бы обе дорожки выбирались равновероятно, то половина испытуемых выбрала бы правую дорожку, а половина - левую. Вероятность выбора каждой из дорожек составляла бы 0,50.

Мы видим, что отклонения эмпирических частот от этой величи­ны довольно значительны. Возможно, различия между эмпирическим и теоретическим распределением окажутся достоверными.

На Рис. 21 фактически представлены две гистограммы, но столбики сгруппированы так, что слева сопоставляются частоты предпочте­ния левой дорожки в выборе нашего наблюдателя (1) и в выборке Т.А. Доброхотовой и Н.Н. Брагиной (2), а справа - частоты предпочтения правой дорожки в этих же двух выборках.

Рис. 21 Частоты выбора левой и правой дорожек в двух выборках испытуемых

1-Выборка наблюдателя;

2-Выборка других исследователей.


Мы видим, что расхождения между выборками очень незначительны. Критерий χ2, скорей всего, подтвердит совпадение двух распределений.

Ограничения критерия

1. Объем выборки должен быть достаточно большим: п30. При п<30 критерий χ2 дает весьма приближенные значения. Точность крите­рия повышается при больших п.

2. Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: f>5. Это означает, что если число разрядов задано зара­нее и не может быть изменено, то мы не можем применять метод χ2, не накопив определенного минимального числа наблюдений. Ес­ли, например, мы хотим проверить наши предположения о том, что частота обращений в телефонную службу Доверия неравномерно распределяются по 7 дням недели, то нам потребуется 5*7=35 обращений. Таким образом, если количество разрядов (k) задано заранее, как в данном случае, минимальное число наблюдений (nmin) определяется по формуле: nmin=k*5.

3. Выбранные разряды должны "вычерпывать" все распределение, то есть охватывать весь диапазон вариативности признаков. При этом группировка на разряды должна быть одинаковой во всех сопостав­ляемых распределениях.

4. Необходимо вносить "поправку на непрерывность" при сопоставле­нии распределений признаков, которые принимают всего 2 значения. При внесении поправки значение χ2 уменьшается.

5. Разряды должны быть неперекрещивающимися: если наблюдение отнесено к одному разряду, то оно уже не может быть отнесено ни к какому другому разряду.

Сумма наблюдений по разрядам всегда должна быть равна общему количеству наблюдений.
АЛГОРИТМ

Расчет критерия χ2

1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).

2. Рядом с каждой эмпирической частотой записать теоретическую частоту (второй столбец).

3. Подсчитать разности между эмпирической и теоретической частотой по каждому разряду (строке) и записать их в третий столбец.

4. Определить число степеней свободы по формуле:

ν = κ-1

где κ - количество разрядов признака.

Если ν=1, внести поправку на "непрерывность".

5. Возвести в квадрат полученные разности и занести их в четвертый столбец.

6. Разделить полученные квадраты разностей на теоретическую частоту и записать результаты в пятый столбец.

7. Просуммировать значения пятого столбца. Полученную сумму обозначить как χ2ЭМП.

8. Определить по по таблице стандартных значений критерия критические значения для данного числа степеней свободы ν.

Если χ2эмп меньше критического значения, расхождения между распределениями статистически недостоверны.

Если χ2эмп равно критическому значению или превышает его, расхождения между распределениями статистически достоверны.

Алгоритм вычислений, таким образом, выражается формулой:




где fэj - эмпирическая частота по j-тому разряду признака; fт - теоретическая частота; j - порядковый номер разряда; k - количество разрядов признака.
Раздел 8. Корреляционный анализ

Каталог: 2013
2013 -> 1. Предмет философии и структура философского знани
2013 -> Тесты для диагностики уровня агрессивности у воспитанников, критерии эффективности психолого-педагогической работы; подробно описываются пути и средства достижения положительного результата
2013 -> Внутрибольничное агрессивное поведение психически больных и пути его профилактики. 14. 01. 06 психиатрия
2013 -> Факторы риска патологической агрессии у больных с аффективными расстройствами 14. 01. 06 Психиатрия (мед науки)
2013 -> Пособие по обучению и воспитанию детей-инвалидов с умеренной и выраженной умственной отсталостью в условиях семьи
2013 -> Активность личности, деятельность
2013 -> «ха­рактер» означает «чеканка»,
2013 -> Сведения о цбс


Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7




База данных защищена авторским правом ©dogmon.org 2022
обратиться к администрации

    Главная страница