Шкала наименований предусматривает группировку предметов по классам на основании наличия у них общего признака или свойства. Классам дается наименование и присваивается числовое значение. Например, если исследователь всем мальчикам, участвующим в эксперименте, присвоит единицу, а всем девочкам — ноль, то он выполнит номинальное измерение. В шкале наименований могут быть расклассифицированы и результаты беседы исследователя с испытуемыми, где числа могут быть присвоены, например, таким классам, как «положительные высказывания испытуемых в адрес своей группы» — 1, «положительные высказывания испытуемых в адрес чужой группы» — 2, «отрицательные высказывания испытуемых в адрес своей группы» — 3 и т. д. Действия и поступки испытуемых также могут быть расклассифицированы в шкале наименований.
41
Так как при номинальных измерениях используется лишь та особенность чисел, что 1 отличается от 2 или 3, обозначение цифрами 1 и 2 объектов A и B будет означать, что объекты A и B отличаются друг от друга в отношении измеряемого свойства, но это не значит, что в A измеряемого свойства содержится больше или меньше, чем в B.
Измерение, позволяющее обнаружить в предметах различие степеней признака или свойства, называется порядковым измерением, а шкалы, на которых оно осуществляется, — шкалами порядка. Шкала порядка имеет все свойства номинальной шкалы, но, помимо этого, числа, присваиваемые предметам, отражают количество свойства, принадлежащего предметам. Например, исследователь может прошкалировать все экспериментальные группы по такому признаку, как сплоченность, присваивая цифры 1, 2, 3... самой сплоченной, менее сплоченной и т. д. Порядковое измерение называют еще ранжированием.
Произведя ранжирование объектов A, B, C, исследователь еще не может сказать, насколько у объекта A измеряемого свойства больше, чем у объекта B или C. В тех случаях, когда измеритель способен не только фиксировать различия между объектами, но и сказать, что разность между двумя объектами равна разности между двумя другими объектами, говорят об интервальном измерении.
Интервальное измерение — это присвоение чисел объектам, при котором равные разности чисел соответствуют равным разностям значений измеряемого признака или свойства объектов. Шкалы при таком измерении называются шкалами интервалов.
Особенностью шкал интервалов является произвольность выбора нулевой точки на шкале, которая вовсе не указывает на полное отсутствие признака. Примером шкалы интервалов может служить шкала летосчисления, температурная шкала. Главная трудность при построении шкал интервалов в социальной психологии заключается в обосновании равенства между пунктами шкалы. Процедура установления такого равенства была разработана Л. Тёрстоуном1 по аналогии с разработкой шкал в психофизике (шкала Тёрстоуна содержала суждения об отношении к церкви). Шкалы интервалов используются в тестировании, например при создании тестов интеллекта.
Измерение отношений отличается от интервального только тем, что нулевая точка не произвольна, а указывает на полное отсутствие измеряемого свойства. Измеритель всегда может сказать, во сколько раз у A измеряемого свойства больше, чем у B, C и т. д. Пример шкалы отношений — шкала роста, веса. В социальной психологии данный вид шкалирования практически не используется.
42
Исследователю очень важно знать, с каким типом шкалы он работает, так как вся дальнейшая математическая обработка определяется именно типом измерительной шкалы. Важным свойством шкал является их иерархичность — т. е. шкалы более высокого уровня включают в себя все свойства шкал более низкого уровня. Поэтому все числовые операции, выполняемые для шкал низшего уровня, автоматически допустимы и на шкалах высшего уровня1.
Обычно числа, представляющие собой результаты измерений, в статистике называют вариантами и обозначают xi. Все замеры, расположенные в один ряд в порядке возрастания или убывания, образуют вариационный ряд. А количество повторяющихся замеров в составе вариационного ряда есть частота. Например, исследователь располагает ответами 36-ти учеников класса на вопрос анкеты: «Как часто твои мнения и вкусы совпадают с мнениями и вкусами твоих одноклассников?». Предполагались следующие 5 категорий ответов: «всегда», «иногда», «часто», «довольно редко», «никогда». Если каждой из категорий ответов присвоить соответствующее числовое значение («всегда» — 5, «часто» — 4, «иногда» — 3, «довольно редко» — 2, «никогда» — 1) и выстроить все ответы в порядке убывания, то мы получим следующий вариационный ряд: 555555444444444333333333333222222211. Чтобы данные было удобнее обрабатывать, их помещают в таблицу (см. табл. 1).
Таблица 1
|
Частотное распределение ответов
учащихся на вопросы анкеты
|
№
|
Варианта
|
Частота
|
1
|
Всегда
|
6
|
2
|
Часто
|
9
|
3
|
Иногда
|
12
|
4
|
Довольно редко
|
7
|
5
|
Никогда
|
2
|
|
Итого:
|
36
|
Информацию, содержащуюся в таблице частотного распределения, можно представить в виде кривой распределения. Существуют два способа построения графика. Откладывая по горизонтальной оси варианты, а по вертикальной — значение их частот и соединяя точки ломаной линией, мы получим полигон распределения. График, на котором связь частот и вариант
43
изображена столбцами и при этом соблюдены необходимые пропорции, называется гистограммой частот (см. рис. 1). Для наглядности на одной оси координат можно изобразить несколько кривых распределения при условии, что замеры производились в одних и тех же единицах.
Рис. 1. Кривая полигона частот и гистограмма (по данным табл. 1)
Для дальнейшей статистической обработки полученных в исследовании данных необходимо уметь вычислить среднее арифметическое, моду и медиану, которые указывают наиболее типичный, характеризующий данную группу или индивида результат.
Среднее арифметическое (среднее значение, выборочное среднее) вычисляется во всех тех случаях, когда произведено интегральное измерение, и находится путем суммирования всех результатов и делением получившейся суммы на число членов вариационного ряда:
|
(1)
|
или
|
(2)
|
где — среднее арифметическое; xi — значения вариант; N — количество членов вариационного ряда.
Если среди членов вариационного ряда некоторые варианты повторяются, то формула (1) примет вид:
|
(3)
|
где kn — частота варианты.
Определим среднее арифметическое вариационного ряда 114445577778 по формуле (3):
Если измерение выполнено на шкале порядка, то среднее арифметическое вычислять нельзя. В этом случае находят медиану. Медиана — это результат, который делит вариационный ряд пополам, причем одна половина значений лежит справа от нее, другая — слева. Место медианы определяется по формуле:
44
где N — число членов ряда. Если данные содержат нечетное число значений, например: 12, 9, 7, 6, 2, то медиана есть среднее значение для случая, когда они упорядочены, т. е. медиана равна 7. Если данные содержат четное число значений, например: 5, 7, 11, 12, то медиана есть точка, лежащая посередине между двумя центральными значениями, когда они упорядочены.
В тех случаях, когда произведено номинальное измерение, находят моду. Мода — это такое значение вариационного ряда, которое встречается наиболее часто. Например, модой совокупности значений 3, 3, 3, 4, 5, 5, 5, 5, 9, 10 будет 5, потому что оно встречается чаще любого другого значения. Фактически мода — это варианта, частота которой максимальна. В случае, когда все значения встречаются одинаково часто, принято считать, что вариационный ряд не имеет моды. Вариационный ряд может быть бимодальным, если два несмежных значения имеют равные частоты и они больше частот других значений, например, среди значений вариационного ряда 3, 3, 4, 4, 4, 5, 5, 5, 5, 7, 7, 8, 8, 8, 8, 9 модами будут 5 и 8.
Для измерения вариации оценок внутри группы пользуются другими характеристиками вариационного ряда — дисперсией и средним квадратическим отклонением (стандартным отклонением). Вычисление этих характеристик позволяет сравнить между собой результаты, полученные на разных выборках.
Обычно для нахождения дисперсии предварительно составляется следующая таблица:
Таблица 2
|
Вычисление дисперсии
|
№ п/п
|
Значения показателя
|
Отклонение от среднего
|
Квадрат отклонения
|
1
|
1
|
1–2=–1
|
1
|
2
|
3
|
3–2= 1
|
1
|
3
|
3
|
3–2= 1
|
1
|
4
|
0
|
0–2=–2
|
4
|
5
|
4
|
4–2= 2
|
4
|
6
|
1
|
1–2=–1
|
1
|
|
|
|
|
45
Дисперсия определяется как средний квадрат отклонения варианты от ее среднего арифметического, обозначается буквой σ2 (сигма в квадрате) и определяется по формуле:
где x? — среднее арифметическое вариационного ряда; xi — значение каждой отдельной варианты; N — количество вариант в вариационном ряду.
Рис. 2. Частотное распределение данных с одним и тем же средним значением, но разным разбросом (1 — большой разброс данных, 2 — небольшой разброс данных)
Квадратный корень из дисперсии определяется как среднее квадратическое отклонение (стандартное отклонение), обозначается буквой σ и определяется как . Эта мера широко применяется при сравнении разбросов в различных группах. На рис. 2 представлены два распределения, имеющие одно и то же среднее, но отличающиеся разбросом. Распределение, характеризующееся большими индивидуальными различиями, имеет и большее σ.
2.2.2. Статистическая проверка научной гипотезы
|
Одним из наиболее важных моментов применения математической статистики в социально-психологических исследованиях является определение статистической значимости полученных результатов. Например, исследователь в своей работе хочет определить, зависит ли эффективность групповой деятельности от уровня развития группы. Получив два ряда замеров, характеризующих эффективность деятельности в двух группах — в группе высокого уровня развития и в группе низкого уровня развития, он может вычислить среднее арифметическое для той или для другой группы (см. табл. 3).
Для того чтобы определить, является ли разность между и существенной (т. е. решить вопрос о том, что между уровнем развития группы и эффективностью групповой деятельности существует взаимосвязь), исследователь должен определить статистическую достоверность разницы . С этой целью можно воспользоваться критерием Стьюдента t:
где и — средние арифметические; m1 и m2 — величины средних ошибок, которые вычисляются по формуле:
46
Таблица 3
Группа высокого уровня развития
|
Группа низкого уровня развития
|
Эффективность деятельности в баллах
|
|
|
Эффективность деятельности в баллах
|
|
|
5
|
–2
|
4
|
6
|
–2
|
4
|
6
|
1
|
1
|
3
|
1
|
1
|
7
|
0
|
0
|
4
|
0
|
0
|
10
|
–3
|
1
|
5
|
–1
|
1
|
6
|
1
|
1
|
5
|
–1
|
1
|
8
|
–1
|
1
|
3
|
1
|
1
|
7
|
0
|
0
|
2
|
2
|
4
|
|
|
|
|
σ12=2.67
|
σ1=1.63
|
σ22=2
|
σ2=1.41
|
В нашем примере для первого ряда ошибка будет равна:
Для второго ряда:
Тогда
Далее исследователь по специальным таблицам должен определить уровень достоверности (уровень значимости). В работах по психологии обычно используют пятипроцентный (P=0,05), однопроцентный (P=0,01) и однопромильный (P=0,001) уровни достоверности. Это значит, что если величина t-критерия соответствует, например, пятипроцентному уровню достоверности или меньшее его (P≤0,05), то вероятность того, что найденное различие между средними будет случайным, равно 5 случаям из 100. Если же вероятность того, что разница случайна, составляет больше 5% (P>0,05), то разница считается незначимой. Уровень значимости будет тем выше, чем больше значение t-критерия. Для того чтобы определить по таблице величину уровня значимости, нужно сначала найти число степеней свободы, которое определяется по формуле: ν=N1+N2–2, где ν — число степеней свободы, N1, N2 — число
47
замеров в первом и втором рядах. В рассмотренном нами примере ν=7+7–2=12. Из таблицы находим, что значение для однопроцентного уровня при 12 степенях свободы равно 3,055, т. е. это несколько меньше, чем полученное нами (t=3,69). Следовательно, мы можем сделать статистически обоснованный вывод о том, что эффективность деятельности в группах высокого уровня развития выше, чем в группах низкого уровня развития, при уровне значимости 0,01. Способ, каким в большинстве статей сообщается о статистически значимом различии, выглядит так: (P<0,05), (P<0,01), (P<0,001). Незначимые различия представляются так: (P>0,05), (P>0,01), (P>0,001).
Однако исследователю следует помнить, что существование значимой разности без поддержки другими аргументами вовсе не всегда означает, что за каждым статистическим решением автоматически следует экспериментальный вывод. В серии проверок гипотез могут случайно появляться значимые различия. Поэтому необходимо проявлять большую осторожность при содержательной интерпретации результатов, проводить подтверждающие проверки и применять по возможности другие методы1.
2.2.3. Ранжирование данных и нахождение связей между переменными
|
Среди приемов упорядочения экспериментальных данных наиболее часто используется ранжирование. Ранжирование — это расположение объектов в заданной последовательности, осуществляемое путем присвоения объектам определенных рангов, т. е. порядковых номеров. Ранжированный ряд может быть возрастающим или убывающим. Ранжирование может осуществляться самим экспериментатором на основе полученных им в исследовании оценок, например, исследователь может проранжировать группы в зависимости от их сплоченности при выполнении какого-либо задания. Процедура ранжирования может входить в состав экспериментального задания, и тогда она осуществляется испытуемыми или экспертами, например, учащиеся могут проранжировать своих одноклассников в зависимости от близости их дружеских отношений.
Сопоставление двух ранжированных рядов позволяет установить наличие или отсутствие связи между ними. Связь между двумя переменными в статистике называется корреляцией и выявляется путем подсчета коэффициентов корреляции.
Одним из наиболее часто применяемых коэффициентов корреляции является коэффициент ранговой корреляции Спирмена, который определяется по формуле:
48
где rs — коэффициент корреляции; d — разность между рангами сравниваемых объектов; n — количество сопоставленных пар.
Значение коэффициента корреляции не может выходить за пределы интервала от –1 до +1. В случаях, когда коэффициент корреляции принимает значения, близкие к +1, говорят, что между переменными существует строгая прямая связь. Если коэффициент корреляции принимает значения, близкие к –1, то связь между переменными будет обратной. Если коэффициент корреляции равен или около 0, то связь между переменными отсутствует. При интерпретации коэффициента корреляции, помимо его величины и знака, учитывают также объем выборки, на которой произведено измерение.
Для того чтобы исследователь мог с уверенностью сказать, что между интересующими его переменными существует связь, он должен произвести оценку достоверности (значимости) полученной корреляции. При определении уровня значимости часто пользуются t-критерием Стьюдента, который в данном случае вычисляется по следующей формуле:
Поделитесь с Вашими друзьями: |