Тема 5.2. Свойства нормального распределения
В психологических исследованиях чаще всего ссылаются на нормальное распределение.
Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине - достаточно часто. Нормальным такое распределение называется потому, что оно очень часто встречалось в естественнонаучных исследованиях и казалось "нормой" всякого массового случайного проявления признаков. Это распределение следует закону, открытому тремя учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции. График нормального распределения представляет собой привычную глазу психолога-исследователя так называемую колоколообразную кривую.
Нормальным называется распределение вероятностей непрерывной случайной величины, которое описывается плотностью вероятности:
Нормальный закон распределения также называется законом Гаусса. Нормальный закон распределения занимает центральное место в теории вероятностей. Это обусловлено тем, что этот закон проявляется во всех случаях, когда случайная величина является результатом действия большого числа различных факторов. К нормальному закону приближаются все остальные законы распределения. Можно легко показать, что параметры и , входящие в плотность распределения являются соответственно математическим ожиданием и средним квадратическим отклонением случайной величины Х. График плотности нормального распределения называется нормальной кривой или кривой Гаусса. Нормальная кривая обладает следующими свойствами:
1) Функция определена на всей числовой оси.
2) При всех х функция распределения принимает только положительные значения.
3) Ось ОХ является горизонтальной асимптотой графика плотности вероятности, так как при неограниченном возрастании по абсолютной величине аргумента х, значение функции стремится к нулю.
4) Экстремум функции.
Так как при y’ > 0 при x < m и y’ < 0 при x > m , то в точке х = т функция имеет максимум, равный .
5) Функция является симметричной относительно прямой х = а.
При рассмотрении нормального закона распределения выделяется важный частный случай, известный, как правило трех сигм. Запишем вероятность того, что отклонение нормально распределенной случайной величины от математического ожидания меньше заданной величины D:
Если принять D = 3s, то получаем с использованием таблиц значений функции Лапласа:
То есть вероятность того, что случайная величина отклонится от своего математического ожидание на величину большую, чем утроенное среднее квадратичное отклонение, практически равна нулю. Это правило называется законом трех сигм.
Тема 5.3. Методы оценки типа распределения
Проверка нормальности распределения эмпирических данных помимо использования визуального метода и оценки параметров распределения предполагает применение двойного составного критерия. Метод проверки диктует объем выборки.
Если объем выборки меньше или равен 15, то не нужно использовать параметрические критерии. Если количество измерений больше 15, но меньше 50, то следует применять двойной составной критерий. Для выборок объемом больше 50 рекомендован критерий двойной составной критерий
Двойной составной критерий предназначен для сопоставления двух распределений — эмпирического и нормального. Если эмпирическое распределение удовлетворяет двойному составному критерию, то с вероятностью 0,98 можно считать, что к полученным данным применима нормальная модель распределения.
Пример. Участники однодневного тренинга «Уверенное поведение» оценивали у себя уровень личностной тревожности. Первое измерение проводилось в день тренинга, второе — на следующий после тренинга день. Все изменения оценивались по 10-балльной шкале. Данные представлены в таблице 3. Вопрос: Можно ли утверждать, что полученные эмпирические данные подчиняются закону нормального распределения?
Таблица 3
Данные по личностной тревожности испытуемых до и после тренинга «Уверенное поведение»
ФИО
|
Личностная тревожность
|
до тренинга
|
после тренинга
|
1.И. В. Л.
|
5
|
5
|
2 Я. Е. А.
|
4
|
1
|
3. К С. И
|
4
|
4
|
4 Р М.Н.
|
4
|
4
|
5. Н.М.Т.
|
5
|
4
|
6. Е. Л.П.
|
6
|
5
|
7.Л. К. С.
|
3
|
5
|
8. Т. А. П.
|
6
|
5
|
9. Б. В. В
|
6
|
5
|
10.С М.А
|
5
|
6
|
11. В. П. Р.
|
6
|
6
|
12. Ч. Н. Г.
|
6
|
3
|
13. А.С.П.
|
3
|
1
|
14. В.С.К.
|
4
|
3
|
15. В.П.П.
|
4
|
3
|
16. Л.Г.Т.
|
4
|
4
|
17. Т.И.Ч.
|
4
|
4
|
М
|
4,65
|
4
|
D
|
1,12
|
2,12
|
SD
|
1,06
|
1,46
|
Двойной составной критерий предполагает две проверки. При первой проверяется, попадает ли расчетный коэффициент dэмп. в заданную для нормального распределения область. Если нет, то с вероятностью 0,98 можно считать, что распределение эмпирических данных не соответствует нормальному закону — Но принимается. Если расчетный коэффициент dэмп. попадает в заданную для нормального распределения область, то переходят ко второй проверке.
При втором сравнении необходимо из статистических таблиц взять коэффициент z, соответствующий объему выборки. Далее необходимо рассчитать дисперсию D и найти стандартное отклонение SD, а затем расчетное отклонение s = SD • z. Потом следует сосчитать количество mэмп .случаев, когда │хi - Mx│оказался больше s.
По статистическим таблицам необходимо найти mкр, и если mэмп .меньше mкр., то можно считать распределение эмпирических данных нормальным, в противном случае — нельзя.
До начала тренинга «Уверенное поведение» проведем расчеты для его участников.
Сформулируем гипотезы:
Нулевая гипотеза (Н0) — распределение эмпирической случайной величины данных, измеренных до проведения тренинга, отличается от нормального закона распределения;
Альтернативная гипотеза (Н1) — распределение эмпирической случайной величины подчиняется нормальному закону распределения.
Первое условие
Проведем первое сравнение. Для этого необходимо рассчитать dэмп. Сначала найдем 
Заполним первый столбец таблицы 3,
Просуммируем содержание столбца 1:
Затем найдем D и SD. Для этого возведем разность хдо - до в квадрат и запишем в столбец 2. Подсчитаем сумму:
Поделим ее на п — 1 = 17 — 1 = 16. Получим D = 1,12.
Возьмем квадратный корень из D:
Пользуясь формулой dэмп. рассчитываем
и получаем dэмп. = 0,9.
С помощью статистических таблиц определим d1 и d2 соответствующие объему выборки. Если dэмп> d2, а dэмп> d1 то можно переходить ко второму сравнению.
d2= 0,6829, d1 = 0,9137. 0,9 > 0,6829 и 0,9 < 0,9137. Значит, dэмп удовлетворяет первому условию.
Второе условие
Найдем z из статистических таблиц для объема выборки п = 17
z = 2,58.
Рассчитаем вспомогательное значение s, воспользовавшись рассчитанным стандартным отклонением SD, s=SD · z:
s = 1,057·2,58 = 1,92.
Заполним третий столбец таблицы для расчета SD. Если значение в столбце 1 будет больше рассчитанного s = 1,92, то пишем 1, если нет, то 0. Считаем сумму mэмп ячеек столбца 3: mэмп =0
По статистической таблице находим mкр: mкр=1
Сравниваем mкр и mэмп: mкр > mэмп.
Значит, второе условие выполняется, а следовательно, принимается гипотеза Н1.
Ответ: Принимается гипотеза Н1. Данные учащихся до исследования можно считать распределенными по нормальному закону. Более подробно с двойным составным критерием можно ознакомиться, используя дополнительную литературу [2].
Раздел 6. Понятие норм и стандартов в психологии
Тема 6.1. Виды стандартных шкал в психологии
Показатели психометрических тестов, применяемых в практической психологии с целью постановки психологического диагноза переводятся из первичных ("сырых" - не подвергнутых обработке) и полученных испытуемым по данному тесту в стандартные показатели, которые рассчитываются на основе линейного или нелинейного преобразования первичных показателей (при условии их распределения близкого к нормальному закону). При этом исторически сложилось наличие ряда наиболее распостраненных стандартных показателей, связанных с особенностями преобразования. К наиболее известным и используемым стандартным шкалам относятся:
1.Шкала стенов или с-показателей (от англ. standart ten), созданная Кеттелом и используемая в опроснике 16 PF. M = 5,5; σ = 2; с принадлежит интервалу от 1 до 10.
2.Шкала станайнов (от англ. standart nine), созданная Гилфордом M = 5; σ = 2; с принадлежит интервалу от 1 до 9.
3. Шкала IQ-показателей Векслера. M = 100; σ = 15; IQ принадлежит интервалу от 40 до 160.
4. Z-шкала Амтхауэра M = 100; σ = 10; Z принадлежит интервалу от 60 до 140.
5. Т шкала Маккола. M = 50; σ = 10; Т принадлежит интервалу от 10 до 90.
Другие виды стандартных шкал представлены на рис. 9. О них можно прочитать в основной литературе [3].
Рис. 9 Соотношения различных типов тестовых показателей при нормальном распределении
Тема 6.2. Условия и методы стандартизации шкал.
Переход от исходной шкалы в которой представлены психологические показатели к стандартной осуществляется с помощью Z-шкалы.
Z-шкала образуется в результате центрирования,понимаемого как линейная трансформация величин признака,при которой средняя величина распределения становится равная нулю и процедуры нормирования посредством среднеквадратических отклонений.
Z-шкала состоит из неприрывного континиума Z-показателей, определяемых в виде разности между индивидуальными первичными результатами и средним значением для генеральной совокупности,деленные на стандартное отклонение распределения:
где х - необработанные ("сырые") баллы; - среднее; σ - стандартное отклонение.
При этом полученная Z- шкала будет иметь среднюю точку М=0 и единицу измерения (масштаб) 16 стандартного (единичного) нормального распределения как показано на рис.9.
Z-показатель может принимать как положительные, так и отрицательные значения. Большинство случаев (99,72 %) значения Z-показателей умещается в пределах -3 < М > +3 и могут принимать любые значения. К достоинствам Z-показателя относится простота интерпретации и сравнения индивидуальных результатов: чем больше показатель, тем дальше от среднего (нормы) он может находиться, при этом знак указывает ( + ) - выше среднего; ( - ) – ниже среднего. Но недостатки, особенно в области прикладной (практической) психологии, к которым относят: сложность интерпретации для испытуемого (клиента),крупность масштаба единиц измерения, оперирование отрицательными и положительными величинами, побудили разработчиков тестов использовать нормализованные преобразования по формуле:
Zp = А + b Z ,
где Zp -преобразованный стандартный показатель; b - стандартное отклонение преобразованного распределения - Z-показатель; А - среднее значение преобразованного распределения. Такой переход правомерен, так как стандартная шкала представляет собой интервальную шкалу, что позволяет выполнять линейные преобразования, при условии что константы b и А – действительные числа.
Раздел 7. Индуктивная статистика
Тема 7.1. Основной метод индуктивной статистики
Основная задача индуктивной статистики, или теории статистического вывода связана с выявлением различий между показателями двух или нескольких распределений.
Выявление существенных различий позволит объяснить их действием независимой переменной, или фактора, а не случайностью, связанной с малым объемом выборки.
Основным инструментом индуктивной статистики является метод проверки статистических гипотез.
Принцип метода состоит в том, что выдвигается нулевая гипотеза H0 с тем, чтобы доказать или опровергнуть ее и тем самым подтвердить альтернативную гипотезу (H1).
Нулевая гипотеза - это гипотеза об отсутствии различий. Она обозначается как H0 и называется нулевой потому, что содержит число 0: X1- Х2=0, где X1, X2 - сопоставляемые значения признаков.
Нулевая гипотеза - это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий.
Альтернативная гипотеза - это гипотеза о значимости различий. Она обозначается как H1. Альтернативная гипотеза - это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной гипотезой. Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.
Направленные гипотезы
H0: X1 не превышает Х2
H1: X1 превышает Х2
Ненаправленные гипотезы
H0: X1 не отличается от Х2
Н1: Х1 отличается от Х2
Построим схему - классификацию статистических гипотез.
Рис. 9 Виды статистических гипотез
Проверка гипотез осуществляется с помощью критериев статистической оценки различий.
Проверка статистической гипотезы осуществляется с помощью статистического критерия в соответствии с определенным алгоритмом.
Критерии делятся на параметрические и непараметрические.
Параметрические критерии – критерии, включающие в формулу расчета параметры распределения, то есть средние и дисперсии (t – критерий Стьюдента, критерий F Фишера и др.)
Непараметрические критерии - критерии, не включающие в формулу расчета параметров распределения и основанные на оперировании частотами или рангами (критерий Q-Розенбаума, Т-критерий Вилкоксона и др.). И те, и другие критерии имеют свои преимущества и недостатки. На основании нескольких руководств можно составить таблицу, позволяющую оценить возможности и ограничения тех и других.
Таблица 4
Возможности и ограничения параметрических
и непараметрических критериев
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
|
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
|
1.Позволяют прямо оценить различие в средних, полученных в двух выборках (t - критерий Стьюдента).
|
Позволяют оценить лишь средние тенденции, например, ответить на вопрос, чаще ли в выборке А встречаются более высокие, а в выборке Б более низкие значения признака (критерии Q, U, φ* и др.).
|
2.Позволяют прямо оценить различия в дисперсиях (критерий Фишера).
|
Позволяют оценить лишь различия в диапазонах вариативности признака (критерий φ*).
|
3.Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный анализ), но лишь при условии нормального распределения признака.
|
Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерии тенденций L и S).
|
4.Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ).
|
Эта возможность отсутствует.
|
5.Экспериментальные данные должны отвечать двум, а иногда трем, условиям:
а)значения признака измерены по интервальной шкале;
б) распределение признака является нормальным;
в) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса.
|
Экспериментальные данные могут не отвечать ни одному из этих условий:
а)значения признака могут быть представлены в любой шкале, начиная от шкалы наименований;
б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке;
в) требование равенства дисперсий отсутствует.
|
6.Математические расчеты довольно сложны.
|
Математические расчеты по большей части просты и занимают мало времени
(за искл. критериев χ2 и λ).
|
7.Если условия, перечисленные в п.5, выполняются, параметрические критерии оказываются несколько более мощными, чем непараметрические.
|
Если условия, перечисленные в п.5, не выполняются, непараметрические критерии оказываются более мощными, чем параметрические, так как они менее чувствительны к «засорениям».
|
Мы видим, что параметрические критерии могут оказаться несколько более мощными, чем непараметрические, но только в том случае, если признак измерен по интервальной шкале и нормально распределен. С интервальной шкалой есть определенные проблемы. Лишь с некоторой натяжкой мы можем считать данные, представленные не в стандартизованных оценках, как интервальные. Кроме того, проверка распределения "на нормальность" требует достаточно сложных расчетов, результат которых заранее неизвестен. Может оказаться, что распределение признака отличается от нормального, и нам так или иначе все равно придется обратиться к непараметрическим критериям.
Непараметрические критерии лишены всех этих ограничений и не требуют таких длительных и сложных расчетов. По сравнению с параметрическими критериями они ограничены лишь в одном - с их помощью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака. Эту задачу может решить только дисперсионный двухфакторный анализ.
Тема 7.2. Параметрические критерии
t-критерий Стьюдента
t-критерий Стьюдента является одним из самых мощных и часто используется при анализе результатов исследования. Для t-критерия должны быть соблюдены три условия: шкала измерения не ниже интервальной, нормальное распределение данных и одинаковая дисперсия выборок.
t-критерий Стьюдента существует в нескольких модификациях: для связанной выборки, для несвязанной выборки и для определения значимости различия вероятностей появления событий. Рассмотрим все три модификации.
Рассмотрим t-критерий Стьюдента для связанных выборок
t-критерий для связанных выборок, или, иначе говоря, для зависимых измерений, используется для определения вероятности того, что наблюдаемое различие между двумя условиями для одних и тех же участников обусловлено случаем
Вернемся к примеру в Теме 5.3. и продолжим его анализ. Как было выяснено в ходе расчетов выше, полученные в примере А данные имеют нормальное распределение и выборочные дисперсии значимо не отличаются. Если уже известно, что распределение данных и до и после одинаково и является нормальным, а дисперсии выборок не отличаются, то для поиска различий возможно использование t-критерия Стьюдента.
Вопрос: Различаются ли средние показатели участников до и после тренинга?
Сформулируем гипотезы:
Нулевая H0 — средние двух выборок различаются незначимо (различия в средних выборок случайны);
Альтернативная H1— средние двух выборок различаются значимо (различия в средних выборок не случайны).
Для наглядности скопируем таблицу 3, добавив к ней 2 столбца для проведения расчетов.
Сосчитаем разность между Xдо и Хпосле и занесем в таблицу 5 (δ= (Xдо - Хпосле) найдем сумму δ. Возведем δ в квадрат, запишем в таблицу 5 и найдем сумму δ 2.
Таблица 5
Расчет t-критерия Стьюдента
ФИО
|
Расчетные данные
|
Xдо
|
Хпосле
|
δ
|
δ 2
|
1.И. В. Л.
|
5
|
5
|
0
|
0
|
2 Я. Е. А.
|
4
|
1
|
3
|
9
|
3. К С. И
|
4
|
4
|
0
|
0
|
4 Р М.Н.
|
4
|
4
|
0
|
0
|
5. Н.М.Т.
|
5
|
4
|
1
|
1
|
6. Е. Л.П.
|
6
|
5
|
1
|
1
|
7.Л. К. С.
|
3
|
5
|
-2
|
4
|
8. Т. А. П.
|
6
|
5
|
1
|
1
|
9. Б. В. В
|
6
|
5
|
1
|
1
|
10.С М.А
|
5
|
6
|
-1
|
1
|
11. В. П. Р.
|
6
|
6
|
0
|
0
|
12. Ч. Н. Г.
|
6
|
3
|
3
|
9
|
13. А.С.П.
|
3
|
1
|
2
|
4
|
14. В.С.К.
|
4
|
3
|
1
|
1
|
15. В.П.П.
|
4
|
3
|
1
|
1
|
16. Л.Г.Т.
|
4
|
4
|
0
|
0
|
17. Т.И.Ч.
|
4
|
4
|
0
|
0
|
Сумма
|
|
|
S1=11
|
S2=33
|
Затем находим среднюю разность , стандартное отклонение , рассчитываем определяем размерность системы df = n-1 = 16 Найдем по стандартным таблицам эмпирическое значение критерия tэмп(1,85) ≤t0,05(2,12)
Ответ: Принимается нулевая гипотеза (Но). Средние значения отличаются незначимо. Значимых различий между выборками не найдено.
На основании анализа расчетов можно заключить, что результаты участников тренинга относятся к одной генеральной совокупности, а значит, влияние тренинга на изменение личностной тревожности незначительное.
t-критерий Стъюдента для несвязанных выборок используется для определения того, является различие в распределении значений между двумя группами случайным или статистически значимым. Для вычисления t-критерия Стьюдента используется следующая формула:
где М — среднее значение по выборке,
где стандартное отклонение.
Более подробно с критерием можно познакомиться, используя дополнительную литературу [2].
F - критерий Фишера
F-критерий Фишера используют для сравнения дисперсий двух вариационных рядов. Он вычисляется по формуле:
,
где - большая дисперсия, - меньшая дисперсия.
Если вычисленное значение критерия F больше критического для определенного уровня значимости и соответствующих чисел степеней свободы для числителя и знаменателя, то дисперсии считаются различными.
Число степеней свободы числителя определяется по формуле:
где число вариант для большей дисперсии.
Число степеней свободы знаменателя определяется по формуле:
где  - число вариант для меньшей дисперсии.
Пример. При измерении величины газообмена в опытной (n1=10) и контрольной (n2=10) группах животных были получены соответственно следующие величины дисперсий - =163.9 и =89.3. Значение критерия F составило 1.84 (p>0,05), следовательно, различие в изменчивости процесса газообмена в опытной и контрольной группах животных можно считать несущественным.
F-критерий Фишера направлен на определение равенства дисперсий двух выборок. Данный критерий может служить первичным способом выявления различий в показателях двух выборок и применяется для получения предварительного ответа на вопрос: принадлежат ли обе выборки одной генеральной совокупности? Этот критерий проверяет равенство в двух выборках одного параметра нормального распределения — дисперсии. Второй параметр проверяет t-критерий Стьюдента.
Если критерий Фишера указывает на то, что дисперсии двух выборок различаются, это основание полагать, что различия между выборками значимы.
Сравнение двух выборочных дисперсий осуществляется следующим образом. Вычисляется эмпирическое дисперсионное отношение.
где D1 и D2 всегда выбираются таким образом, что объем выборки с D1 >D2 п1 — объем выборки с D1,а п2 — объем выборки с D2.
Далее по стандартным таблицам определяется F ст для проверяется условие Fэмп≤F0,05 - в этом случае дисперсии различаются лишь случайным образом (гипотеза о равенстве дисперсий подтверждается). Если Fэмп≤Fст то различия не случайны (гипотеза о значимом различии дисперсий подтверждается).
Продолжим рассмотрение примера.
Значимо ли различие дисперсии данных у участников до и после тренинга?
Сформулируем гипотезы:
Нулевая (H0) - дисперсии значимо не различаются (различия в дисперсиях выборок случайны);
Альтернативная (H1) - различие дисперсий значимо (различия в дисперсиях выборок не случайны).
Ранее мы уже рассматривали этот пример и с помощью двойного составного критерия определили, что распределение показателей может считаться нормальным. Также нами были вычислены дисперсии результатов до и после тренинга: Dдо=1,12, Dпосле=2,12. n1 = n2 = 17;
В статистической таблице находим статистическое значение критерия: F0,05 = 2,33. Fэмп≤F0,05 значит, гипотеза о том, что различия в дисперсиях незначительны, подтверждается.
Ответ: Принимается H0. Различия в дисперсиях выборок случайны.
Поделитесь с Вашими друзьями: |