Конспект лекций раздел Предмет и методы математической статистики Тема Место и роль статистического анализа в экспериментально-психологическом исследовании и психологической практике



страница1/7
Дата15.05.2016
Размер2.83 Mb.
ТипКонспект
  1   2   3   4   5   6   7
2. КОНСПЕКТ ЛЕКЦИЙ

Раздел 1. Предмет и методы математической статистики
Тема 1.1. Место и роль статистического анализа в экспериментально-психологическом исследовании и психологической практике.

Математическая статистика - наука, изучающая методы раскрытия закономерностей, свойственных большим совокупностям однородных объектов, на основании их выборочного обследования. Основные задачи статистических методов, состоят в том, чтобы обобщить и представить количественные данные исследования в систематизированной и сжатой форме, позволяющей увидеть основные тенденции закономерности и законы развития человека, а так же отклонения от них.

Очень часто перед исследователем в психологии стоит задача выявления различий между двумя, тремя и более выборками испытуемых. Это может быть, например, задача определения психологических особенностей хронически больных детей по сравнению со здоровыми, юных правонарушителей по сравнению с законопослушными сверстниками, или различий между работниками государственных предприятий и частных фирм, между людьми разной национальности или разной культуры и, наконец, между людьми разного возраста в методе «поперечных срезов».

При решении задач выявления различий в уровневых показателях следует помнить, что "усредненный профиль успешного специалиста" должен рассматриваться скорее как исследовательский результат, позволяющий сформулировать гипотезы для дальнейших исследований, а не как основание для профессионального отбора. Тому есть две причины. Во-первых, ни у одного из успешных специалистов не наблюдаться "усредненный профиль", он, в сущности, является обобщением; во-вторых, в профессиональной деятельности наличие собственного индивидуального стиля важнее соответствия "среднегрупповому" профилю.

В психологических исследованиях часто бывает важно доказать, что в результате действия каких-либо факторов произошли достоверные изменения ("сдвиги") в измеряемых показателях. К числу таких факторов должен быть отнесен прежде всего фактор времени. Сопоставление показателей, полученных у одних и тех же испытуемых по одним и тем же методикам, но в разное время, дает нам временной сдвиг.

Сопоставление показателей, полученных по одним и тем же методикам, но в разных условиях измерения (например, "покоя" и "стресса"), дает нам ситуационный сдвиг. Условия измерения могут изменяться не только реально, но и умозрительно. Сопоставляя показатели, измеренные в обычных и воображаемых условиях, мы получаем умозрительный сдвиг.

Мы говорим о сдвиге под влиянием контролируемых или не контролируемых воздействий. И здесь мы наталкиваемся на методическую трудность, которую оказывается возможным преодолеть только путем введения контрольной группы, которая не испытывала бы на себе воздействия данного экспериментального фактора.


Тема 1.2. Разделы математических методов в психологии

Разделы математической статистики:

  1. Методы описательной статистики – данные исследования представляются в виде таблиц, графиков, подсчитывается первичная статистика: среднее значение, мода, медиана, дисперсия, стандартное отклонение, асимметрия, эксцесс

  2. Методы индуктивной статистики – помогают исследовать значимость различий между выборками с точки зрения статистических критериев.

  3. Корреляционные методы – позволяют узнать о наличии и степени связи между двумя и более переменными с тем, чтобы можно было предсказать возможное значение одной их них, если известна другая.

  4. Дисперсионный анализ позволяет проанализировать причины изменчивости признака под влиянием какой-либо контролируемой переменной. Он позволяет вычленить следующие виды вариативности:

вариативность, обусловленную действием каждой из исследуемых переменных; вариативность, обусловленную взаимодействием исследуемых независимых переменных; случайную вариативность.

5. Регрессионный анализ позволяет выявить характер зависимости одной переменной (зависимой, или результативного признака) от других (независимых переменных, или факторов).

6. Факторный анализ позволяет выявить латентные, скрытые переменные, или факторы, обусловливающие множественные корреляционные связи.

7. Кластерный анализ – многомерный статистический метод, позволяющий ответить на вопрос: объединены ли показатели, или испытуемые по какому-либо основанию или признаку.


Тема 1.3. Задачи математических методов в психологии

Математическая статистика - наука о математических методах анализа данных, полученных при проведении массовых наблюдений (измерений, опытов). В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы. Существенная часть статистики математической основана на вероятностных моделях. Выделяют общие задачи описания данных, оценивания и проверки гипотез. Рассматривают и более частные задачи, связанные с проведением выборочных обследований, восстановлением зависимостей, построением и использованием классификаций (типологий). Для описания данных строят таблицы, диаграммы, иные наглядные представления, например, корреляционные поля. Вероятностные модели обычно не применяются. Некоторые методы описания данных опираются на продвинутую теорию и возможности современных компьютеров. К ним относятся, в частности, кластер-анализ, нацеленный на выделение групп объектов, похожих друг на друга, и многомерное шкалирование, позволяющее наглядно представить объекты на плоскости, в наименьшей степени исказив расстояния между ними. Методы оценивания и проверки гипотез опираются на вероятностные модели порождения данных. Эти модели делятся на параметрические и непараметрические. В параметрических моделях предполагается, что изучаемые объекты описываются функциями распределения, зависящими от небольшого числа (1-4) числовых параметров. В непараметрических моделях функции распределения предполагаются произвольными непрерывными. В статистике оценивают параметры и характеристики распределения (математическое ожидание, медиану, дисперсию, квантили и другие), плотности и функции распределения, зависимости между переменными (на основе линейных и непараметрических коэффициентов корреляции, а также параметрических или непараметрических оценок функций, выражающих зависимости). Используют точечные и интервальные (дающие границы для истинных значений) оценки. В статистике есть общая теория проверки гипотез и большое число методов, посвященных проверке конкретных гипотез. Рассматривают гипотезы о значениях параметров и характеристик, о проверке однородности (то есть о совпадении характеристик или функций распределения в двух выборках), о согласии эмпирической функции распределения с заданной функцией распределения или с параметрическим семейством таких функций, о симметрии распределения и другие.


Раздел 2. Элементы теории психологических измерений
Тема 2.1. Измерение в психологии

Использованием, применением измерений в психологии занимается психометрика.

В самом общем виде измерение – это процедура приписывания объектам и их свойствам чисел в соответствии с определенными правилами. Это операция, посредством которой определяется отношение одной (измеряемой) величины к другой однородной величине (принимаемой за единицу); число, выражающее такое отношение, называется численным значением измеряемой величины.

Измерение в психологии можно определить как процедуру определения наличия и степени выраженности какого-либо психологического свойства или признака объекта.

Законченное измерение включает следующие элементы: объект измерения, свойство или состояние которого характеризует измеряемая величина; единицу измерения; технические средства измерения, проградуированные в выбранных единицах; метод измерения; наблюдателя или регистрирующее устройство, воспринимающее результат измерения; окончательный результат измерения. Всякое измерение неизбежно связано с погрешностями измерений. Погрешности, порожденные несовершенством метода измерения, неточной градуировкой и неправильной установкой измерительной аппаратуры, называют систематическими. Систематические погрешности исключают введением поправок, найденных экспериментально. Погрешности другого типа - случайные - обусловлены влиянием на результат измерения неконтролируемых факторов. Случайные погрешности оцениваются методами математической статистики по данным многократных измерений.

Измерения можно провести с помощью различных шкал. Выделяют четыре характеристики шкал: описание, порядок, расстояние и наличие начальной точки. Описание предполагает использование единственного дескриптора или опознавателя для каждой градации в шкале. Порядок характеризует относительный размер дескрипторов. Не все шкалы обладают характеристиками порядка. Считается, что шкала имеет начальную точку, если она имеет единственное начало или нулевую точку. Например, возрастная шкала имеет истинную нулевую точку. Однако не все шкалы обладают нулевой точкой для измеряемых свойств. Часто они имею только произвольную нейтральную точку.



Тема 2.2. Средства психологических измерений

Выделяют четыре уровня измерения, определяющих тип шкалы измерений: наименований, порядка, интервальный и отношений. Их относительная характеристика дается в таблице 1.

Таблица 1

Характеристика шкал различного типа


Уровень измерений

Характеристики шкал

Описание


Порядок


Расстояние


Наличие начальной точки

Шкала наименований

*










Шкала

порядка


*

*







Шкала интервалов

*

*

*




Шкала отношений

*

*

*

*



Шкала наименований обладает только характеристикой описания; она ставит в соответствие описываемым объектам только его название, никакие количественные характеристики не используются. Объекты измерения распадаются на множество взаимоисключающих и исчерпывающих категорий. Шкала наименований устанавливает отношения равенства между объектами, которые объединяются в одну категорию. Каждой категории дается название, численное обозначение которого является элементом шкалы. Очевидно, что измерение на этом уровне всегда возможно.

Шкала порядка разрешает ранжировать респондентов или их ответы. Она имеет свойства шкалы наименований в сочетании с отношением порядка. Иными словами, если каждую пару категорий шкалы наименований упорядочить относительно друг друга, то получится порядковая шкала. Для того чтобы шкальные оценки отличались от чисел в обыденном понимании, их на порядковом уровне называют рангами. Например, частоту покупки определенного товара (раз в неделю, раз в месяц или чаще). Однако такая шкала указывает только относительную разницу между измеряемыми объектами.

Интервальная шкала обладает также характеристикой расстояния между отдельными градациями шкалы, измеряемого с помощью определенной единицы измерений, то есть используется количественная информация. На этой шкале уже не бессмысленны разности между отдельными градациями шкалы. В данном случае можно решить, равны они или нет, а если не равны, то какая из двух больше. Шкальные значения признаков можно складывать.

Шкала отношений является единственной шкалой, имеющей нулевую точку, поэтому можно проводить количественное сравнение полученных результатов. Такое дополнение позволяет вести речь о соотношении (пропорции). Выбранная шкала измерений определяет характер информации, которой будет располагать исследователь при проведении изучения какого-то объекта. Но скорее следует говорить о том, что выбор шкалы для измерений определяется характером отношений между объектами, наличием информации и целями исследования. Если, скажем, нам требуется проранжировать марки продуктов, то, как правило, не требуется определять, насколько одна марка лучше другой. Следовательно, нет необходимости при таком измерении пользоваться количественными шкалами (интервалов или отношений). Кроме того, тип шкалы предопределяет, какой вид статистического анализа можно или нельзя использовать. При использовании шкалы наименований возможно нахождение частот распределения, средней тенденции по модальной частоте, вычисление коэффициентов взаимозависимости между двумя или большим числом рядов свойств, применение непараметрических критериев проверки гипотез. Среди статистических показателей на порядковом уровне пользуются показателями центральной тенденции – медианой, квартилями и другие. Для выявления взаимозависимости двух признаков используются коэффициенты ранговой корреляции Спирмена и Кендэла. Кроме рассмотренных выше алгебраических операций интервальные шкалы допускают все статистические операции, присущие порядковому уровню; возможны также вычисления средней арифметической, дисперсии так далее. Вместо ранговых коэффициентов корреляции вычисляется коэффициент парной корреляции Пирсона. Может также быть рассчитан множественный коэффициент корреляции. Надо иметь в виду, что полученные результаты всегда можно перевести в более простую шкалу, но никогда наоборот.
Раздел 3. Измерение признака и статистическая совокупность
Тема 3.1. Формы группирования данных в психологическом исследовании

Наиболее простой формой группировки количественных данных психологического исследования является ранжированный ряд значений переменной. Он строиться на основе операции ранжирования или упорядочивания значений переменной в возрастающем или убывающем порядке (от французского слова «ranger» - выстраивать по росту).

Так, мы можем упорядочить данные группы испытуемых, чтобы оценить успешность конкретного ученика. Ранжированный ряд значений позволит увидеть ранг или место испытуемого в упорядоченном ряду.

Если ранжированный ряд значений расположить в «сжатом» виде – в виде двойного ряда: ряда значений переменной без учета их повторяемости и ряда соответствующих им частот.

Такой ранжированный ряд значений переменной с указанием частоты отдельных значений называется вариационным рядом.

Вариационный ряд как форма представления данных позволяет определить распределение, оценить характер варьирования переменной.

Если выборка испытуемых значительна, имеет смысл дальнейшее обобщение данных. Для этого используется построение распределения сгруппированных частот. Оценки, полученные испытуемыми объединяются в группы (разряды оценок), а каждому разряду приписывается частота, соответственно число испытуемых попавших в интервал.

Число разрядов зависит от объема выборки следующим образом

(Таблица 2).

Таблица 2



Число разрядных интервалов в зависимости от объема выборки


Объем выборки

25-40

40-60

60-100

100-200

более 200

Число интервалов

5-6

6-8

7-10

8-12

10-15

Алгоритм построения распределения сгруппированных частот включает следующие этапы:



  1. Определение размаха.

  2. Выбор интервала разрядов в зависимости от объема выборки.

  3. Определение границ разрядов.

  4. Табулирование.


Тема 3.2. Графические формы представления распределений

График – это чертёж, применяемый для наглядного изображения зависимости одной величины от другой.

Графики представляют собой наборы двумерных, трехмерных, тернарных или n-мерных графиков (таких как гистограммы, диаграммы рассеяния, линейные графики, поверхности, тернарные диаграммы рассеяния и пр.), по одному графику для каждой выбранной категории (подмножества) наблюдений.

Чтобы придать наглядность закономерности варьирования переменной, вариационные ряды представляют в графической форме: в виде гистограмм и полигонов распределений.



Гистограмма представляет собой последовательность столбцов, каждый из которых опирается на один разрядный интервал, а его высота отражает частоту в соответствующем разряде.

Полигон распределения строится через нанесение на ось абсцисс средних значений классов, на ось ординат – соответствующих частот и соединение точек кривой.

График распределения наглядно показывает, какие именно конкретные значения или диапазоны значений исследуемой переменной встречаются наиболее часто, насколько различаются эти значения, расположено ли большинство наблюдений около среднего значения, является распределение симметричным или асимметричным, многомодальным или одномодальным и т.д. По форме распределения можно судить о природе исследуемой переменной. Например, бимодальное распределение позволяет предположить, что выборка не является однородной и содержит наблюдения, принадлежащие двум различным множествам, которые в свою очередь нормально распределены.

Многие статистики основываются на определенных предположениях о распределениях анализируемых переменных; гистограммы и полигоны уже позволяют проверить, выполняются ли эти предположения.

Как правило, работа с новым набором данных начинается с построения гистограмм всех переменных.

Для наглядности статистическое распределение значения признака всегда иллюстрируется полигоном распределения или гистограммой (Рис. 1).






Рис. 1 Полигон и гистограмма статистического распределения

Раздел 4. Параметры распределения
Тема 4.1. Центральная тенденция распределения

К основным количественным характеристикам эмпирических распределений относятся меры центральной тенденции, меры разброса, меры асимметрии и эксцесса.

Меры центральной тенденции указывают единственный наиболее типичный, репрезентативный результат, характеризующий выполнение теста всей группой. Меры центральной тенденции различаются неодинаковой математической строгостью и методами вычисления.

Это мода, медиана и среднее арифметическое.



  1. Модой (Мо) называют значение переменной, имеющее в совокупности данных наибольшую частоту. Распределение с двумя модами называется бимодальным.

  2. Медиана (Ме) – это значение переменной, которое делит пополам ранжированный ряд значений переменной. Таким образом, одна половина выборки имеет значения ниже медианы, вторая – выше.

  3. Среднее арифметическое (оценка математического ожидания) вычисляется по формуле:



где xi - каждое наблюдаемое значение признака; i - индекс, указывающий на порядковый номер данного значения признака; n - количество наблюдений; ∑- знак суммирования.

Среднее арифметическое является наиболее строгой математически мерой центральной тенденции и чаще всего используется в статистике.
Тема 4.2. Разброс

Одна из главных задач психологии – прогнозировать, объяснять причины и влиять на изменчивость психологических характеристик. Между тем, средняя арифметическая показывает типичный, репрезентативный результат, но не говорит о диапазоне варьирования.Одна и та же средняя величина может характеризовать совокупности данных, в которых размеры вариации признака значительно отличаются друг от друга.

Меры разброса – это статистические показатели вариациизначений переменной относительно среднего значения. Они показывают степень индивидуальных отклонений от центральной тенденции распределения и позволяют судить о степени однородности-разнородности выборки.

В исследования используют три меры разброса.

1. Размах вариации (R). Это разность между максимальным и минимальным значениями выборки.

2. Дисперсия определяется по формуле:






где xi - каждое наблюдаемое значение признака; - среднее арифметическое значение признака; n - количество наблюдений.

3. Стандартное отклонение (σ). Величина, представляющая собой квадратный корень из несмещенной оценки дисперсии (S), называется стандартным отклонением или средним квадратическим отклонением. Для большинства исследова­телей привычно обозначать эту величину греческой буквой σ (сигма), а не S. На самом деле, σ - это стандартное отклонение в генеральной совокупности, a S - несмещенная оценка этого параметра в исследован­ной выборке. Но, поскольку S - лучшая оценка σ, эту оценку стали часто обозначать уже не как S, а как σ:





Рис.2 Кривые распределения признака с меньшим диапазоном вариативности признака (1) и большим диапазоном вариативности признака (2)

Тема 4.3. Асимметрия и эксцесс распределения

В тех случаях, когда какие-нибудь причины благоприятствуют более частому появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторон­ней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней, или отрица­тельной - более высокие (см. Рис 2).

Показатель асимметрии (A) вычисляется по формуле:


Рис. 3 Кривые распределения признака с положительной (левосторонней) асимметрией (1) и отрицательной (правосторонней) асимметрией (2)

В тех случаях, когда какие-либо причины способствуют преиму­щественному появлению средних или близких к средним значений, об­разуется распределение с положительным эксцессом. Если же в рас­пределении преобладают крайние значения, причем одновременно и бо­лее низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное (Рис.4).

Показатель эксцесса (E) определяется по формуле:




Рис. 4. Эксцесс: а) положительный; 6) отрицательный
В распределениях с нормальной выпуклостью E=0.
Раздел 5. Виды и оценка законов распределения
Тема 5.1. Виды распределений в психологическом исследовании

Рассмотрим неотрицательную функцию f(х), f(х)0.

Кривая у=f(х) является графиком функции f(х). Так как f(х) 0, то каждая точка графика либо принадлежит, либо лежит выше оси Ох. Рассмотрим на оси Ох интервал (,) и криволинейную трапецию ВА, площадь которой обозначим SВА. Пусть Х – некоторая непрерывная случайная величина. Рассмотрим событие: Х(,), или, что то же самое . Это событие имеет определенную вероятность Р().

Рис 5.

Неотрицательная функция f(х) называется плотностью распределения вероятности случайной величины Х. Если вероятность события ВА криволинейной трапеции для любого интервала (.



Имеем: Р() = SВА

Из школьного курса алгебры известно, что площадь криволинейной трапеции SВА равна определенному интегралу от функции f(х) в пределах от  до . Следовательно, Р() =

Распределение непрерывной случайной величины Х характеризуется плотностью f(х). График у=f(х) плотности называется кривой распределения.

Нормальное распределение.

Говорят, что случайная величина Х распределена нормально, если плотность распределения вероятностей этой величины имеет вид:



Здесь е – основание натурального логарифма: e  2,7. Числа а и - параметры распределения: а – математическое ожидание, - среднее квадратичное отклонение величины Х.

График функции (рис.6) называется нормальной кривой. Он симметричен относительно прямой х=а и имеет вид, показанный на рисунке. Важность изучения нормального распределения объясняется тем, что многие с практической точки зрения важные признаки различных явлений имеют нормальное распределение: результаты измерений однотипных объектов, например,

Рис.6


веса людей; величины, связанные с контролем качества определенного вида продукции; время работы однотипных приборов до выхода их из строя и т.п.

Вычисления показывают, что в случае нормального распределения

Р (а-σ Х а +σ) 0,68, Р (а-2σ Х а +2σ) 0,95, Р (а-3σ Х а +3σ) 0,997.

Это значит, что 68% значений нормально распределенной величины Х отстоит от а не более, чем на ; 95% значений Х содержится в интервале (а-2 +2); 99,7% значений Х содержится в интервале (а-3 +3), т.е. практически все значения нормально распределенной случайной величины Х отстоят от математического ожидания не далее, чем на 3.

Этот вывод получил в теории вероятностей название закона трех сигм.
Равномерное распределение.

Говорят, что случайная величина Х, принимающая значение в интервале , распределена равномерно, если ее плотность постоянна: f(х) = С = соnst. Поскольку

Р(Х) =1, то 1=SАВ=(·c. Следовательно, с =. Для равномерного распределения имеем: а = М(Х)=

Рис. 7


Показательное распределение.

Плотность распределения вероятностей показательного распределения имеет вид:

f(х)=

График показательного распределения показан на рисунке. При х+ график неограниченно приближается к оси Ох. Число  есть параметр распределения.

Рис. 8

Для показательного распределения доказывается:



а =М(Х)= , дисперсия D(Х) = и (Х)=


Каталог: 2013
2013 -> 1. Предмет философии и структура философского знани
2013 -> Тесты для диагностики уровня агрессивности у воспитанников, критерии эффективности психолого-педагогической работы; подробно описываются пути и средства достижения положительного результата
2013 -> Внутрибольничное агрессивное поведение психически больных и пути его профилактики. 14. 01. 06 психиатрия
2013 -> Факторы риска патологической агрессии у больных с аффективными расстройствами 14. 01. 06 Психиатрия (мед науки)
2013 -> Пособие по обучению и воспитанию детей-инвалидов с умеренной и выраженной умственной отсталостью в условиях семьи
2013 -> Активность личности, деятельность
2013 -> «ха­рактер» означает «чеканка»,
2013 -> Сведения о цбс


Поделитесь с Вашими друзьями:
  1   2   3   4   5   6   7


База данных защищена авторским правом ©dogmon.org 2017
обратиться к администрации

    Главная страница