Последовательное исключение гипотез в экспериментах
со сходящимися операциями
Гипотезы до эксперимента 1:
Характеристика слова Экспер.1: используем другие нейтраль-
Перцептивная защита ные и вульгарные слова.
Непроизвольное подавление реакции
Произвольное подавление реакции
Гипотезы после эксперимента 1:
Перцептивная защита Экспер.2: применяем регистрацию КГР.
Непроизвольное подавление реакции
Произвольное подавление реакции
Гипотезы после эксперимента 2:
Непроизвольное подавление реакции Экспер.3: пол экспериментатора и испы-
Произвольное подавление реакции туемого (разный или тот же)
Гипотеза после эксперимента 3:
Произвольное подавление реакции
Теперь нам необходимо провести ряд экспериментов, которые сведут все эти гипотезы к одной, исключив остальные.
Первый эксперимент, который вы можете провести, разграничивает гипотезу специфики слова и остальные три. Вы можете повторить первоначальный эксперимент, используя два других вульгарных и невульгарных слова. Если вы снова обнаруживаете, что вульгарные слова требуют более длительных экспозиций, вы на пути к тому, чтобы отбросить гипотезу о специфике слова. Если же для произнесения вульгарных слов большее время экспозиции не потребовалось, возрастает ваша уверенность в гипотезе характеристики слова.
Предполагая, что после экспер.1 гипотеза о специфике слова отброшена, вы должны теперь разграничить остальные три гипотезы. В эксперименте 2 мы можем попытаться определить, воспринимают ли участники вульгарные слова при более коротких экспозициях, чем те, о которых они сообщают. Мы помним, что кожно-гальваническая реакция (КГР) человека является индикатором его эмоциональной реакции на стимулы. Поэтому мы решаем измерить КГР участников во время демонстрации вульгарных слов, чтобы выяснить, какой должна быть продолжительность экспозиции слов для их восприятия. КГР может показать, воспринимают ли участники слово, пусть даже они произвольно или непроизвольно подавляют свою реакцию. (Можно взять в качестве индикатора ВП – вызванный потенциал...)
Если вы выясняете, что КГР меняется во время экспозиции вульгарных слов, по сравнению с невульгарными, гипотеза перцептивной защиты получает определенное подтверждение. Однако если КГР показывает, что вульгарные слова воспринимаются при тех же самых экспозициях, что и не вульгарные, должна быть справедлива одна из оставшихся гипотез и нужно провести экспер.3
Чтобы разграничить произвольное и непроизвольное подавление реакции, вы можете выбрать операцию, которая заставляет людей произвольно менять интенсивность подавления. Вы можете ожидать, что когда пол экспериментатора и участника различен, произвольное подавление увеличится, по сравнению с ситуацией, когда пол обоих одинаков. Таким образом, в эксперименте 3 вы пытаетесь определить, меньше ли различие во времени экспозиции, необходимом для распознания вульгарных и невульгарных слов, в том случае, когда экспериментатор и участник одного пола. Если это так, подтверждается гипотеза произвольного подавления реакции. Если нет, по-видимому, более вероятна гипотеза непроизвольного подавления реакции.
Вы можете видеть, как сходящиеся операции позволили нам в этом примере исключить все гипотезы, кроме одной. Операции, которые мы использовали, чтобы принять одну гипотезу, были различными: манипуляция стимулом, измерение физиологической реакции и манипуляция межличностными отношениями. Мы можем выбрать и другие операции, но если допущения, лежащие в основе наших операций, верны, все прочие операции должны привести нас к принятию той же самой гипотезы. Каждый раз, когда новая операция приводит к той же гипотезе, наша уверенность в этой гипотезе возрастает.
В действительности, это обсуждение было несколько идеализированным. Редки случаи, когда вы можете спокойно сесть перед проведением сходящейся последовательности экспериментов и детализировать каждую возможную гипотезу и каждую операцию для разграничения гипотез. Если вы подобны большинству экспериментаторов, то сосредоточитесь на каком-то одном эксперименте. Лишь после изучения результатов этого эксперимента вы определите новую операцию, которая приблизит вас к принятию верной гипотезы.
По мере завершения все большего количества экспериментов в серии вы можете также обнаружить, что количество гипотез возрастает, а не убывает. Хотя вы отбрасываете некоторые из старых гипотез, появляются новые, когда вы начинаете лучше понимать экспериментальную проблему. В этот момент может показаться, что ряд проводимых вами экспериментов расходится, а не сходится! На самом деле этот ряд по-прежнему сходится, просто потенциальных гипотез оказалось гораздо больше, чем первоначально предполагалось.
Преимущества
Большинство преимуществ подхода сходящихся серий вполне очевидно. Он более гибкий, чем крупномасштабный факторный эксперимент. В крупномасштабном факторном эксперименте вы должны определить факторы и уровни факторов до начала эксперимента, а затем оказываетесь связанными этим заранее определенным планом. Одна ошибка при выборе может свести на нет огромные затраты времени и средств. В случае же сходящейся серии вы имеете несколько поворотных точек. В каждой из этих точек вы можете выбирать новые независимые переменные или уровни. Вы можете также добиться намного большей эффективности, поскольку вам не нужно тратить время на исследование факторов и уровней факторов, которые оказывают незначительное влияние на зависимую переменную.
Кроме того, план сходящейся серии экспериментов заключает в себе возможности воспроизведения результата. Каждый раз, когда вы демонстрируете повторяемость экспериментального результата, он приобретает дополнительный вес в глазах научного сообщества. Если вы провели все три эксперимента в нашем примере с вульгарными словами, вы трижды воспроизвели, или повторили, основной экспериментальный результат, состоящий в том, что вульгарные слова требуют более длительных экспозиций, тем самым убедительно доказав надежность этого результата.
Недостатки
Планы сходящихся серий имеют и ряд небольших недостатков. Иногда бывает трудно или невозможно определить, как взаимодействуют переменные, если ими манипулируют в различных экспериментах. При определенных обстоятельствах вы можете объединить два эксперимента из сходящейся серии, с тем чтобы проанализировать их как одиночный межгрупповой факторный эксперимент. Однако если вас действительно интересуют эффекты взаимодействия, вам придется провести факторный эксперимент.
Второй недостаток состоит в том, что сравнивая результаты независимых экспериментов в серии, вы всегда проводите межгрупповое сравнение со всеми сопутствующими недостатками межгрупповых планов.
Наконец, используя план сходящейся серии, вы должны проанализировать и проинтерпретировать результаты каждого эксперимента, прежде чем сможете начать следующий. Чтобы завершить подобный анализ, часто требуется несколько недель, а иногда и месяцев. По этой причине многие исследователи работают одновременно более чем с одной серией, с тем чтобы можно было проводить эксперимент из одной серии, анализируя при этом эксперимент из другой.
Рассматривая преимущества и недостатки планов сходящихся серий, легко понять, почему этот подход приобрел в последние годы такую популярность. Он позволяет эффективно и гибко изучить проблемы и прикладного, и фундаментального исследования.
Основные преимущества и недостатки экспериментальных планов: двухуровневого, многоуровневого, факторного и плана сходящейся серии.
Планы
Двухуровневый эксперимент
Преимущества: Эффективен для определения того, оказывает ли переменная какое-то влияние. Результаты легко интерпретировать. Приемлем для проверки некоторых теорий. Полезен при сравнениях в прикладных целях.
Недостатки: Нельзя сделать вывод о виде функции. Интерполяция и экстраполяция рискованны. Трудно проверить сложные теории.
и анализировать
Многоуровневый эксперимент
Преимущества: Можно определить вид функции. Не столь важен размах независимой переменной.
Недостатки: Требует больше участников и времени. Более громоздкие схемы уравновешивания. Трудность статистических вычислений.
Факторный эксперимент
Преимущества: Можно исследовать взаимодействия. Добавление факторов уменьшает изменчивость, тем самым увеличивая статистическую чувствительность. Повышает обобщаемость, не понижая при этом точность.
Недостатки: С добавлением факторов эксперименты становятся более громоздкими. Трудность статистических вычислений. Иногда трудно интерпретировать взаимодействия более высокого порядка.
Сходящиеся серии экспериментов
Преимущества: Обеспечивают большую гибкость, чем факторные эксперименты. Заключают в себе возможности воспроизведения результата.
Недостатки: Трудно оценить взаимодействия. Межэкспериментальные сравнения становятся также межгрупповыми, с сопутствующими трудностями. Необходимость анализа результатов предшествующего эксперимента перед проведением следующего.
Виды зависимостей в психологических экспериментах
Сбор, классификация и обработка данных.
1.Отсутствие зависимости (показать график).
2. Монотонно возрастающая или убывающая функция; частный случай – линейная зависимость (временная суммация на критическом интервале, ВР выбора; уменьшение диаметра зрачка при увеличении интенсивности света). Параметры.
3.U-образная зависимость (парасаккадическое подавление, позиционная кривая).
4.∩-образная зависимость (размер группы и эффективность совместной работы, тревожность и эффективность работы, экз.балл и тревожность).
5.Экспоненциальная функция (+ и -)
Эмпирические и апроксимированные данные. (Рис.)
Корреляционные исследования. (Гудвин, Гл.9).
Статистическая связь вместо причинной (время отлёта птиц и время выпадения снега; строение тела и характер; сезонные колебания цен в экономике). К. = соотношение; позволяет выдвинуть гипотезу о прич.-следств. связи. Отсутствие К. не даёт основание для выдвижения гипотезы.
Отличительная особенность: ни одна из переменных не управляется экспериментатором!
Основания для проведения корреляционных исследований (P.Cozby, Psych 240):
- когда невозможно или неэтично манипулировать переменными, представляющими интерес;
- когда главная цель исследования связана с субъектной переменной;
- когда нужно выяснить состав переменных и их возможные соотношения (на предварительной стадии исследования);
- когда целью исследования является предсказание будущего поведения; изучается связь между предикторной (predictor) и критериальной (criterion) переменными.
Виды: 1) прямая, 2) косвенная, 3) случайная.
1. А – R – B (полный – добрый, синий – холодный).
2. A –R - B (cкорость опознания слова – словарный запас; уровень интеллекта – уровень дохода).
 A- R - B
C - cкрытая переменная (интеллект или социальная структура).
Проблема "третьей" переменной в психологическом эксперименте.
Типы К.:
- положительная (личностная тревожность – язва желудка; время, затраченное на учёбу, - оценка успеваемости): с увеличением (уменьшением) одного фактора увеличивается (уменьшается) другой; (график);
- отрицательная (чем боязливее, тем меньше шансов стать лидером; бесполезно потраченное время – средний балл успеваемости): с увеличением одного фактора уменьшается другой (и наоборот); (график);
- нулевая (не путать со случайной); (график);
- линейная (чем полнее, тем добрее), нелинейная (закон Йеркса-Додсона);
- слабая, сильная; коэффициент корреляции (1, -1, 0, 0,5, -0,5).
Уровень значимости: сильная корреляция может оказаться статистически незначимой, а слабая – значимой. Определяется по таблице (нужно знать кол-во степеней свободы; см. Гудвин, Приложение, с.485).
Гальтон: наследуемость способностей внутри одной семьи – это статистическая закономерность (не всегда в семье гения наследник будет гением). Рост родителей и рост детей. Организация коррелирующих данных (матрица X×Y; в ячейках – частота встречаемости данного сочетания X и Y). Пример матрицы рост родителей – рост детей. Наибольшие числа располагаются в центре и по диагонали матрицы, то есть при близком соответствии роста родителей и детей. (Аналог совр. графика рассеяния). Феномен "регрессии к среднему":
в ыше
 средний рост
ниже
если у родителей рост выше среднего, то у их детей рост был высоким, но не настолько, как у родителей: рост детей имеет тенденцию регрессировать (смещаться) в сторону среднего значения (то же и в случае с ростом ниже среднего).
Пример построения графика рассеяния (Рис.):
Время для учёбы Средний балл
(часов/неделю) (0 – 4)
42 3,3
23 2,9
31 3,2
35 3,2
16 1,9
26 2.4
39 3,7
19 2,5 r = 0,88
На графике рассеяния точки никогда не соединяются линиями! Признаками корреляции являются: густота распределения точек (напр, вокруг линии или кривой), наклон линии регрессии (положит. или отрицат.).
Уравнение линии регрессии: Y = a + bX. Зная величину коэффициента корреляции, станд. откл. для коррелирующих перменных и их средние значения, можно по величине Х предсказывать Y. Так, на основании значимой корреляции между курением и сердечными заболеваниями, можно судить о вероятности сердечных заболеваний у курящих; на основании портрета "жестокого супруга" можно судить о вероятности такого поведения у безработного.
Диапазон одной или обеих переменных: чем он шире, тем выше и значимее корреляция.
Представление данных эксперимента (Гудвин, 265-268).
Способы представления: протокольный, отчёты испытуемых, текстовый, табличный, графический. Злоупотребление протоколами (особенно в патопсихологии) и отчётами. Текстовое описание достаточно только при небольшом количестве НП или её уровней. Таблицы необходимы для количественного анализа данных. Они должны быть в меру подробными и отражать суть исследуемой зависимости. Например, далеко не всегда нужно приводить индивидуальные данные всех испытуемых. Построение таблицы должно отражать часть или весь экспериментальный план. Оформление таблицы: нумерация, название, разделы и подразделы, разрядность чисел, выделение шапки и разделов, объём таблицы.
Графики (рисунки) – для отображения качественных зависимостей: линейные, гистограммы, трёхмерные, секторные (см. современные статистические пакеты). Правило: для непрерывных НП (дозы лекарства, уровень тревожности, IQ, время) можно использовать разные типы, для дискретных (наличие или отсутствие контекста, реагирование правой или левой рукой, конкретные или абстрактные слова, связный или бессвязный текст) НП – только гистограммы. Обман с помощью графики ("Ого-график"; Гудвин, 159). Обозначения на графиках.
Этика психологических экспериментов.
Опрос как исследование (Мартин, с.308-323).
Цель опроса – на основе данных выборки судить о популяции.
В опросе содержится информация, которую нельзя получить с помощью измерения (мнения, мотивы, ожидания). "...узнать не только, что люди делают, но и почему они это делают".
Способы опроса. Почтовый (респонденты); плюс: отдалённые места, анонимность; минус: низкий уровень реагирования (20-30%) – погрешность нереагирования; это нельзя компенсировать увеличением кол-ва опросных листов из-за угрозы репрезентативности выборки. Здесь нужно уделять внимание содержанию письма (минимум формальности и шаблонов; символическое вознаграждение; предварительный разговор по телефону; повторное послание писем). В почтовом опросе главное – проверять репрезентативность итоговой выборки.
Телефонный опрос. Более личный характер, по сравнению с почтовым. Проблемы: нежелание или неумение говорить по телефону; занятость другими делами. Рекомендации; краткость вопросоов, их небольшое число.
Групповой опрос. Быстрый сбор большого количества данных. Трудность обеспечить полную конфиденциальность (из-за рядом сидящих).
Интервью. Структурированное (по заранее написанному сценарию) и неструктурированное; смешанное.
Интерент-опрос.
Составление опросника (если нет готового!). Вопросы: открытые, закрытые (да-нет), многоальтернативные (выбор одного ответа из нескольких предложенных). Проблема превращения ответов в числа. Формулировка вопроса: исключение неоднозначности, понятность для респондента (лексика должна соответствовать выборке), избегание вопросов в отрицательной форме. Использование рейтинговых шкал. Шкала Ликерта (с.319).
Недостатки метода опроса. Большое количество данных и трудность их статистической обработки. Это – корреляционные исследования, а не экспериментальные. Возможная неправдивость ответов (из-за желания защитить себя, привлечь внимание к своей группе, ориентации на социально-приемлемые нормы. Поэтому необходимо смягчать выводы опросов.
Планирование нетрадиционных исследований
(Файл Designing designe; Мартин, с. 282-308).
Три вида эмпирических исследований: рандомизированный (строгий) э., квазиэксперимент, неэксперимент. (Рис.). Общий формат обозначений, состоящий из 4 частей.
4 составные части экспериментального плана (Рис.):
- Протекание во времени (причина предшествует следствию) передаётся в виде определённого расположения элементов в пространстве (слева направо и сверху вниз); [Об отображении времени на пространство]
- Предполагаемая причина (воздействие лекарством, социальная программа, метод обучения); обозначается через Х ( эквивалентно НП); если программ несколько – Х1 , Х2 и т.д.; к контрольной (сравниваемой) группе Х не применяется;
- Наблюдение (измерение) – обозначается буквой О (от англ. observation); оно может быть одно и то же на всём интервале исследования или в разные моменты проводятся разные измерения, и тогда они обозначаются индексами О1, О2 и т.д.;
- Группы испытуемых; при наличии нескольких групп каждая обозначается на отдельной строке; в начале строки ставится символ, обозначающий способ формирования группы: R – случайный; N – неслучайный (неэквивалентные группы, когорты); в общем случае неэквивалентная группа – "это группа, полученная путём иного механизма отбора, нежели тот, который применялся для группы, подвергаемой воздействию" (Мартин, с.286); С – отбор в группу по критической оценке, или переменной уравнивания (IQ от 90 до 120).
Примеры:
План с однократным итоговым тестированием на одной группе.
"Допустим, автор нового метода обучения желает показать его преимущества на одной академической группе. Часто педагогические «эксперименты» выглядят именно так. В этом случае исследователь, конечно, сравнивает результаты данной экспериментальной группы с «обычными» результатами, т.е. с известными показателями ЗП (или О), или с другими мыслимыми группами, в которых ситуация обучения является традиционной. Если он не использует никаких форм экспериментального контроля (в первую очередь как сравнение реализованных условий с разными уровнями НП), то выводы могут не выдержать критики с точки зрения конкурирующих объяснений. Приведем часть возможных возражений, ставящих под сомнение достоверность таких результатов: (Корнилова Т.В.)
-
возможно, в выбранной (и единственной) группе изначально были более сильные студенты;
-
возможно, само понимание учащимися, что с ними экспериментируют, заставило их заниматься более усердно;
-
возможно, более высокий результат обучения нужно связывать с личностью преподавателя: он как энтузиаст «выкладывается» в большей степени, чем коллеги, в частности, вследствие искренней веры в успех своего метода и т.д."
Если вы оцениваете поведение какой-то группы, которая подвергалась воздействию только одного уровня независимой переменной, то используете план с однократным итоговым тестированием на одной группе. В нашей системе обозначения этот план выглядит следующим образом (1):
R
(подразумевается) (1)
Когда у вас нет другой информации, дополняющей результат эксперимента, этот план, в сущности, бесполезен для определения того, какое влияние оказало воздействие. [Не совсем; напр., если нужно решить, не наносит ли вред применяемое воздействие]
Например, предположим, что телевизионная компания показывает программу, посвященную массовому уничтожению евреев фашистами — Холокосту (X), и вас интересует, как передача повлияла на осведомленность населения об этом событии (О). Вы посылаете группе людей вопросник и обнаруживаете, что теперь 76% знают о том, что произошло во время Холокоста. Что же вам известно о влиянии телепередачи? Способствовала ли она повышению осведомленности? Или понижению осведомленности? Если вы не знаете, каким был уровень осведомленности до передачи или каков уровень для эквивалентной группы, не смотревшей передачу, ваш результат бесполезен при ответе на эти вопросы.
Этот план подобен изучению отдельного случая. Однако есть и некоторые важные отличия, которые делают этот план полезным. При изучении отдельного случая исследователь, как правило, знает очень много о контексте, в котором наблюдает поведение. По этой причине, хотя и не проводится непосредственная оценка того, каким было поведение до воздействия и наблюдения, его часто удается вывести. Вдобавок, обычно наблюдают более чем одну модель поведения. Эти модели поведения могут образовывать паттерн, который обеспечивает намного больше информации, чем дает ее одиночная зависимая переменная, оцениваемая в более стерильной лабораторной обстановке.
План с однократным итоговым тестированием неэквивалентных групп.
Если мы добавим к плану, который только что обсудили, итоговый тест с неэквивалентной контрольной группой, то получим следующий план (2):
Смотрели передачу (2)
Не смотрели
(контр. группа)
Предположим, в нашем примере с Холокостом мы обнаружили, что из-за игры местной футбольной команды телепередача не была показана в Майами. Мы можем использовать рандомизированную выборку из Майами в качестве неэквивалентной группы и послать ей вопросник. Если мы теперь обнаружим какое-то различие между группами (в контрольной группе показатель осведомлённости о холокосте меньше), можем ли мы приписать его телепередаче? Едва ли, потому что в Майами живет много евреев, а еврейское происхождение может повлиять на осведомленность о Холокосте.
Основная проблема в случае плана с однократным итоговым тестированием неэквивалентных групп состоит в том, что любое наблюдаемое различие могло быть обусловлено как воздействием, так и различиями в отборе групп. Чем более сходны группы (напр., по национальному составу), тем убедительнее заключение.
Один из способов повышения надежности заключения при отсутствии формального предварительного тестирования — получить предварительную информацию, позволяющую сравнить две группы. Эта предварительная информация тем полезнее, чем сильнее она коррелирует с зависимой переменной. Например, мы можем сравнить две наши выборки по таким характеристикам, как возраст, пол, социальный класс, этническая принадлежность и вероисповедание. Это сравнение может дать нам представление о том, насколько эквивалентны группы. Однако базовый план по-прежнему ненадежен, и необходимо быть очень осторожным при интерпретации результатов любого плана с однократным итоговым тестированием для неэквивалентных групп.
Поделитесь с Вашими друзьями: |