или
где символы от RT, до RT4 представляют показатели времени ответа на задания с 1-го по 4-е, соответственно. «Веса» (нули или единицы) называются «коэффициентами факторной оценки». Если вычислены факторные оценки каждого испытуемого, их можно коррелировать с другими переменными, чтобы установить валид-ность этого показателя пространственных способностей.
Хотя эта методика вычисления факторных оценок иногда встречается в литературе, она на самом деле имеет свои недостатки. Например, хотя задания 1, 2 и 4 имели факторные нагрузки больше 0,4, задание 4 имело нагрузку, которая существенно выше, чем нагрузка задания 2. Это означает, что задание 4 представляет собой намного лучший показатель фактора, чем задание 2. Должны ли веса — «коэффициенты факторной оценки» — отражать это? Вместо того чтобы быть нулями и единицами, должны ли они каким-то образом быть связаны с размером факторных нагрузок? Этот подход явно имеет смысл, и стандартная программа факторного анализа почти неизменно будет предлагать пользователям опцию вычисления этих коэффициентов факторных оценок — по одной для каждой переменной и для каждого фактора. После их получения не составит труда умножить оценку каждого испытуемого по каждой переменной на соответствующий коэффициент факторной оценки и таким образом вычислить «факторную оценку» каждого испытуемого по-каждому фактору. Большинство компьютерных программ даже сделают это вычисление за вас.
Для полноты картины следует упомянуть, что коэффициенты факторной оценки не применимы к «сырым» оценкам по каждому заданию, их можно использовать только со «стандартизованными» оценками. Рассмотрим задание-1. Если испытуемый имеет время ответа на это задание 0,9 с, тогда как среднее время ответа на остальные задания выборки вместе с этим заданием составляет 1,0с, а стандартное отклонение — 0,2 с, то время ответа 0,9 с
будет преобразовано в стандартизованную величину
Именно эта величина, а не первичная величина 0,9 с, используется при вычислении факторных оценок.
Сама процедура вычисления коэффициентов факторной оценки не должна нас здесь беспокоить. Для тех, кто заинтересуется этим вопросом, его основательные обсуждения можно найти в руководствах Хармана (Harman, 1976, ch. 16), Комри и Ли (Comrey, Lee, 1992, sec. 10.3), а также Харриса (Harris, 1967). Вычисление факторных оценок — простое дело, когда используется анализ главных компонент, проблема усложняется в случае применения любой формы факторного анализа. Здесь существует несколько разных методов, предназначенных для вычисления факторных оценок, каждый со своими собственными достоинствами и недостатками.
Метод Бартлетта — один из лучших (как утверждают McDonald, Burr, 1967-), и он присутствует как опция во многих пакетах по факторному анализу.
Задание для самопроверки 15-4
Предположим, что менеджер по персоналу провел факторный анализ оценок соискателей по ряду тестов. Как можно использовать этот анализ для того, чтобы решить, какие тесты больше не будут предсказывать, насколько хорошо работники справятся со своими обязанностями?
Иерархический факторный анализ
Когда проводится облическое факторное вращение, получае-1ые факторы обычно коррелируют между собой. Матрица взаим-1ых корреляций факторов представляет углы между факторами, и :ама может быть подвергнута факторному анализу. Иначе говоря, сорреляции между факторами можно проанализировать и выде-шть любые кластеры факторов, т.е. произвести факторный анализ (второго порядка», или «второго уровня» (факторизация корреляций между переменными — это анализ «первого порядка»), и ис-;ледователи, например, Кэттелл, широко использовали эту мето-щку. Полезность такого анализа можно проиллюстрировать с по-ющью примера.
Недавно вместе с Крисом МакКонвиллом мы задались целью установить, какими могут быть основные параметры настроения [McConville, Cooper, 1992b). Мы провели факторный анализ кор->еляций более 100 заданий, направленных на оценку настроения, извлекли и подвергли облическому вращению пять факторов первого порядка, соответствующих основным параметрам настроения, обсуждавшимся в главе 10. Затем мы провели факторный анализ корреляций между этими факторами первого порядка и обнаружили, что четыре из этих факторов коррелируют между собой, образуя фактор настроения второго порядка, названный «негативный аффект». Пятый фактор настроения имел незначительную нагрузку по этому фактору. Таким образом была установлена иерархия факторов настроения, как показано на рис. 15.4.
Если имеется много факторов второго порядка и они обнаруживают приемлемую степень корреляции, будет вполне законным провести факторный анализ корреляций между факторами второго порядка, чтобы выполнить факторный анализ третьего порядка.
Рис. 15.4. Пример иерархического факторного анализа из работы Мак-Конвилла и Купера (McConville, Cooper, 1992b).
Процесс можно продолжать либо до тех пор, пока корреляции не станут, по сути, равными нулю, либо до тех пор, пока не получится только один фактор.
Проблема, присущая этому иерархическому анализу, состоит в том, что может быть чрезвычайно трудно идентифицировать или концептуализировать факторы второго и более высоких порядков. В то время как факторы первого порядка могут быть экспериментально идентифицированы выделением заданий с существенными нагрузками, матрица факторов второго порядка показывает, как факторы первого порядка нагружают фактор (факторы) второго порядка. По этой причине может быть достаточно сложно идентифицировать факторы второго порядка. Например, что можно было бы сделать с фактором, который, оказывается, измеряет первичные способности к правописанию, визуализации образов и способности в области механики. Было бы намного легче проанализировать, что происходит, если бы можно было показать, что около дюжины переменных имеют большие нагрузки по фактору второго порядка, вместо того чтобы пытаться интерпретировать факторы второго порядка в категориях только двух больших нагрузок, присущих факторам первого порядка.
Для того чтобы преодолеть эту проблему, было изобретено несколько методов. Все они связывают факторы второго и более высоких порядков с непосредственно наблюдаемыми переменными (Schmid, Leiman, 1957). В приведенном выше примере факторы второго порядка будут определены не в категориях первичных факторов (правописание, визуализация, способности в области механики и т.д.), а в категориях действительных переменных. МакКон-велл и Купер (McConville, Cooper, 1992b) приводят пример использования этой методики на практике. Ни один из стандартных пакетов, осуществляющих факторный анализ, не включает мето-- дику Шмида—Лемана, но такие пакеты, как EQS и LISREL (описанные ниже), могут выполнять подобный анализ.
Вторая проблема, связанная с таким анализом, касается ошибки измерения. Иногда несколько довольно разных факторов первого порядка почти в полной мере удовлетворяют требованиям, поскольку это касается критерия соответствия простой структуре. Однако более или менее произвольный выбор одного такого решения будет оказывать мощный эффект на корреляции между факторами и, следовательно, на количество и природу факторов второго порядка. Факторный анализ следует осуществлять с особой тщательностью, если предполагается получить иерархические решения.
Конфирматорный факторный анализ
Л,
Полное изучение этой темы выходит за рамки данного текста. Цель этого раздела — просто указать на то, что существует такой метод, и дать пример его использования. В то время как основная цель исследовательского факторного анализа заключается в определении (путем вращения факторов и достижения простой структуры) количества и природы факторов, которые лежат в основе данных, конфирматорный факторный анализ (как следует из его названия) проверяет гипотезы или, скорее, позволяет пользователю выбрать между несколькими конкурирующими гипотезами, описывающими структуру данных. Например, предположим, вас заинтересовало использование опросника, измеряющего отношение к питанию. В результате обзора литературы вы можете установить, что в части предшествующих исследований утверждается, что 10 из 20 заданий формируют один фактор, а оставшиеся 10 заданий формируют другой фактор, и корреляция этих факторов рав-
на 0,4. Другая часть исследований с применением того же теста может указывать на то, что все 20 заданий теста формируют один фактор. Принципиально важно узнать, которое из этих утверждений правильно. В результате первого у каждого человека будут вычислены две оценки, в то время как второе будет приводить только к одной оценке. Для того чтобы определить, какая из этих конкурирующих моделей лучше всего соответствует данным, можно использовать конфирматорный факторный анализ.
Для конфирматорного факторного анализа можно использовать модели либо исследовательского факторного анализа, либо метода главных компонент. Однако почти все исследования базируются на моделях исследовательского факторного анализа, где устаналиваются общности каждой переменной. В действительности можно выполнить иерархический факторный анализ и проверить огромный диапазон моделей, используя эту методику. Хорошее описание конфирматорного факторного анализа и источника его происхождения — моделирования с помощью линейных структурных уравнений дается, в частности, в работах Лонга (Long, 1983), Лоелина (Loehlin, 1987) и Комрея и Ли (Comrey, Lee, 1992, ch. 12, 13). Клайн (Kline, 1994) и Чайлд (Child, I990) предлагают более простое введение в эту проблему.
Ряд компьютерных программ .был написан для выполнения конфирматорного факторного анализа. Наиболее известная из них — LISREL — разработана Карлом Йорескогом, статистиком, который изобрел этот метод. EQS (Bentler, 1989) — другая программа, которая, по-видимому, проще для использования, чем LISREL. Поскольку конфирматорный факторный анализ — одна из простейших форм моделирования с помощью линейных структурных уравнений, любая программа такого типа должна выполнять этот анализ,
Конфирматорный факторный анализ рассматривает базисные данные (тестовые оценки, ответы на задания теста, физиологические показатели и т.д.) как вызванные или обусловленные одним (или более) фактором (часто называемым «латентной переменной»). Таким образом, может быть составлен ряд уравнений, каждое из которых предположительно показывает, какой фактор (факторы) влияет на какую переменную (переменные).
Например, предположим, мы постулируем наличие двух факторов — общего интеллекта (g) и тестовой тревоги (ТА). Предположим также, что оценки по некоему тесту (тест 1) находятся яод влиянием обоих этих факторов, но влияние общего интеллекта
больше, чем влияние тестовой тревоги. Мы можем представить это в виде простого уравнения типа:
Тест 1 - 0,8 х g + 0,1 х ТА + уникальная дисперсия.
Числа 0,8 и 0,1 показывают степень связи между переменными и каждым фактором — факторные нагрузки. Каждое из этих чисел может быть:
• определено непосредственно в виде числа (как в приведенном выше примере);
• установлено с помощью компьютерной программы;
• принято равным другим величинам, которые уже установлены. Например, можно считать, что все тесты находятся под влиянием тестовой тревоги в равной, но неизвестной степени. (Такая возможность выбора на практике может быть проблематичной.)
В конфирматорном факторном анализе обычно уравнение пишется для каждой переменной, показывая, какой фактор (или факторы) предположительно влияет на показатели по этой переменной, хотя, как правило, не устанавливается размер нагрузок. Любые факторные нагрузки, которые не определены, принимаются равными 0. Необходимо указать также на то, что дисперсия каждого фактора равна 1,0. Затем компьютерная программа устанавливает наилучшие возможные значения для каждой из нагрузок и также вычисляет статистики, показывающие, насколько полно постулируемая структура соответствует реальным данным. Обычная практика состоит в том, чтобы попытаться применить несколько различных моделей и выбрать одну, которая дает наибольшее соответствие, т.е. ту, которая лучше всего подтверждается данными.
Лоелин (Loehlin, 1987) приводит подробное обсуждение того, как интерпретировать различные показатели соответствия модели. Хотя показатели соответствия полезны для того, чтобы сделать выбор между конкурирующими моделями, они не особенно эффективны для выработки абсолютных критериев соответствия определенной модели. Это означает, что методика не способна с легкостью установить, будут ли выявлены в полученных данных какие-либо определенные паттерны факторов и факторных нагрузок, но она может быть полезна при выяснении степени конкурентоспособности этих моделей.
Обычно практикуется представлять связи между переменными, общими факторами и уникальными факторами с помощью
Рис. 15.5. Диаграмма путей, демонстрирующая, как два коррелирующих фактора (F1 и F2) влияют на значения шести наблюдаемых переменных (от VI до V6). Представлены также уникальные дисперсии переменных-(от U1 до U6).
диаграммы, называемой «диаграмма путей». Пример должен сделать это более понятным.
На рис. 15.5 представлены два фактора F1 и F2, каждый из которых, предположительно, влияет на переменные (от VI до V6), на числа пока не обращайте внимания. Вы можете заметить, что V4 находится под влиянием обоих факторов, а на другие переменные влияет только один из них. На диаграмме показаны также уникальные дисперсии каждой переменной (от U1 до U6). Каждая линия, связывающая фактор с наблюдаемой переменной, имеет стрелку на одном конце, указывающую, что по допущению фактор обусловливает определенную наблюдаемую переменную (а не наоборот). Кривая, соединяющая фактор 1 и фактор 2, представляет корреляцию, т.е. факторы 1 и 2 коррелируют между собой. Таким образом, эта диаграмма соответствует облическому факторному решению.
Числа, расположенные на каждой из линий, представляют собой числовые значения факторных нагрузок (в матрице фактор-
Таблица 15.3
Матрица факторной модели, эквивалентная диаграмме путей, помещенной на рис. 15.5
Переменные
|
Фактор 1
|
Фактор 2
|
Аг
|
VI
|
0,8
|
0,0
|
0,64
|
V2
|
0,7
|
0,0
|
0,49
|
V3
|
0,8
|
0,0
|
0,64
|
V4
|
0,6
|
0,5
|
0,61
|
V5
|
0,0
|
0,7
|
0,49
|
V6
|
0,0
|
0,7
|
0,49
|
ных паттернов), или, если это кривая линия, такие числа обозначают корреляции между этими факторами. Однако в большинстве случаев все числа будут установлены программой. Так, диаграмма путей на рис. 15.5 соответствует матрице факторных паттернов, представленной в табл. 15.3.
Несколько других вероятных диаграмм путей может быть построено на основе теории или предшествующего исследования, и каждую можно проверить, чтобы определить, насколько полно она соответствует данным. Таким способом исследователь может осуществить выбор между различными теоретическими конкурирующими моделями. Однако здесь существует определенный риск, связанный с использованием этих методов. Слишком легко пуститься в «рискованное предприятие», модифицируя модель снова и снова, чтобы улучшить уровень ее соответствия, независимо от ее психологического правдоподобия. Действительно, компьютерные пакеты EQS и LISREL одобряют эту практику, подсказывая, какие части модели нуждаются в модификации. Однако компьютерная программа ничего не знает о психологии или теории факторного анализа и нередко будет предлагать что-то, лишенное смысла, допуская, например, чтобы уникальные вариативности различных переменных коррелировали между собой. Такая модель может исключительно хорошо соответствовать данным, полученным на определенной выборке, и тем не менее иметь мало психологического смысла (и маловероятно, что она будет воспроизведена на других выборках). Однако всегда, когда есть необходимость выбора между конкурирующими теоретическими моделями, кон-
фирматорный факторный анализ может оказаться очень полезным инструментом.
Представленное выше описание было намеренно упрощено, и читатели, которые собираются использовать этот метод, прибегая к другим источникам, должны усвоить:
• что этот анализ обычно проводится на материале ковариа-ций, а не корреляций
и
• что именно подразумевается под «идентификацией» модели.
Резюме
Факторный анализ — это исключительно полезный метод для прояснения связей между некоторым количеством переменных, измеренных в интервальноу шкале или шкале отношений. Он может быть применен к любым данным такого рода — от физических или физиологических показателей до заданий опросников. В этой главе было описано, как проводить технически обоснованный факторный анализ, и были четко обозначены некоторые общие ошибки, иногда проникающие в публикуемые статьи. Наконец, в ней был представлен конфирматорный факторный анализ как полезный метод для выбора между различными конкурирующими факторно-аналитическими моделями.
Предложения
по дополнительному чтению
Их дано достаточно много в тексте. Книги Чайдда (Child) и Клайна (Kline) наиболее просты, книги Горсача (Gorsuch) и Комрея (Comrey) также весьма приемлемы для читателей, не имеющих математической подготовки.
Ответы на задания по самопроверке
15.1. В связи с этим предложением возникают проблемы, наиболее очевидная из которых состоит в том, что «место жительства» — это переменная, которая не может быть измерена по шкале интервалов. Когда устанавливаются числовые коды, полностью произвольным является присвоение «1» Корнуоллу или Камб-
рии, поэтому коды не образуют какую-либо шкалу. Следовательно, они должны быть исключены из факторного анализа. (Чтобы выявить различия в математических способностях между учащимися графств, вы могли бы предложить коллеге вычислить факторные оценки по каждому из факторов, а затем провести анализ вариативности, используя «графство» как межиндивидуальный фактор.)
Другая проблема состоит в том, что в анализ включено больше переменных, чем имеется испытуемых в выборке. Таким образом, хотя количество испытуемых больше, чем «магическое» число 100, эти данные не годятся для факторного анализа. Вы могли бы предложить вашей коллеге собрать несколько больше данных, для того чтобы увеличить размер выборки по крайней мере до 150. Полезно было бы предупредить ее также о тех проблемах, которые связаны с факторизацией дихотомических данных, когда единственно возможным ответом является 0 или 1. Если обнаружится, что задания коренным образом отличаются по степени сложности (которая отражается в пропорции индивидуумов, правильно отвечающих на каждое задание), вы могли бы обратиться к литературе с целью поиска альтернатив корреляции Пирсона, которые подходят для факторного анализа. Наконец, вам было бы полезно проверить вместе с вашей коллегой, что детям было дано достаточно времени, чтобы попытаться решить все задания теста, и установить, кодировались ли задания, которые они не пытались решить, так же как и задания, которые решены неправильно, или этим заданиям давали особый код и рассматривали их как отсутствующие данные. Если заданиям, которые дети не пытались решить, давали такой же код, "ак и «неправильному ответу» (например, "О»), становится ясным, что могут возникнуть проблемы в том случае, если не всем детям удалось закончить тест в отведенное время. Задания, расположенные в конце теста, будут казаться более трудными, чем они есть на самом деле, просто потому, что только некоторым детям удастся дойти до них. В подобных обстоятельствах, возможно, было бы лучше просто проанализировать первые 50 заданий (или около того), в таком случае отпадает необходимость собирать дополнительные данные, поскольку выборка из 100 испытуемых была бы адекватна такому числа заданий.
15.2. Три и четыре. Вам следует, вероятно, выделить три фактора, имея в виду, как было установлено, что тест «каменистой осыпи» действует лучше, чем метод Кайзера—Гуттмана.
15.3. Простая структура — показатель того, насколько точно каждый фактор проходит через кластер переменных. Предположим, что факторы сохраняют положение под прямыми углами, представ-
ляя ортогональное вращение. Если с помощью вращения была достигнута простая структура, то каждый фактор будет иметь несколько высоких корреляций (выше 0,4 или ниже -0,4) между некоторыми переменными и корреляции, которые близки к нулю (например, плюс/минус 0,1) между всеми остальными. При этом должно быть очень немного корреляций средней величины в диапазоне плюс/минус 0,1-0,4. Если также проанализировать строки факторной матрицы, то каждая переменная должна иметь большую нагрузку только по одному или двум факторам. В значительной степени такое же положение существует для вариантов облического вращения (в котором факторы расположены не под прямым углом) за исключением того, что «матрица факторных паттернов», которая используется, чтобы определить простоту решения, не содержит корреляций между переменными и факторами, хотя интерпретируется таким же образом. Поскольку исходная позиция факторов по отношению к переменным, по сути, произвольна, то если не проводилось вращение, приводящее к простой структуре, различные исследователи будут сообщать о весьма разных результатах. Таким образом, важно обеспечить стабильную идентификацию факторов, получаемых в разных исследованиях.
- , - -• '• ....... ' ' :,:'
15.4. Факторный анализ будет показывать природу и степень перекрытия между оценками теста и, вероятно, приведет к появлению нескольких факторов, измеряющих личностные особенности и/или способности. Оценки можно вычислить для соискателя по каждому из этих факторов («факторные оценки»), и каждая из этих факторных оценок может быть валидизирована таким же способом, как валидизируются тесты и как это было показано в главе 13. Например, за соискателями могут вести тщательное наблюдение и коррелировать их факторные оценки с показателями продуктивности, или рангами, которые им выставляет инспектор за выполнение работы. Чтобы определить любые различия в факторных оценках между разными группами рабочих, например тех, кто медленнее продвигается по службе, или тех, которые уволились может быть использована ANOVA. Если некоторые из факторных оценок действительно окажутся полезными в процессе отбора, тесты, имеющие высокие нагрузки по этим факторам, с пользой могут быть сохранены. Те же, которые не будут нагружать ни один из полезных факторов, можно, вероятно, изъять из батареи оценок.
16
ТЕОРИЯ СЛОЖНОСТИ ЗАДАНИЙ*
Общая картина
Эта глава представляет подход, полностью отличный от оценки способностей с помощью тестовых баллов, — подход, который не требует использования норм и даже не настаивает на том, чтобы респонденты выполняли одни и те же тесты. Как следует из названия, эта методика учитывает, каким образом люди отвечают на отдельные задания в тесте, а не их общие оценки. Она естественным образом приводит к специально разработанному «пошаговому» тестированию, в котором трудность предъявляемых заданий подбирается в соответствии с уровнем способностей каждого индивидуума; это требует, естественно, предъявления заданий теста с помощью компьютера, и это — одно из наиболее впечатляющих недавних достижений психометрики. «
Поделитесь с Вашими друзьями: |