РАЗДЕЛ 5. Проведение социологического исследования
Социологическое исследование предполагает сбор конкретного эмпирического материала по интересующей социальной проблеме с целью дальнейшего его анализа и обобщения в виде нового знания о социальной реальности. В зависимости от целей и задач исследования социолог выбирает подходящие методы, определяет процедуры и приемы сбора, обработки и анализа социальных фактов. Проведение социологического исследования предполагает три последовательных этапа:
-
Подготовительный этап включает в себя:
-
Предварительное знакомство с объектом предстоящего изучения: его структурой, функциями, особенностями, перспективами развития, основными проблемами. Для этого знакомятся с имеющейся литературой по данному вопросу, результатами предшествующих исследований. Если изучается социальная группа, знакомство с объектом может осуществляться в виде беседы, интервью с представителями данной группы.
-
Создание программы социологического исследования, которая обязательно должна содержать описание проблемной ситуации, цели и задачи задуманного исследования, формулировку основных гипотез и планируемых методов изучения. Создание программы является самым важным звеном на этапе предварительной подготовки, так как закладывает методологические, методические и технические основы исследования.
-
Составление рабочего плана и графика выполнения работ.
-
Экспертизу предстоящего проекта: обсуждение с коллегами основных положений программы, с заказчиками (если такие имеются), корректировка программы, уточнение методов исследования.
-
Разработку конкретных методик исследования: создание инструментария (анкеты, бланки интервью, листы экспертных оценок или контент-анализа и т.п.), пилотажное (пробное) исследование на небольшом количестве опрашиваемых с целью уточнения инструментария и способов обработки и анализа информации.
-
Построение выборки (если объект исследования слишком многочислен). Способы построения разнообразны и зависят от целей исследования. Основным требованием к выборке является возможность распространения результатов, полученных для части, на весь объект в целом.
-
Подготовку исследовательской группы: согласование действий, инструктаж, репетиция.
-
Оперативный этап сбора первичной социологической информации, то есть конкретных эмпирических данных с целью их дальнейшей обработки и анализа (полевое исследование), включает в себя:
-
Подготовку технических средств для «полевых работ» (размножение анкет, пишущих средств и т.п.).
-
Сбор информации по разработанной методике.
-
Контроль за соблюдением методики, выборочную проверку.
-
Результирующий этап предполагает:
-
Сбор первичного материала, проверку его заполнения, отбраковку не удовлетворяющего необходимым требованиям.
-
Ручная обработка данных и подготовка к машинной обработке с помощью соответствующих компьютерных программ (кодирование открытых вопросов, содержательная группировка данных и т.п.).
-
Статистические подсчеты данных. Для больших исследований применяются сложные методы статистического анализа: корреляционный, регрессионный, кластерный, факторный и др.
-
Логический анализ данных: интерпретацию фактов, доказательство или опровержение гипотез, формулировку выводов, выделение нерешенных задач.
-
Составление итогового отчета, его оформление и предоставление заказчику.
Осуществляя социологическое исследование по указанному плану, следует обратить внимание на следующие ключевые моменты:
-
Тема исследования должна отражать проблемную ситуацию и касаться существенных сторон изучаемого объекта.
-
Стратегическим планом исследования является программа. Она закладывает основы успешного осуществления социологического проекта. Соблюдайте основные рекомендации по составлению программы (см. раздел 2).
-
Обратите особое внимание на экспертизу предстоящего исследования:
-
После обсуждения с коллегами уточните цели, задачи, методические приемы исследования. Определите совокупность методов сбора и обработки информации для разностороннего исследования проблемы.
-
Уточните основные понятия. Если темой исследования является бюджет времени студента, необходимо четко определить, что будет пониматься под этим понятием. Например, будет ли это только соотношение рабочего и свободного времени или подразумевается также время удовлетворения физиологических потребностей, время творческих занятий, пустое времяпрепровождение и др.
-
Проверьте, корректно ли проведена эмпирическая интерпретация понятий, то есть найдены соответствующие индикаторы (эмпирические показатели), раскрывающие содержание основных понятий и позволяющие их зафиксировать и измерить. Например, индикаторами (показателями) бюджета времени будут виды деятельности, которыми занят студент в течение дня (посещение лекций, семинаров, выполнение домашних заданий, работа в библиотеке, чтение литературы, просмотр телепередач и т.п.), а также величины и характеристики времени, затрачиваемого на их осуществление (1, 2, 3 и т.д. часов в день, утро, вечер, накануне сессии, ночь перед сдачей и т.п.). Посмотрите, достаточен ли набор индикаторов. Помните, что для полноты анализа объекта исследования полезен переизбыток информации. Это позволяет более целостно и многосторонне рассмотреть изучаемый объект, найти дополнительные взаимосвязи, что повышает качество и надежность исследования. Однако в условиях ограниченного количества вопросов в анкете имеет смысл сосредоточиться на поиске наиболее характерных индикаторов, в большей степени отражающих сущность изучаемого объекта. Это будет трудновыполнимо, если подбор индикаторов осуществлять стихийно, без учета обозначенной проблемы, четкой постановки цели и задач, без предварительной теоретической интерпретации понятий.
-
Еще раз проверьте, насколько точно удалось подобрать шкалы для измерения эмпирических показателей (индикаторов), т.е. насколько добросовестно произведена операционализация понятий. Измерить необходимые индикаторы (например, отношение к учебе, выполнение домашних заданий, пропуск лекций) можно разными средствами, используя практикуемые в социологии типы шкал. Выбор будет определяться целями и задачами исследования, а также логикой и интуицией социолога. Выбрав тип шкалы, разнообразьте технику ее построения (табличная, линейная, графическая, тестовая и др.), чтобы учесть психологические особенности респондентов (утомляемость, снижение внимания от монотонности работы и однообразия инструмента и т.д.).
-
Обсудите с коллегами, оптимальны ли предполагаемые методы сбора информации для точного измерения и разностороннего анализа сформированного набора индикаторов. Например, для исследования бюджета времени основной массив информации даст анкетный опрос студентов. Однако его можно дополнить и другими методами: структурированным наблюдением, работой с учебно-зачетной документацией, экспертным опросом (преподавателей, администрации), методами саморегистрации и т.д.
-
Принимая во внимание, что при изучении социальных групп (учебных, семейных, производственных и др.) основным методом социологического исследования является опрос, проведите логический контроль анкеты. Проконтролируйте, во-первых, точность формулировки вопросов, а, во-вторых, правильность компоновки анкеты (композицию). Проверьте, чтобы закрытые вопросы (если это допустимо) сопровождались свободной строкой для дополнительных ответов («другие ответы») или высказываний респондентов. Если какой-то вопрос обращен не ко всем, а только к части респондентов, предварили ли вы его вопросом-фильтром, чтобы выделить нужную вам совокупность опрашиваемых и отсечь тех, к кому этот вопрос не применим. Например, вопрос «Сколько часов в день вы занимаетесь спортом?» должен стоять после вопроса о видах деятельности в свободное время. Самые важные с точки зрения целей исследования вопросы следует продублировать (задать контрольные вопросы), поставив их в другой форме или модальности. Например, вопрос «Умеете ли Вы планировать свой режим дня?» можно сопроводить вопросом «Хватает ли Вам времени на любимые занятия?» или «Как бы Вы хотели провести следующий выходной?», которые нужно расположить в других частях анкеты и которые позволять оценить и измерить качество ответа на вопрос о планировании дня. Иногда допускается использование вопросов-ловушек, чтобы определить степень искренности отвечающих. Они тоже должны быть отнесены на некоторое расстояние от основного вопроса и могут задаваться в прожективной форме. Прямо спрашивая о степени удовлетворенности учебой в данном учебном заведении, можно поставить такой вопрос: «Если вернуться на несколько лет назад, в какой вуз Вы бы поступали?». Обратите внимание, достаточно ли четко объяснены правила заполнения анкеты и техника ответов на вопросы. Нет ли логического несоответствия между смыслом вопроса и шкалой измерения? Нет ли двусмысленных слов в вопросах или ответах, которые могут быть неправильно истолкованы респондентами? Не слишком ли многочисленны варианты ответов на вопрос? Если это так, следует разбить вопрос на части и вместо одного предложить блок вопросов. Избегайте вопросов («сензитивных»), затрагивающих самолюбие, нарушающих этические принципы, нормы приличия, поскольку социологический опрос должен проводиться в психологически комфортной обстановке в том числе и в интересах качества исследования.
Просмотрите еще раз композицию анкеты, уточните расположение вопросов, соблюдайте правила чередования простых и сложных вопросов. Не оказывают ли давления предшествующие вопросы на последующие? Нет ли скопления однотипных вопросов, вызывающих скуку и нежелание на них отвечать? Обратите внимание на орфографию, стилистику вопросов и ответов, ликвидируйте опечатки и графические промахи.
Помните, что варианты ответов должны формулироваться по единому логическому основанию, а в альтернативных вопросах варианты ответов должны быть взаимоисключающими. Текст вопросов должен иметь нужные пояснения: сколько можно выбрать вариантов ответов, как заполнить варианты табличных вопросов. В вопросе-меню необходимо соблюдать пропорцию положительных и отрицательных ответов. В одном варианте ответа не должно содержаться сразу несколько идей («В свободное время смотрю телевизор, читаю книги или мастерю»). Очень плохое впечатление производят пустые, праздные вопросы, ничего не добавляющие к исследованию.
-
Чтобы окончательно проверить качество и «работоспособность» анкеты, опробовать методы подсчета и анализа информации, проводят пробное (пилотажное) исследование. Получив несколько вариантов заполненных анкет, устраняют недочеты, вносят окончательные коррективы в формулировки вопросов и ответов. В таком виде инструментарий готов для использования в полномасштабном исследовании. Приступают к основному опросу и собирают конкретный эмпирический материал для дальнейшей обработки, анализа и получения нового знания об изучаемом объекте.
ВВОПРОСЫ И ЗАДАНИЯ:
-
Что представляет собой конкретное эмпирическое исследование?
-
Каковы критерии выделения отдельных этапов в социологическом исследовании?
-
Проведите логический анализ составленной Вами анкеты (при желании можно использовать анкету из Приложения).
-
Что такое модальность вопроса?
-
Задайте вопрос о способах проведения свободного времени в прожективной форме?
-
Найдите эмпирические индикаторы для операционализации понятия «благопристойное поведение».
-
Если в экспериментальную группу вызываются добровольцы, можно ли утверждать, что она сформирована на основе случайной выборки?
-
Зачем проводят «пилотажное» исследование?
РАЗДЕЛ 6. Статистическая обработка полученных данных
Чтобы проверить гипотезы своего исследования, получить новую информацию об изучаемом объекте, социолог должен придать собранным эмпирическим данным такую числовую форму, которая бы сделала наглядными имеющиеся зависимости и соотношения. Упорядочение эмпирических данных путем представления их в наглядном числовом или графическом виде называется обработкой первичной социологической информации. Обработка первичных данных с последующим анализом составляет заключительный (результирующий) этап социологического исследования, который находит свое полное отражение в итоговом отчете.
Обработка первичных данных (анкет) предполагает следующие этапы:
-
Редактирование анкет заключается в проверке качества анкет на полноту и точность заполнения, корректировке ошибок, выбраковке неправильно заполненных анкет. Если в анкете отсутствуют ответы на 20% и более вопросов, либо на 2-3 вопроса в социально-демографическом блоке, она отбраковывается как некачественная, потому что способна внести существенные искажения в социологическую информацию. Если число отсутствующих ответов не превышает 10% от общего количества заданных вопросов, допускается возможность, опираясь на логику ответов респондента на другие вопросы, восстановить пропущенные ответы. При контроле анкет считается целесообразным проверить их на наличие противоречивых ответов на вопросы. Например, если респондент на вопрос о занятиях спортом ответил «не интересуюсь», в другом вопросе о способах проведения свободного времени указывает «играю в футбол», можно говорить о противоречии. Его легко снять, исправив ответ «не интересуюсь» на вариант «интересуюсь иногда». Если таких противоречий несколько и они не столь легко разрешимы, анкета исключается из анализа. Бывает, что в вопросах, на которые просят дать альтернативный (только один) ответ, респондент отмечает несколько вариантов ответа. Социолог учитывает первый данный ответ, остальные зачеркивает.
-
Следующая процедура обработки информации – кодирование (присвоение индекса, кода) вариантов ответа. Она начинается еще на стадии разработки инструмента, когда формулируются вопросы анкеты и каждому варианту ответа присваивается определенный номер (код). Это позволяет использовать статистические приемы обработки данных и облегчает использование специализированных компьютерных программ (например, SPSS). Существуют две общепринятые системы кодирования: порядковая (см. Приложение) и позиционная. В порядковой системе осуществляется сплошная нумерация всех вариантов ответов, в позиционной подряд нумеруются вопросы, а ответы на каждый вопрос нумеруются автономно.
Некоторую сложность представляет кодирование полузакрытых и открытых вопросов. В открытых вопросах социолог сталкивается с различными ответами на поставленный вопрос. Их следует упорядочить и классифицировать. Сначала все встречающиеся суждения по какому-либо вопросу выписывают на отдельный лист, затем они группируются по интересующему социолога признаку, каждой группе присваивается свой код, которым пронумеровываются соответствующие ответы в анкетах. Таких обобщенных групп не должно быть больше 3-4. В противном случае нужно говорить о недостаточной проработке методического инструмента (вопросника). Например, для исследования бюджета времени студента важно знать, какие учебные дисциплины требуют максимальной самостоятельной подготовки. Целесообразно весь перечень дисциплин разбить на несколько групп, присвоив каждой свой номер, например: естественно-научные (код 1), социально-гуманитарные (код 2), технические (код 3). После этого в заполненных анкетах после вопроса «Какая дисциплина требует большего времени для самоподготовки?» разнообразные ответы кодифицируются 1,2 или 3. Так же поступают с полузакрытыми вопросами. Свободные варианты ответа («другое») классифицируются, кодифицируются и вносятся под соответствующими номерами в анкеты.
Кодифицирование первичной социологической информации позволяет перейти к ее статистической обработке (ручной или машинной). Считается, что если анкет больше 100, целесообразно использовать компьютерные программы (SPSS, SAS), меньшие количества можно рассчитать вручную, используя статистические формулы обработки данных.
-
Статистический анализ, используя разнообразные приемы обобщения, позволяет наглядно представить соотношения и распределения признаков и свойств изучаемого объекта.
-- Одним из простых способов обобщения является группировка. Она позволяет выделить среди всех респондентов группы с одним или больше сходными признаками, что облегчает дальнейший анализ и изучение. Группировка по одному признаку называется простой, по двум и более – сложной (или комбинационной). Подытоживая число ответов на вопросы анкеты, исследователь делает не что иное, как простую группировку респондентов по интересующему его признаку (вопросу). Процентная величина вычисляется по формуле:
где -- общее число респондентов, подлежащих групировке;
-- число респондентов в группе с одинаковым признаком.
Если на вопрос «Где вы обычно выполняете домашние задания?» из 100 опрошенных студентов 40 ответили, что дома или в общежитии, 30 – что в библиотеке, а 20 – в дороге, то простая группировка дает информацию, что 40% респондентов, участвующих в опросе, делают домашние задания дома, 30% -- в библиотеке и 20% -- в дороге. Если вас интересует в целях вашего опроса, сколько из них юношей, а сколько девушек, вы можете произвести комбинационную группировку. Приняв каждую из полученных групп за 100%, посмотрите, какую часть из них составляют юноши и девушки. Например, вы выясните, что из 40% делающих домашние задания дома 90% оказались девушки, а 10% юноши, из 30% работающих в библиотеке 80% составляют юноши и 20% девушки, а 20% выполняющих домашнее задание в дороге целиком состоят из представителей мужского пола, вы можете сделать вывод о зависимости стиля выполнения домашнего задания от пола. А если вы сгруппируете показатели места выполнения домашнего задания и половую принадлежность с возрастными особенностями (сколько в каждой из интересующих вас групп студентов, например, до 18 лет, 18-20 лет и старше 20 лет), то получите сведения о зависимости отношения к выполнению домашнего задания и от возраста. Как видите, комбинационная группировка позволяет более масштабно представить объект исследования, получить более разностороннюю информацию, поэтому такую группировку еще называют аналитической.
-
Чтобы наглядно представить количество и разнообразие полученных группировок, отражающих частоту распределения какого-либо признака (признаков) изучаемого объекта, прибегают к построению рядов распределения каждой изучавшейся переменной (например, пола, возраста, места выполнения домашнего задания и т.д.). Ряды распределения делятся на атрибутивные и вариационные. Атрибутивный ряд отражает результат группировки респондентов по качественным признакам – полу, профессии, социальному статусу, основным жизненным ценностям, типам увлечений и т.п. (таблица 1).
Таблица 1
Ответы на вопрос: «К какому социальному слою вы себя относите?»
Социальный слой респондентов
|
Относительная частота, %
|
Абсолютная частота, чел.
|
Рабочий
|
7,7
|
18
|
Студент
|
41,5
|
98
|
Служащий
|
22,4
|
53
|
Бизнесмен
|
13,1
|
31
|
Безработный
|
15,3
|
36
|
Всего
|
100
|
236
|
-
Вариационный ряд формируется по количественному признаку, т.е. признаку, выраженному в числовом значении (уровень дохода, возраст, пропущенные занятия, дни болезни, квалификационный разряд и т.п.). (Табл.2)
Таблица 2
Пропуски занятий за месяц в студенческой группе
Предметы
|
Всего пропусков, часов
|
По болезни, часов
|
По неуважительной причине, часов
|
Физика
|
20
|
15
|
5
|
Электротехника
|
15
|
10
|
5
|
Социология
|
30
|
10
|
20
|
Итого
|
65
|
35
|
30
|
Вариационные ряды, в свою очередь, бывают дискретными, где каждый признак характеризуется конкретным количественным показателем (табл. 2), и интервальными, в которых значения признака колеблются в определенных пределах (интервалах). Например, распределение респондентов по возрастным группам: до 18 лет – 5 человек, 18-20 – 20 человек, старше 20 лет – 10 человек. Разнообразие рядов распределения, отражающее различные признаки изучаемого объекта, предполагает существенные различия в способах обработки данных (подсчете средних величин, показателей вариации и т.д.) и особенно значимо для крупных социологических проектов.
Чаще всего ряды распределения представляют в табличной форме (таблицы 1, 2). Иногда в таблице распределения указывают только относительные частоты, опуская абсолютные. Но и в этом случае в правом нижнем углу таблицы обязательно отмечают общее число ответивших (база для вычисления процентов) и число не ответивших (если таковые имеются).
Кроме табличного представления частотных распределений используют также разнообразные способы графического представления, самый распространенный из которых – гистограмма (столбиковая диаграмма)(рис.1).
Социальный состав респондентов (1- рабочие, 2 – студенты, 3 – служащие, 4 – бизнесмены, 5 – безработные).
рисунок 1
Ширина столбика соответствует интервалу значений переменной (середина совмещается с серединой данного интервала), высота отражает частоту попадания наблюдавшихся значений переменной в определенный интервал. Если соединить между собой точки оси ординат, соответствующие абсолютным или относительным частотам распределения отображаемого признака, получим так называемый полигон распределения (рис. 2), особенно наглядный в случае изучения признаков, характеризующихся непрерывностью значений (например, отношения респондентов к чему-либо). Еще один способ графического представления, часто используемый для качественных данных (номинальные или ординальные шкалы измерений), -- это круговая диаграмма.
рисунок 3
Каждый сектор диаграммы представляет дискретную величину переменной. Величина сектора пропорциональна частоте распределения данного признака. На рис. 3 изображена круговая диаграмма, иллюстрирующая социальный состав респондентов.
Отношение к гуманитарным дисциплинам студентов 1 – 5 курсов.
рисунок 2
-
Ряды распределения дают нам общую картину вариации изучаемого признака (признаков). Для дальнейшего анализа нам необходимо выделить типичные для изучаемого объекта значения этого признака (средние величины), а также разброс этого признака среди изучаемой совокупности людей (вариации признака).
Для выявления типичных характеристик изучаемой совокупности социолог рассчитывает следующие обобщающие показатели (средние величины): среднюю арифметическую (простую и взвешенную), моду, медиану и индекс.
Средняя арифметическая есть интегральная, обобщенная величина любого однородного признака. Общая формула для ее вычисления имеет вид: , где
-- числовые значения вариаций признака;
-- число вариаций;
-- сумма значений признака.
Если вы хотите узнать среднюю посещаемость лекций по социологии, вы должны суммировать число студентов, посетивших первую, вторую и т.д. лекций и разделить его на общее число лекций. Вы получите простую среднюю арифметическую посещаемости лекций.
Однако если вам понадобится рассчитать среднее количество задолженностей студентов группы по итогам сессии, эта простая формула не подойдет, так как сам измеряемый признак (задолженность) имеет несколько вариаций (у одного студента – одна задолженность, у другого – две, а у кого-то – три и более, а у кого-то нет вообще). В случае, когда измеряемый признак имеет количественную выраженность, для измерения средней величины используют так называемую взвешенную среднюю арифметическую. Ее рассчитывают по формуле:
-- числовое значение -й позиции признака;
-- число респондентов, выделенных по -й позиции признака;
-- общее число респондентов, подлежавших группировке ( ).
Используя таблицу 3, покажем, как это делается:
Таблица 3
Количество задолженностей
|
Число человек
|
Одна задолженность
|
5
|
Две задолженности
|
3
|
Три задолженности
|
2
|
Не имеют задолженностей
|
20
|
После подстановки в формулу данных из таблицы 3 получим:
Это значит, что среднее число задолженностей у студентов группы составляет 0,56. Таким же образом можно рассчитать среднее количество задолженностей у других групп на потоке или факультете и сделать выводы об успеваемости.
Средняя арифметическая, как вы видите, является грубым обобщением. В нашем примере она приписала задолженности (0,56) и тем студентам, которые их никогда не имели. Для более точного анализа первичных данных используют структурные средние единицы – моду и медиану. Модой в статистике называют наиболее часто встречающееся значение признака. В дискретном вариационном ряду (таблица 3) ее определяют по наибольшей частоте. В нашем примере модой (модальным значением) будет «не имеющие задолженностей» (20 человек). Именно они составляют среднее структурное (моду) данной группы. И наоборот, если мы имеем дело с группой, в которой 20 задолжников по одному предмету, 5 имеют по две задолженности и только 5 студентов учатся без «хвостов», то модой (наиболее типичным) данной группы будет «наличие задолженности» (20 человек).
Мода наглядно характеризует группу, в которой налицо преобладание какого-либо признака. А что будут являться модой в группе, в которой 4 человека имеют две задолженности, 10 человек – одну, 10 человек – не имеют вообще задолженностей и у шестерых – 3 и более «хвостов»? В этой группе две моды, и какая из них более типична? А если в группе 15 человек имеют «хвосты», а 16 – учатся без долгов, то является ли мода «не имеют задолженностей» типичной для группы?
Для характеристики средних значений признака, демонстрирующего разнообразное количественное проявление, используют еще одну меру центральной тенденции – медиану. Медиана – это значение признака, которое расположено ровно в середине упорядоченного ряда. Она делит вариационный ряд на две равные части так, что одна половина наблюдений оказывается меньше медианы, а другая – больше. Например, для ряда 1балл, 2 балла, 3, 4 и 5 баллов медианой будет значение 3 балла. Если имеют дело с четным количеством значений, медианой считают среднее двух центральных значений. Медиана может совпадать с модой (когда наиболее часто встречающееся значение признака располагается посередине упорядоченного ряда) или нет (когда наиболее многочисленный признак встречается, например, у крайнего значения – табл. 3). Медиана подчеркивает среднее положение какого-либо признака среди всей линейки наблюдений, поэтому ее иногда называют «позиционным средним». Она совершенно необходима при исследовании явлений с большим разбросом значений (например, доход семьи). Если взять среднюю арифметическую доходов российской семьи, где суммируются и студенческие семьи, и семьи олигархов, то с доходами «ниже среднего» могут оказаться 90% современных семей. Поэтому важно знать медианный (имеющий срединное положение среди всех попавших в выборку семей) доход, чтобы не более 50% семей попали в категорию «ниже среднего уровня». Именно медианное значение будет средним доходом российской семьи.
Рассмотренные выше средние величины (средняя арифметическая, мода, медиана) успешно характеризуют количественные показатели изучаемых явлений. Для определения средних значений качественных признаков, выраженных с помощью порядковых шкал, строятся индексы, позволяющие понять динамику какого-либо признака, присущего изучаемому явлению, сравнить или сопоставить по данному признаку разнородные объекты исследования. Например, индекс удовлетворенности студентов учебой в университете можно рассчитать, используя ранговую шкалу (таблица 4).
Таблица 4
Удовлетворены ли вы учебой в университете?
|
Абсолютные значения
|
a. Да
|
55
|
b. Скорее да, чем нет
|
60
|
c. Ни да, ни нет
|
40
|
d. Скорее нет, чем да
|
20
|
f. Нет
|
10
|
Индекс рассчитывается по формуле:
Где a, b, c, d, f – пункты шкалы.
Индекс позволяет зафиксировать соотношение положительных и отрицательных пунктов шкалы (измерить отношение респондентов к какому-либо явлению). Он меняется в границах от +1 до – 1. Индекс +1 означает, что все респонденты удовлетворены (в нашем примере) учебой, индекс – 1 будет свидетельствовать о полной неудовлетворенности опрошенных. Если подставить в формулу значения из таблицы 4, получим
Индекс, равный 0,35 показывает, что несмотря на положительный результат (+0,35) удовлетворенность студентов учебой не очень велика.
Если мы имеем трехчленную шкалу измерения признака (удовлетворен, ни да ни нет, не удовлетворен), формула определения индекса упростится, сведясь к дроби, в числителе которой – разность суммированных положительных и отрицательных ответов, а в знаменателе – общее количество опрошенных:
,
где , , -- положительные, нейтральные и отрицательные пункты шкалы.
Совсем просто рассчитать индекс показателя, имеющего только два значения (да – нет; регулярно – иногда и др.). Например, вы провели опрос в нескольких студенческих группах об отношении к учебе и выявили респондентов, которые, скажем, «регулярно» готовятся к учебным занятиям и «нерегулярно». По заказу деканата вы хотите сравнить между собой эти группы по «степени подготовленности к учебным занятиям». Вычислим индекс «подготовленности» и сравним по нему группы. Обозначим буквой «а» респондентов, ответивших «регулярно готовлюсь к занятиям», а буквой «b» - «нерегулярно». Наш индекс примет вид формулы:
,
то есть разность готовящихся регулярно к занятиям и готовящихся нерегулярно, деленная на число опрошенных. Определим границы изменения индекса. Если все опрошенные студенты во всех группах регулярно готовятся к занятиям (то есть b=0), индекс будет равен +1 (плюс один). Если предположить, что все респонденты нерегулярно готовятся к занятиям (а=0), индекс примет значение – 1 (минус один). Индекс может колебаться в пределах от +1 до – 1 и принимает значение 0 при а=b, то есть тогда, когда число регулярно готовящихся к занятиям студентов равно числу готовящихся нерегулярно. Предположим, по результатам опроса в четырех группах вы получили следующие результаты:
Таблица 5
Показатель: готовятся к занятиям
|
1-я группа (число человек)
|
2-я группа
|
3-я группа
|
4-я группа
|
Регулярно
|
20
|
8
|
25
|
20
|
Нерегулярно
|
4
|
20
|
2
|
10
|
Индекс
|
0,66
|
-- 0,43
|
0,85
|
0,33
|
Сравнив значения индекса четырех групп, можем сделать вывод, что более других подготовленной к занятиям бывает третья группа, а вторая (имеющая отрицательный индекс) является на занятия совершенно не подготовленной. Выводы, которые может сделать деканат, очевидны.
Индексы можно конструировать по разным показателям в зависимости от интересов исследователя, он имеет четкие границы измерения и позволяет увидеть динамику колебания того или иного признака у изучаемых объектов.
-
Кроме анализа средних величин, обобщающих наиболее характерные свойства изучаемой совокупности, для более глубокого понимания изучаемого объекта в социологии используют показатели отклонения всех значений признака от типичного – вариации признака. Чтобы ответить на вопрос, насколько крайние значения признака далеко отстоят от средних значений, и как относительно крайних значений (ближе к центру или ближе к краям) располагаются все остальные показатели изучаемого явления, измеряют меру изменчивости (разброса) признака. Самая простая мера изменчивости – размах вариации (диапазон значений). Он представляет собой разность между максимальным и минимальным значениями признака:
Размах вариации характеризует диапазон колебаний признака в изучаемой совокупности, не касаясь индивидуальных отклонений переменных. Например, если количество карманных денег в изучаемой группе колеблется от 100 рублей (минимальное количество у одного человека) до 10000 рублей (максимальное количество у одного человек), размах будет равен 10000 – 100 = 9900. При этом остается без внимания, к какому полюсу ближе показатели у других членов группы.
Чтобы определить разброс значений того или иного признака (например, карманных денег) в группе относительно средней величины, используют среднее линейное отклонение, рассчитываемое по формуле:
,
где – значения признака, -- среднее значение признака по совокупности, – количество значений.
К относительным показателям вариативности признака относится коэффициент вариации (V), который определяется как процент наблюдений, лежащих вне модального интервала, то есть доля (процент) значений признака, не совпадающих с модальным. Если от модального отличаются 70% значений, то V=70% (или V= 0,7). Коэффициент вариации характеризует степень однородности изучаемой совокупности. Если коэффициент превышает 33,3%, исследуемая совокупность считается неоднородной.
Для комплексной характеристики степени однородности распределения рассматриваемого признака используют важнейшую меру рассеяния – дисперсию. Все другие меры вариации признака дают лишь общую картину неоднородности показателей, не уделяя должного внимания изучению отклонения каждого отдельного наблюдаемого значения от среднего. Если просуммировать все значения отклонений наблюдаемых показателей от среднего в большую и меньшую стороны, мы получим нуль. Положительные и отрицательные отклонения будут взаимоуничтожаться. Если же возвести в квадрат каждое отклонение и просуммировать квадраты отклонений, можно получить меру рассеяния, которая будет маленькой, когда показатели однородны, и большой, когда показатели неоднородны. Чтобы суммы квадратов отклонений индивидуальных значений от среднего, относящиеся к разным объектам, можно было сравнивать, необходимо поделить каждую из них на , где – объем выборки (количество наблюдаемых объектов). Таким образом измеряют дисперсию ( ) – меру отклонения отдельных индивидуальных значений переменной Х от среднего в данной совокупности. Чтобы вычислить значение дисперсии, нужно вычесть из каждого наблюдаемого значения среднее, возвести в квадрат все полученные отклонения, сложить квадраты отклонений и разделить полученную сумму на объем выборки:
Дисперсия (степень разброса значений признака) позволяет анализировать сложные явления. Например, мы исследуем проблему посещаемости занятий студентами. Сравним две группы. За месяц семинары по социологии (4 занятия) в первой группе (общее количество 20 человек) посетили соответственно 18, 20, 20. 18 человек. Во второй (всего 30 человек) на каждом из четырех занятий побывали соответственно 15, 23, 10 и 28 человек. Если рассчитать среднюю посещаемость занятий, она окажется одинаковой.
;
.
Однако видно, что посещение семинаров по социологии второй группой сильно отличается от первой. Обозначить проблему и инициировать ее решение поможет вычисление дисперсии.
Чтобы наглядно представить себе проблему посещаемости занятий студентами, отобразим имеющиеся данные в виде таблицы (табл. 6).
Таблица 6
Номер занятия
|
Посещаемость занятий в 1-й группе
|
Отклонение от средней
|
Величина квадрата отклонения
|
Посещаем. Занятий во 2-й гр.
|
Откл. От сред.
|
Вел. Квадр. Откл.
|
1
|
18
|
-- 1
|
1
|
15
|
-- 4
|
16
|
2
|
20
|
+ 1
|
1
|
23
|
+ 4
|
16
|
3
|
20
|
+ 1
|
1
|
10
|
-- 9
|
81
|
4
|
18
|
-- 1
|
1
|
28
|
+ 9
|
81
|
Основы прикладной социологии / Под ред. Шереги Ф.Э., Горшкова М.К. С.27.
Вычисляя дисперсию (степень отклонения признака от среднего значения) по формуле, получаем:
;
.
Большое значение дисперсии соответствует большому разбросу признака (посещаемости) и свидетельствует о сильной неравномерности распределения значений (неоднородности объекта).
Еще одной характеристикой вариативности признаков изучаемой совокупности является стандартное отклонение ( ), являющееся корнем квадратным из дисперсии:
.
Стандартное отклонение наиболее точно оценивает типичность среднего показателя: оно тем меньше, чем полнее среднее значение представляет всю совокупность наблюдений.
Стандартное отклонение – отличный показатель положения любого конкретного значения относительно среднего. При работе с первичными данными (баллами теста, величиной дохода, вариантами признаков и т.д.) часто возникает желание так же выразить их в единицах стандартного отклонения от среднего. Получаемые в результате оценки называются стандартными, или Z-оценками и вычисляются по формуле :
.
Z-оценка каждого наблюдаемого явления ( ) (степень отклонения от среднего значения) определяется разностью числового показателя этого явления ( ) и среднего показателя ( ), деленной на стандартное отклонение ( ). Стандартные оценки позволяют перейти от множества разрозненных первичных наблюдаемых значений какого-либо признака к шкале с удобными для расчетов показателями среднего и стандартного отклонения.
-
Очень важным средством анализа социологической информации является поиск статистической взаимосвязи между признаками наблюдаемого объекта, называемой корреляционной зависимостью (корреляцией). Корреляционная зависимость проявляет себя как тенденция и носит вероятностный характер. Она не является такой же однозначной, как функциональная зависимость (например, между изменением температуры и показаниями термометра). Корреляция предполагает зависимость одной (или нескольких) величины измеряемого признака от значения (комплекса значений) другой величины. Корреляция может выражаться в соответствии значения одной величины измеряемого признака целому комплексу значений другой величины. Например, с изменением уровня образования меняется и доход человека, причем определенному уровню образования соответствует не одно, а целый веер значений признака «доход». Корреляционная зависимость не означает однозначной однонаправленной связи между явлениями. В ней часто не ясно, что является причиной, а что – следствием. Она выражает обычно множество переплетенных между собой причинно-следственных связей. Корреляция означает лишь, что если две величины изменяются совместно, то по значению одной из них можно предсказать или определить тенденцию изменения значений другой.
Корреляционный анализ предполагает изучение парной (между двумя признаками) и множественной (между несколькими признаками) корреляции; установление формы связи (прямолинейной или неоднозначной); типа связи (прямой, обратной или неопределенной); силы связи (тесноты зависимости), то есть степени сопряженности между признаками. Выделяют следующие виды корреляционных связей: строгая прямая и строгая обратная, слабая обратная и слабая прямая, криволинейная, неопределенная.
Силу связи между сопряженными признаками демонстрируют различные коэффициенты корреляции. Наиболее простым считается коэффициент ассоциации, показывающий зависимости между дихотомическими признаками (таблица 2*2). Например, зависимость факта подработки во время учебы от пола студента выражается с помощью коэффициента ассоциации ( ), вычисляемого по формуле:
,
где a, b, c, d – эмпирически фиксируемые частоты признака (см. таблицу 7)
Таблица 7
Подрабатываете ли вы во время учебы?
|
Юноши
|
Девушки
|
Да
|
9 (a)
|
1 (d)
|
Нет
|
10 (c)
|
15 (b)
|
Зборовский Г.Е., Шуклина Е.А. Прикладная социология. С.163
Значения коэффициента ассоциации меняются в диапазоне от – 1 до + 1, вне зависимости от знака «1» всегда означает явно выраженную связь (прямую или обратную), а «0» -- отсутствие таковой. В нашем примере, подставив значения таблицы 7 в формулу, получим коэффициент ассоциации 0,49, что демонстрирует довольно устойчивую связь между подработкой во время учебы и мужским полом респондента.
Наиболее простым среди коэффициентов ранговой (находящей соответствие между ранговыми шкалами) корреляции является коэффициент Спирмена. Он позволяет определить тесноту связей между переменными, значения которых можно проранжировать (например, жизненные ценности у мужчин и женщин). В таблице 8 представлены основные жизненные ценности мужчин и женщин, которые выражены в процентах и упорядочены в виде рангов.
Таблица 8
Жизненные ценности
|
Мужчины
%
|
Мужчины
Ранг
|
Женщины
%
|
Женщины Ранг
|
Здоровье
|
82,4
|
1
|
91,1
|
1
|
Семья
|
67,1
|
3
|
75,4
|
2
|
Карьера
|
81,3
|
2
|
68,1
|
3
|
Образование
|
49,4
|
5
|
54,2
|
4
|
Общение
|
45,8
|
6
|
52,1
|
5
|
Деньги
|
54,1
|
4
|
49,1
|
6
|
Зборовский Г.Е., Шуклина Е.А. Прикладная социология. С. 164
Коэффициент рассчитывают по формуле:
,
где – разность рангов, – число пар рангов.
Коэффициент Спирмена меняется в интервале от – 1 до + 1. Коэффициент +1 означает полную идентичность в ранжировании сравниваемых признаков. Коэффициент – 1 показывает прямо противоположное расположение исследуемых признаков. Если рассчитать коэффициент Спирмена для данных, приведенных в таблице 8, получим значение 0,77, что свидетельствует о сильной корреляции (взаимном соответствии) основных жизненных ценностей мужчин и женщин.
В учебниках по социологии вы найдете информацию, как рассчитать другие типы корреляций между изучаемыми свойствами. Следует помнить, что корреляционный анализ позволяет установить и измерить неочевидные на первый взгляд связи между явлениями и решить целый класс задач, связанных с воздействием различных факторов на социальные объекты.
Рассмотренные способы статистической обработки и анализа достаточны для описания и объяснения данных, полученных в ходе социологического опроса. В учебном социологическом исследовании ими следует ограничиться. Но следует иметь в виду, что социология располагает более сложными методами обработки эмпирических данных, основанными на достижениях статистики, теории вероятности, модальной алгебры. При желании и необходимости решения нетривиальных исследовательских задач их можно найти в соответствующей специальной литературе.
ВОПРОСЫ И ЗАДАНИЯ:
-
Что такое простая и аналитическая группировка данных? Приведите примеры аналитической группировки.
-
Чем отличаются атрибутивные и вариационные ряды распределения?
-
В каких случаях для отображения рядов распределения применяется полигон, а в каких – гистограмма?
-
Что называют «позиционным средним»? Каково его значение для анализа данных?
-
Какие способы измерения вариаций признака Вы знаете? В каких случаях применяется каждый из них?
-
Что характеризует дисперсия и как она вычисляется?
-
В чем смысл процедуры кодирования? Какие системы кодировки Вы знаете?
-
Какова роль средних величин в анализе данных? Приведите примеры.
-
Что такое корреляционная зависимость? Чем отличается корреляционная связь от функциональной?
-
Приведите примеры парной и множественной корреляционной связи.
РАЗДЕЛ 7. Логический анализ данных и написание итогового отчета
Статистический анализ служит основой для интерпретации полученных данных, понимания изучаемых процессов, объяснения проблемной ситуации, а также формулирования рекомендаций для ее решения. Решение данных задач находит отражение в логическом анализе данных и составлении итогового отчета по результатам конкретного эмпирического исследования. Функциональное назначение этого заключительного этапа социологического исследования состоит в проверке выдвинутых ранее гипотез, описании и объяснении полученных результатов в соответствии с целями и задачами исследовательского проекта.
Можно выделить следующие этапы логического анализа данных:
-
Полное описание изучаемого явления, то есть комплексная, логически завершенная фиксация структурных характеристик и особенностей объекта исследования. Его начинают с анализа линейных распределений (в абсолютных значениях и процентах), то есть с применения простых группировок данных. Для дальнейшего разностороннего рассмотрения объекта используют сложные (комбинационные) группировки, в которых соотносят, как правило, какой-либо признак (успеваемость, посещение занятий и т.д.) с социально-демографическими характеристиками объекта (полом, возрастом, семейным положением, местом проживания, образованием и т.п.)
Важным элементом процедуры целостного описания объекта исследования является обобщение информации посредством расчета логических индексов, средних величин, которые позволяют сделать ее компактной, наглядной, удобной для дальнейшего сопоставления и интерпретации. С помощью определения средних величин и индексов можно выявить основные характеристики объекта, уровни и качество отношения к другим явлениям и процессам (например, степень удовлетворенности учебой, способами организации свободного времени, расписанием занятием, политические и ценностные предпочтения и т.п.)
Следующий необходимый элемент процедуры описания объекта —сравнение. Можно сопоставить состояния объекта в разные периоды времени (например, отношение студентов к социологии в начале и конце семестра) с целью выявления характерных особенностей изучаемой совокупности и тенденций ее изменения. Интересные результаты дает сравнение аналогичных признаков, измеренных на разных объектах, что позволяет детальнее определить и описать эти признаки, а также проанализировать основные характеристики объектов с точки зрения их сходства и различия. Например, можно сравнить мотивы поступления в университет разных студентов, способы наиболее эффективной довузовской подготовки и т.п. Полномасштабное сравнение предполагает сопоставление данных не только между собой, но и с доступными статистическими сведениями, а также материалами других исследований, что позволяет увидеть объект в широком социокультурном контексте, выявить его специфические особенности, проанализировать логику взаимодействия с другими социальными явлениями.
Сравнение не такая простая процедура, как кажется на первый взгляд. Оно требует внимания к методике проведения. Сравнению подлежат типологически однородные (сравнимые) признаки. Нельзя сравнить пол одного респондента и спортивную подготовку другого, или, что не так очевидно, выполнение домашних заданий и успеваемость. В первом случае речь идет о действиях человека, а во втором – о фактическом состоянии дел. В такой ситуации лучше говорить о корреляционной зависимости. Чтобы вовлечь эти два фактора в процедуру сравнения, их нужно логически объединить в обобщенное понятие, скажем, «отношение к учебе», и уже по этому критерию сравнивать с другими стилями и результатами отношения к учебе, которые могут характеризоваться невыполнением домашнего задания и другой успеваемостью. Таким образом, еще один важный метод описания результатов исследования – типологизация. Он состоит в разбиении совокупности объектов на группы, результатом которого становится типология. Структурный элемент типологии – тип. Например, можно составить типологии по типам отношения к учебе, типам проведения досуга, типам получения дохода и т.д. В основе типологии – проблема выбора критерия типологизации, то есть признака, по которому ведется сравнение и объединение в случае сходства в один тип. Критерием типологизации может выступать не один признак, а несколько, но при условии корреляционной связи между ними.
-
Следующим этапом логического анализа эмпирических данных является объяснение. Оно является важнейшим элементом аналитического исследования и представляет собой способ познания объекта посредством выявления его сущностных связей и отношений. Уже на этапе создания программы аналитического исследования используются типы операционализации понятий (факторный, функциональный, генетический), которые задают объяснительные модели работы с информацией и помогают анализировать факторы, влияющие на поведение объекта, функции в системе общественных взаимосвязей, а также генетические и причинно-следственные связи изучаемой совокупности. Например, аналитическое исследование о причинах отсева студентов из вуза предполагает изучение факторов дезадаптации (внутренних и внешних, субъективных и объективных, социально-экономических, психологических и др), позволяющих построить объяснительную модель. Все исследования, направленные на оптимизацию управления социальными процессами, улучшение морально-психологического климата в коллективе, решение конфликтных ситуаций, предполагают анализ функциональных связей изучаемого объекта. Генетические связи можно увидеть в лонгитюдных исследованиях.
-
Самой сложной процедурой анализа информации, реализуемой в аналитических и проектно-конструкторских социологических исследованиях, считается прогноз. Он осуществляется посредством изучения динамики изменения объекта, выявления тенденций его развития, установление причинно-следственных связей с факторами, влияющими на его трансформации. На основании такого рода анализа возможно подтверждение или корректировка прогнозных гипотез, заложенных в программе исследования.
Описание, объяснение, прогнозирование являются элементами основной логической процедуры освоения социологической информации – интерпретации – построения полной мыслительной модели исследуемого объекта, делающей возможным понимание окружающей действительности и плодотворную деятельность. Сами по себе эмпирические данные, да и статистические закономерности еще не дают, строго говоря, знания об объекте. Социолог, опираясь на свое видение мира, прошлый опыт и знания, воображение и интуицию, а также в зависимости от целей и задач исследования истолковывает и связывает друг с другом эти сведения, строит целостную картину социальных процессов и явлений для дальнейших практических действий. Процесс интерпретации эмпирических и статистических данных позволяет осмыслить и проверить выдвигаемые ранее гипотезы, выстроить объяснительные конструкции, в которых нашлось бы место каждому обнаруженному факту или тенденции.
Итог эмпирических и логических изысканий социолога находит отражение в завершающей операции – составлении и оформлении отчета исследования.
В зависимости от вида исследования форма отчета может быть как сжатой, так и предельно развернутой. Он может ориентироваться на логические обобщения и развитие общей или частной теории, а может быть нацелен на конкретные практические рекомендации управления объектом.
Логика развернутого отчета может быть обозначена следующим образом: Во введении обосновывается актуальность изучаемой проблемы, описываются трудности при ее выявлении и решении, демонстрируется специфика исследовательских подходов к данной проблеме, реализованных в представленном проекте. Далее дается общая характеристика исследования: цели, задачи, объект исследования и обоснование выборки, методы получения информации, время, место, особенности проведения исследовательских процедур, демонстрируется социально-демографический состав объекта исследования. В последующих главах (их количество, как правило, совпадает с количеством выдвинутых гипотез) последовательно анализируются данные, интерпретируются ситуации, обосновываются варианты решения проблем по каждой поставленной задаче. В заключении даются практические рекомендации относительно объекта исследования. Отчет завершается «Приложениями», куда входит методический и методологический инструментарий исследования: программа, рабочий план, анкеты и другие инструменты, таблицы, диаграммы, схемы и другие материалы статистической обработки данных.
Качество социологического исследования определяется соответствием полученных данных целям и задачам исследования, созданием новых объяснительных моделей изучаемых феноменов, наличием практических рекомендаций по управлению социальными объектами, а также надежностью и достоверностью полученной информации, позволяющей прогнозировать характер функционирования и изменения социальных процессов.
ВОПРОСЫ И ЗАДАНИЯ:
-
Что такое интерпретация? Какова ее роль в логической обработке данных?
-
Чем отличаются друг от друга статистический и логический анализ эмпирических данных?
-
В чем суть логического анализа данных и каковы его этапы?
-
Какова роль описания в интерпретации полученных результатов исследования?
-
Перечислите основные процедуры описания данных.
-
Чем объяснение отличается от описания?
-
На основании чего делаются социальные прогнозы?
-
Какие проблемы существуют при сравнении данных? Как их решать?
-
Что такое типология данных? Какую роль она играет в логическом анализе эмпирической информации?
-
Какова структура отчета о социологическом исследовании? Сформулируйте основные требования к его составлению.
Поделитесь с Вашими друзьями: |