МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ГОУ ВПО НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ
ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
УТВЕРЖДАЮ
Декан исторического факультета
________________В.П. Зиновьев
«____»_________________2011 г.
Рабочая программа
ЭКСПЕРТНЫЙ АНАЛИЗ
НЕСТРУКТУРИРОВАННОЙ ТЕКСТОВОЙ ИНФОРМАЦИИ
В ГУМАНИТАРНЫХ НАУКАХ
Квалификация (степень) выпускника
Магистр
Программа «Методология исторического познания и историческое сознание»
Форма обучения
очная
Томск – 2011
I. ОРГАНИЗАЦИОННО-МЕТОДИЧЕСКИЙ РАЗДЕЛ
-
Цели освоения учебной дисциплины
Выработать навыки аналитических компетенций в области формализации обработки неструктурированной текстовой информации в различных предметных областях.
Сформировать понимание междисциплинарных теоретических основ контент-анализа и дискурс-анализа.
Дать представление о новейших тенденциях применения кантент-анализа в различных отраслях профессиональной информационной деятельности.
Познакомить с возможностями использования компьютерных экспертных систем автоматизированной обработки текстовой информации. Обеспечить освоение профессиональных компетенций, связанных с услугами аналитического консалтинга, мониторинга СМИ, разработки баз данных в области гуманитарных наук.
2. Место учебной дисциплины в структуре ООП магистратуры
Данная дисциплина входит в раздел «М.2.» «Профессиональный цикл. Вариативная часть» по направлению 030600 – история.
Для изучения дисциплины необходимы компетенции, сформированные у обучающихся в результате освоения дисциплин ООП подготовки бакалавра по всеобщей истории, информатики, математики, культурологии, философии и социологии.
Данная учебная дисциплина входит в набор дисциплин профессионального цикла, ориентированных на изучение методологии истории и исторического сознания.
3. Компетенции обучающегося, формируемые в результате освоения дисциплины
В результате освоения дисциплины студент должен:
Знать:
-
Основы формализации и алгоритмизации аналитических процедур;
-
Понятийно-терминологический аппарат, связанный с неструктурированной и структурированной текстовой информацией;
-
Современные направления использования контент-анализа, интент-анализа и дискурс-анализа.
-
Современными методами и системами аналитического мониторинга информационного поля СМИ для изучения тенденций в историческом сознании
Уметь:
-
Соблюдать требования научной строгости в анализе больших массивов текстов;
-
Превращать исходные количественные показатели в дискретные качественные признаки, а исходные качественные признаки деконструировать в количественные в соответствии со спецификой изучаемых текстов.
-
Проектировать базы данных и осуществлять статистическую обработку данных в гуманитарных исследованиях.
-
Использовать различные возможности автоматизации обработки неструктурированной текстовой информации.
Данная дисциплина способствует формированию следующих компетенций, предусмотренных ФГОС-3 по направлению ВПО 030600 – История:
А) общекультурные (ОК):
- владеет культурой мышления; способность к восприятию, анализу, обобщению информации, постановке целей и путей ее достижения (ОК-1);
- Стремится к саморазвитию, повышению квалификации и мастерства, способен изменять при необходимости профиль своей профессиональной деятельности, способен к социальной адаптации (ОК-6);
- Способность использовать в познавательной и профессиональной деятельности базовые знания основ информатики, элементы естественнонаучного и математического знания
(ОК-13).
Б) профессиональные (ПК)
Общепрофессиональные: Владеет способностью использовать теоретические знания и методы исследования на практике (ПК-2); Способен к работе в архивах и музеях, библиотеках, владеет навыками поиска необходимой информации в электронных каталогах и в сетевых ресурсах (ПК-9);
Научно-исследовательские: Владеет основами информационно-аналитической деятельности и способностью их применить в профессиональной сфере (ПК-10); Владеет способностью выявлять и отбирать документы для разных типов и видов публикаций (ПК-21); Владеет способностью вести научно-методическую работу в государственных, муниципальных архивах и архивах организаций (ПК-22).
Технологические: Владеет способностью совершенствовать технологии документационного обеспечения управления и архивного дела на базе использования средств автоматизации (ПК-38);
Проектные: Владеет принципами и методами упорядочения состава документов и информационных показателей (ПК-44).
4. Структура и содержание учебной дисциплины
Общая трудоемкость дисциплины составляет 1,5 зачетные единицы, 54 часа.
|
|
Виды учебной работы (в час.)
|
|
Номер и название тематического модуля
|
Раздел
дисциплины
|
Семестр
|
Неделя семестра
|
Лекции
|
Лабораторные работы
|
СРС
|
Формы текущего контроля успеваемости
|
I. Теоретические аспекты экспертного анализа неструктурированной текстовой информации
|
Тема 1. Теория и методы контент-анализа
|
II
|
|
2
|
2
|
5
|
контрольная работа
|
Тема 2. Введение в теорию и методики автоматизации "добычи знаний"
|
II
|
|
2
|
3
|
5
|
контрольная работа
|
Тема 3. Принципы и направления дискурс-анализа.
|
II
|
|
2
|
2
|
5
|
аналитический доклад
|
II. Прикладные и аспекты и практические навыки обработки неструктурированной текстовой информации
|
Тема 4. Ивент-анализ политических и социально-экономических ситуаций.
|
II
|
|
1
|
2
|
5
|
контрольная работа
|
Тема 5. Введение корпусную лингвистику.
|
II
|
|
1
|
3
|
5
|
контрольная работа
|
Тема 6. Статистические методы в исследовании текстовой информации.
|
II
|
|
1
|
3
|
5
|
контрольная работа
|
|
Итого
|
|
|
9
|
15
|
30
|
итоговое тестирование
|
Форма итогового контроля знаний – экзамен.
5. Образовательные технологии
Неимитационные методы обучения:
-
Технология лекции-визуализации используется по всем темам спецкурса. Лекция-визуализация учит студента преобразовывать устную и письменную информацию в визуальную форму, для более глубокого понимания сути изучаемого материала и его лучшего запоминания. Кроме того, инфографика – главный способ отображения результатов контент-анализа. В связи с этим демонстрация образцов визуализации данных и задания на самостоятельную оперативную визуализацию имеют также прикладную цель освоения технологических навыков. В ходе показа авторских слайд-презентаций, посвящённых теории и практике контент-анализа, значительная часть тезисов или вопросов сопровождается постепенным поэлементным демонстрированием образцов инфографики (схемы, диаграммы, SmartArt). На основе этих образцов студентам предлагается в их конспектах графически отображать ту часть лекционного материала, которая, даётся только в устной форме и текстовом виде (на слайдах). В рамках учебной дисциплины технология лекции-визуализации должна формировать следующие компетенции: ОК-1, ОК-6, ПК-10.
-
Технология проблемной лекции используется по всем темам учебного Модуля №2. «Методические и прикладные аспекты контент-анализа». Проблемная лекция начинается с вопросов, с постановки практических проблем обработки неструктурированной или слабоструктурированной текстовой информации. Эти проблемы студенты с помощью преподавателя должны решить в ходе изложения материала. Лекция строится таким образом, что деятельность студента по ее усвоению приближается к поисковой, исследовательской. Обязателен диалог преподавателя и студентов. В рамках учебной дисциплины технология проблемной лекции должна формировать следующие компетенции: ОК-1, ОК-13, ПК-2, ПК-10, ПК-21, ПК-44.
Имитационные методы обучения
-
Составление тематического тезауруса-классификатора единиц контент-анализа для предложенной преподавателем комбинации выборки текстов любого жанра, дискурсивно-лингвистической тенденции и предметно-тематической области. Примеры и образцы тезаурусов-классификаторов демонстрируются преподавателем на лекциях. Это задание должно формировать следующие компетенции: ОК-1, ОК-6, ПК-2, ПК-21, ПК-22, ПК-44.
-
Разработка проекта контент-аналитического исследования (исследовательской модели) изучения выборки однотипных текстов (сообщений СМИ и публицистики, политических речей и заявлений, архивных документов или текстов любого иного типа и жанра). Выборка может, как собираться студентом (по желанию), так и предлагаться преподавателем. В случае выбора источниковой базы студентом, она должна быть связана с темой курсовой работы. Пункты проекта и этапы проведения контент-аналитического исследования:
-
Объект исследования: определить, какой конкретный текст или выборка текстов анализируется в исследовании.
-
Цели и задачи, связанные предметной областью.
-
Учитываемые и анализируемые лингвистические единицы текста.
-
Учитываемые единицы счёта, относительно которых выявляется встречаемость лингвистических или семантических единиц текста.
-
Внетекстовые явления предметной области базовой дисциплины (исторические, психологические, социальные, литературные, политические и др.), отождествляемые с учитываемыми лингвистическими единицами или выводимые из них.
-
Вид контент-анализа и обоснование использования именно этого вида.
-
Описание (или моделирование в случае отсутствия описания) матрицы данных, на которой основано исследование.
-
Описание и обоснование использованных математических методов.
-
Вербальное описание приведённых либо возможных табличных и визуальных форм и способов представления эмпирических числовых результатов контент-анализа.
-
Обобщающие выводы и выявленные закономерности для предметной области базовой дисциплины.
Задание должно формировать следующие компетенции: ОК-1, ОК-13, ПК-2, ПК-10, ПК-21, ПК-22, ПК-44.
-
Автоматизация контент-анализа в офисных компьютерных приложениях c использованием макросов, логических и статистических функций, элементов управления GUI. С помощью средств автоматизации нужно сгенерировать матрицу данных контент-анализа выборки тектов, сгенерировать таблицы и графики, с обобщающие результаты анализа, а затем кратко проанализировать статистические характеристики и параметры шкал данных. Выборка текстов должна быть обязательно связана с темой курсовой работы. Это задание должно формировать следующие компетенции: ОК-13, ПК-4, ПК-38, ПК-44.
6. Оценочные средства для текущего контроля успеваемости, промежуточной аттестации по итогам освоения дисциплины и учебно-методическое обеспечение самостоятельной работы студентов.
-
Методика промежуточных контрольных аналитических докладов
Используется в ходе лабораторных занятий. Суть методики в оценке индивидуальной работы и доклада по использованию изученных типов и методик анализа неструктурированной текстовой информации в работе над магистерскими исследованиями. Дополнительные вопросы в обязательном порядке задаются всеми слушателями доклада. Вопросы слушателей оцениваются как часть их лабораторной работы.
-
Методика итоговых тестовых заданий
В задании каждому тестируемому учащемуся предлагается: 2) список терминов и понятий по изученным темам 3) список определений терминов и понятий по изученным темам. Тестируемый учащийся должен установить правильные соответствия между предложенными списками.
7. Учебно-методическое и информационное обеспечение:
Рекомендуемая литература:
-
Аверьянов Л.Я. Контент-анализ. М., 2007
-
Баранов А. Н., Караулов Ю. Н. Словарь русских политических метафор. М., 1994
-
Баранов А.Н. Введение в прикладную лингвистику. М., 2001
-
Барт Р. Введение в структурный анализ повествовательных текстов / пер. с франц. // Зарубежная эстетика и теория литературы ХIХ-ХХ вв.: Трактаты, статьи, эссе. М.: МГУ, 1987.
-
Барт Р. Мифологии / пер., вступ. ст. и коммент. С. Н. Зенкина. М., 1996.
-
Влияние Интернета на сознание и структуру знания: [сб. ст.] / Рос. акад. наук, Ин-т философии. - М.: ИФРАН, 2004. - 239 с.
-
Воронин Ю.А. О базовых задачах искусственного интеллекта в мультидисциплинарных исследованиях / Ю.А.Воронин, Е.Н.Черемисина. - Новосибирск, 2001.Ч.1: Описание, сравнение, классифицирование и распознавание. - 234 с.Ч.2: Оценивание, районирование, периодирование, предсказание и организация. - 2002. - 176 с.
-
Давлетшина Н.В. Массивы материалов СМИ как исторический источник по российской истории новейшего времени // Круг идей: историческая информатика в информационном обществе.Труды VII конференции АИК. М., 2001
-
Дюк В.А., Флегонтов А.В., Фомина И.К. Применение технологий интеллектуального анализа данных в естественнонаучных, технических и гуманитарных областях // Известия Российского Государственного Педагогического Университета им. А.И. Герцена. Естественные и точные науки. Вып. 138, 2011. С. 77-84
-
Ермаков А.Е. Автоматизация онтологического инжиниринга в системах извлечения знаний из текста // Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог'2008. М., 2008
-
Захаров В.П. Корпусная лингвистика. СПб., 2005.
-
Зверев В.М. Социологическое прочтение философских идей России XVIII века: контент-анализ. С.-Пб., 1998
-
Здравомыслов А.Г. Немцы о русских. Контент-анализ. М., 2003
-
Зильберт Б.А. Социопсихолингвистическое исследование текстов радио, телевидения, газет. Саратов, 1986
-
Ильясова С.В., Амири М.П. Языковая игра в коммуникативном пространстве СМИ и рекламе. М., 2009.
-
Йоргенсен М.В., Филлипс Л.Д. Дискур-анализ. Теория и метод / Пер. с англ. 2-е изд., испр. М. 2008.
-
Карасик В.И. Языковой круг: личность, концепты, дискурс. М., 2004.
-
Квале, С. Исследовательское интервью. — М.: Смысл, 2003.
-
Кузнецов И.Н. Информация: сбор, защита, анализ. Учебник по информационно-аналитической работе. М., 2001
-
Курилович Н.В. Контент-анализ: логика развития метода // Методология исследования политического дискурса: актуальные проблемы содержательного анализа общественно-политических текстов. Вып. 2. Мн.: БГУ, 2000
-
Ландэ Д.В. Поиск знаний в Internet. М., 2005
-
Лапшова О.А. Психологическое содержание текста и его оценивание методами интент-анализа и психосемантики. Дис. канд. психол. наук.. М., 2003
-
Латынов В.В. Исследование социальных представлений методом интент-анализа. // Языковое сознание: формирование и функционирование. Сб. ст. / Отв. ред. Н.В. Уфимцева. М., 1998
-
Малкина Г.Ю. Контент-анализ автобиографических рассказов в изучении личностных свойств. Дис. канд. психол. наук. М., 2005
-
Миронов Б.Н. История в цифрах: Математика в исторических исследованиях. Л., 1991
-
Овчинникова И.Г., Угланова И.А. Компьютерное моделирование вербальной коммуникации: учебно-методическое пособие. М.: Наука, 2009.
-
Петрова Н.Е., Рацибурская Л.В. Язык современных СМИ: средства речевой агрессии: учеб. пособие. М., 2011.
-
Речевое воздействие в сфере массовой коммуникации / Отв.ред. Ф.М.Березин, Е.Ф.Тарасов. М., 1990
-
Слово в действии. Интент-анализ политического дискурса / Под. ред Ушакова Т.Н., Павловой Н.Д. - С.-Пб., 2000
-
Сэлтон Г. Автоматическая обработка, хранение и поиск информации. Нью-Йорк, 1968, Пер. с англ. М., 1973
-
Чубукова И.А. Data Mining: Учеб. пособие. М.: Интернет-университет информационных технологий: БИНОМ: Лаборатория знаний, 2006.
-
Чураков А.Н. Компьютерный контент-анализ. М.: Институт социологии РАН, 1996
-
Шумилина Т.В. Методы сбора информации в журналистике. М., 1983
-
Эпштейн М.Н. Информационный взрыв и травма постмодерна // "Русский Журнал" 1998. http://old.russ.ru/journal/travmp/98-10-08/epsht.htm
-
Яковлев И. Компьютерные технологии контент-анализа прессы в планировании президентских избирательных кампаний // Электоральные технологии и президентские выборы. – Кишинев: CAPTES, 2000
Рекомендуемые интернет сайты:
-
http://www.rco.ru
-
http://demo.rco.ru
-
http://www.spss.ru
-
http://www.autonomy.com
-
http://www.galaktika.ru/2/products/zoom
-
http://www.medialogia.ru/
-
http://www.rscip.ru/files/Trend.ppt
-
http://www.anbr.ru
-
http://www.alphaworks.ibm.com/tech/uima
-
http://research.metric.ru
-
http://www.newsfactory.ru/soft/archive.phtm
8. Материально-техническое обеспечение дисциплины
Компьютерный класс, оргтехника, теле- и аудиоаппаратура (всё – в стандартной комплектации для практических занятий и самостоятельной работы); доступ к сети Интернет (во время самостоятельной подготовки и на лабораторных занятиях). Программное обеспечения для обработки текстовой, статистической и графической информации.
Составитель:
А.В.Бочаров, кандидат исторических наук, доцент кафедры истории древнего мира, средних веков и методологии истории
Рецензент:
Н.С.Ларьков, доктор исторических наук, профессор кафедры истории и документоведения
Программа рекомендована методической комиссией исторического факультета ТГУ
Председатель комиссии, доцент ______________В.Ю. Соколов
Протокол №____от______ __________________2011 г.
ПРИЛОЖЕНИЕ
Содержание тематических блоков и задания контрольных работ
Модуль I. Теоретические аспекты экспертного анализа неструктурированной текстовой информации
Тема 1. Теория и методы контент-анализа (КА). Понятия структурированной и неструктурированной информации. Понятие о кодировании латентных признаков в тексте. Тезаурус технологическая как основа семантического КА. Междисциплинарность КА. Типология видов КА: частотный, семантический, контекстно-тематический, интент-анализ, стилометрия, нарративный анализ. Mодель КА Оле Хольсти. Использование концепция Р.Барта и М.Фуко. Взаимосвязь понятий подтекста, интертекста и гипертекста. Интент-анализ в психосемантике и психолингвистике: изучение репрезентации образно-символических и эмоционально-волевых проявлений в тексте. Кодирование высказываний по логико-синтаксическим связям. Использование комбинаторики в КА.
Контрольное практическое задание: Написать проект контент-аналитичского исследования, связанного с темой магистерского исследования
Тема 2. Введение в теорию и методики автоматизации "добычи знаний" (data mining, text mining, релевантность и пертинентность). Экспертные системы обработки текстовой информации. Индексные файлы и принципы работы поисковых систем. Поисковые метамашины. Авторубрикаторы и фактэкстракторы. Мониторинг СМИ и контент-аналитические роботы.
Контрольные задания: По поисковому запросу "Computer Content Analysis Programs" или "Software for Content Analysis" найти описание или демоверсию контент-аналитической программы и составить аннотацию её функциональных возможностей, используя приобретённые теоретические знания по контент-анализу. Для иллюстрации аннотации использовать скриншоты.
Тема 3. Принципы и направления дискурс-анализа.
Лингвистико-дискурсивный характер конституирования социальных процессов и структур. Понятие дискурса и дискурсивных практик. Ключевые посылки дискурс-анализа. Концепция археологии и генеалогии знания М.Фуко. Теория дискурса Лакло и Муфф: деконструкция, артикуляция, борьба значений, идеология и гегемония. Дискурсивная психолоигия: психосоциальные и субкультурные идентичности, интерпретативные репертуары. Критический дискурс-анализа Фэркло. Аналитические стратегии дискурс-анализа: границы дискурсов, содержание дискурсов, инструменты эмпирического анализа, преувилечиние деталей и полифоничность, релятивизм и рефлексивность.
Контрольное практическое задание: провести дискурс-анализ текста или корпуса текстов из предметной области магистреского исследования
Модуль II. Прикладные и аспекты и практические навыки обработки неструктурированной текстовой информации.
Тема 4. Ивент-анализ политических и социально-экономических ситуаций. Использование для отображения и презентации результатов ивент-анализа режима "Структура" в приложениях MS Office Word, Excel, PowerPoint (либо в соответствующих им приложениям OpenOffice).
Контрольное практическое задание: Провести ивент-анализ актуальной современной или исторической ситуации на основе одного или нескольких текстов (статей или глав из книги) и отобразить результаты анализа в режиме "Структура" в приложениях MS Office или OpenOffice.
Тема 5. Введение корпусную лингвистику и знакомство с возможностями её использования в документоведении, мониторинге СМИ, источниковедении, историографии. Использование текстовых функций в приложениях Microsoft Office Excel или OpenOffice Calc для анализа корпуса неструктурированной текстовой информации. Использование макросов и языка VBA в табличных процессорах. Использование элементов управления ActiveX для макросов.
Контрольное практическое задание: в одном из двух табличных процессоров создать макрос с использованием текстовых функций для обработки корпуса текстов с целью создания матрицы данных, описывающих лексико-семантические свойства текстов. Макрос должен запускаться с помощью кнопки.
Тема 6. Статистические методы и статистические пакеты программ в исследовании текстовой информации. Типы статистических шкал в анализе текстологических признаков. Типы статистических методов в анализе тектологических признаков: основные параметры шкал, кореляция и сопряженность, дисперсионный анализ. Знакомство с направлениями использования многомерными методами в гуманитарных исследованиях: регрессионный анализ, факторный анализ, кластерный анализ, дискриминантный анализ. Знакомство с программами STATISTICA и SPSS.
Контрольное практическое задание: Составить матрицу данных, связанную с тематикой магистерского исследования и обработать изученными подходящими статистическими методами в программах STATISTICA или SPSS.
Поделитесь с Вашими друзьями: |