Караблин О. В., Безуглова М. Н. Некоторые аспекты реконсрукции данных при прогнозировании с помощью временных рядов



Дата12.03.2019
Размер70 Kb.

Караблин О.В., Безуглова М.Н.

НЕКОТОРЫЕ АСПЕКТЫ РЕКОНСРУКЦИИ ДАННЫХ ПРИ ПРОГНОЗИРОВАНИИ С ПОМОЩЬЮ ВРЕМЕННЫХ РЯДОВ

Временные ряды - один из давних объектов статистического анализа социально — экономических систем. Они являются основным результатом экспериментов, как натурных, так и вычислительных. Потому и методы их обработки развивались давно. В качестве основных побудительных мотивов являются задачи финансового анализа (цены акций, товаров, курсы валют).

В силу некоторой неопределенности в течение длительного времени к анализу временных рядов подходили с позиций математической статистики. Использовался соответствующий математический аппарат, включающий понятия последовательностей случайных величин, случайных процессов, статистических моделей, стохастических дифференциальных уравнений. Были также выделены две основные задачи анализа временных рядов:

1. Задача идентификации. При ее решении делается попытка ответить на вопрос, каковы параметры системы, породившей данный временной ряд. Параметры могут быть самыми различными — статистические распределения, параметры статистических моделей, спектральные свойства и т. п. Важно, что эти параметры могут помочь идентифицировать (распознать) систему, т. е. отличить ее от других или определить её положение в пространстве состояний. Проблемы такого типа возникают, например, в задачах диагностики состояния социально — экономических систем, когда на систему действуют множество факторов, а используют только доступные измерению характеристики.

2. Задача прогноза. Она состоит в том, чтобы по данным наблюдений предсказать будущие значения измеряемых характеристик или, более широко, будущее состояние анализируемой социально — экономической системы.

Статистика предложила первые подходы к решению этих задач. Нелинейная динамика внесла свой весьма существенный вклад, однако не столько в сами практические методики, сколько в их концептуальное обоснование. До нее методы, дававшие зачастую неплохие результаты, выглядели несколько мистически. Поэтому сначала мы несколько слов скажем об основных чертах статистических подходов, а потом обратимся к методам нелинейной динамики.

В основе многих статистических методов обработки лежит понятие статистической модели. По сути, это те же самые динамические системы с шумом, однако теперь акцент делается не столько на динамике, сколько на шуме [1]. Предполагается, что на такую систему действует некоторый «стандартный» некоррелированный гауссовый шум, а для выходного сигнала появляется некоторое свое характерное распределение и свои характерные временные корреляции, обязанные своим появлением динамике. Задача обработки заключается в том, чтобы построить динамическую часть таким образом, чтобы она преобразовывала шум во временной ряд, в некотором смысле аналогичный обрабатываемому. В каком именно смысле — зависит от контекста. Можно требовать только совпадения нескольких моментов распределения, можно требовать совпадения и более тонких характеристик, например, плотности распределения, особенностей спектра или деталей динамики, скажем, наличия редких больших выбросов.

Для них было изобретено даже специальное название: ARMA, от слов AutoRegression - авторегрессия и Moving Average - скользящесреднее, коэффициенты определяются методом наименьших квадратов. Подробно об этой и других подобных задачах можно прочитать в работах, посвященных построению статистических моделей и оцениванию их параметров, там же приводятся и статистические классификации моделей [2, 3, 4 и др.]. Получение искомых коэффициентов можно рассматривать как возможное решение задачи идентификации, а полученное соотношение можно использовать и для прогноза следующего значения по m предыдущим. В качестве прогнозируемой величины обычно используется среднее значение

Заметим в этой связи, что шум является совершенно необходимой и неотъемлемой частью таких линейных моделей. В отсутствие шума поведение модели чаще всего абсолютно не похоже на исследуемый ряд. Поэтому подобные «линейные прогнозы» можно делать лишь на сравнительно небольшое число шагов вперед.

Иногда модели описанного типа называют также линейными цифровыми фильтрами, поскольку процесс порождения временного ряда такой системой по сути представляет собой фильтрацию некоррелированного шума. (Поэтому и шум совершенно необходим — нет шума, значит нечего фильтровать, не из чего «приготовить» сигнал.) Однако при построении цифровых фильтров задачи ставятся иначе; необходимо так подобрать коэффициенты, чтобы добиться нужных спектральных свойств выходного сигнала. Решается задача не идентификации, а преобразования временных рядов. Вообще говоря, цифровая обработка сигналов — это отдельная область, на которой сейчас не останавливаемся.

Главных причин популярности таких моделей было две: это единственная модель, для которой можно получить какие-либо аналитические результаты, а ее построение и использование требует сравнительно небольших затрат машинного времени.

Можно строить и более сложные нелинейные статистические модели вида, но в этом случае построение модели требует более существенных затрат и сильно затрудняет получение каких-либо аналитических оценок. В частности, довольно сложно получить аналитическое выражение для среднего значения правой части. Чтобы преодолеть эту трудность, иногда сразу строят детерминированную модель для прогноза среднего значения [5]. Кроме того, нелинейные модели уже сами по себе могут порождать нетривиальное временное поведение, так что простая картина фильтрации шума может оказаться неприменимой.

Нелинейные модели делят на два типа: параметрические и непараметрические. Параметрическими называют модели, для которых функция одна и та же для всех переменных и зависит от нескольких параметров, которые и необходимо как можно точнее найти по временному ряду. Непараметрические методы используют локальные аппроксимации в окрестности некоторого набора точек, так что функция получается как набор кусочных аппроксимаций в окрестностях заданных узлов (чаще всего кусочно-линейных). Каждая из таких локальных функций, разумеется, тоже зависит от параметров, но набор параметров свой в каждой окрестности, так что термин «непараметрическая регрессия» несколько странен, хотя широко используется в статистике (см., например, [6] и приведенный там обширный список литературы).

Статистические модели такого типа широко применяются, однако у них есть один существенный дефект. Непонятно, имеют ли они какое-либо отношение к действительным уравнениям динамики системы или нет. Некоторые модели, описываемые системами обыкновенных дифференциальных уравнений первого порядка, можно свести к одному уравнению более высокого порядка. Но с другой стороны, существует огромное количество неустойчивых разностных схем, поведение которых имеет мало общего с аппроксимируемыми уравнениями. Поэтому подход следует признать разумным, хотя и недостаточно обоснованным. Его обоснование и было весьма существенным вкладом нелинейной динамики в анализ временных рядов.

Бывают и другие ситуации, когда вид уравнений модели известен и измерению доступны все основные переменные, входящие в них. Иногда считается, что существуют эксперты в экономических вопросах, которые знают, какими уравнениями следует описывать те или иные ситуации, но не знают, какие параметры туда подставить. Тогда задача будет состоять в том, чтобы аккуратно определить значения параметров и выписать, например, детерминированные уравнения для средних величин и моментов. Построение таких уравнений -одна из прикладных задач теории случайных процессов. Полученные уравнения можно использовать как для анализа текущей ситуации, так и для прогнозирования (в качестве прогноза и в этом случае разумно давать математическое ожидание следующего члена ряда).

В данной работе сознательно не освещаются многие серьезные проблемы анализа временных рядов, таких как удаление тренда, получение статистических или спектральных оценок, стационарности, фильтрации шума и т. п. [7]. Они не столь важны для пояснения общей идеи, хотя без них невозможно полноценное практическое воплощение описываемых идей.

В общем случае взаимосвязь переменных приходится постулировать. Есть, однако, класс систем, для которых связь модели авторегрессионного типа с «обычной» моделью объекта может быть доказана при некоторых разумных предположениях. Это случай линейных систем. Несмотря на ограниченную область применимости — поведение траектории в малой окрестности устойчивых неподвижных точек и линейные колебания — этот случай позволяет проиллюстрировать некоторые важные моменты реконструкции нелинейных систем. «Теория реконструкции линейных систем» носит название метода пространства состояний (state space), и была развита в начале 1960-х гг. Изложение наиболее важных ее положений можно найти в большинстве книг по теории управления.

В социально — экономических системах часто встречается ситуация, когда необходимо ими управлять, не зная значений всех переменных: только некоторые из них можно измерить — получается проблема управления по данным наблюдений, т. е. в некотором смысле по временному ряду. Возникают, таким образом, две задачи:

1) откуда взять значения остальных переменных, чтобы определить текущее состояние системы, или что брать вместо них;

2) как использовать это знание для управления системой. Вторая задача выходит за рамки данного изложения, а первая — обсуждается далее.

Для восстановления недостающих переменных очень важно, чтобы матрица, полученная по системе уравнений, была невырожденной. Это условие невырожденности в теории управления называется условием наблюдаемости. Есть ещё одна проблема, которая заключается в том, что размерность п обычно неизвестна, поэтому ее тоже надо определить. Это одна из стандартных задач математической статистики, и, соответствующий, подход называется «анализ главных компонент». Методика состоит в решении задачи на собственные значения для матрицы, тогда в идеальном случае ровно п собственных значений С положительны, а остальные равны нулю. Собственные векторы, отвечающие ненулевым собственным значениям, и определяют подпространство Sn. В дальнейшем полученную динамическую систему можно использовать и в целях прогнозирования.

Итак, мы видим, что для линейной динамической системы в идеальном случае удается по скалярному временному ряду установить ее размерность и восстановить уравнения движения в некотором представлении, которое можно считать полученным из исходного вида невырожденной заменой переменных.

В неидеальном случае возникают следующие трудности: во-первых, в реальных системах обычно присутствует шум и он затрудняет определение размерности п - все проекции на главные компоненты будут ненулевыми. Необходимо отделять шумовые компоненты от истинных, и здесь есть риск потерять размерности, которым отвечают колебания малой амплитуды; во-вторых, наблюдаемое поведение может содержать информацию не о всей динамической системе, а только о ее части.

Другая возможность. Представим себе, что в системе возможны колебания некоторых параметров с двумя различными частотами, но начальные данные были выбраны так, что амплитуда колебаний с одной из частот равна нулю. В этом случае опять система будет восстановлена лишь частично.

Таким образом, по временному ряду можно восстановить только минимальную динамическую систему, описывающую данные наблюдений. Для восстановления полной системы может быть недостаточно информации. Математически этот факт выражается в том, что траектория динамической системы оказывается в некотором подпространстве п - мерного фазового пространства, в результате чего нарушается условие наблюдаемости для n-мерных векторов. Наблюдаемыми оказываются только проекции на подпространство меньшей размерности.

В [7] обосновывается, что условие наблюдаемости может нарушаться из-за специального выбора начальных данных. Другой источник нарушения условия наблюдаемости — это время дискретизации, интервал между последовательными измерениями. Если он кратен периоду колебаний, то такие колебания также окажутся ненаблюдаемы — мы всегда будем видеть только одно значение. Однако оба случая требуют выполнения дополнительных условий, а потому в некотором смысле нетипичны, не являются случаем обшего положения. Характеристики системы можно установить для почти любых начальных данных и почти любых интервалов дискретизации.

Итак, идеи авторегрессионного анализа использовались довольно давно, но, по-видимому, связь авторегрессионных моделей с динамическими системами, описывающими исследуемые процессы, всерьез не анализировалась. Однако такой вопрос возник, когда в конце 1970-х гг. проводились экспериментальные исследования для подтверждения идей маломодовой нелинейной динамики. Группа американцев, изучавших гидродинамические течения, опубликовала в 1980 г. работу «Геометрия по временному ряду» [2], в которой показала, что можно получить удовлетворительную геометрическую картину странного аттрактора небольшой размерности, если вместо переменных, входящих в уравнения динамической системы, использовать т - мерные вектора, получаемые из элементов временного ряда по тому же принципу, что и в задачах авторегрессии

При всей своей простоте практическая реализация идей реконструкции часто сталкивается с проблемами. Возникают они из-за того, что длина обрабатываемого ряда всегда ограничена, во-первых, возможностями хранения информации, во-вторых, скоростью обработки, и в третьих, стационарностью исследуемого объекта — важно знать, в течение какого времени мы можем полагать, что исследуем одну и ту же динамическую систему. Проблема стационарности вообще является бичом большинства методов анализа временных рядов и о ней разговор особый. Для простоты пока будем полагать, что имеется временной ряд из N чисел, которые являются значениями некоторой наблюдаемой, характеризующей одну и ту же динамическую систему. Объем информации, который можно извлечь из этого множества точек, вообще говоря, зависит от свойств поверхности: насколько она искривлена, закручена и т. п., и от свойств функции: насколько велики ее производные. Так как точек конечное число, то существует некоторое характерное расстояние L между точкой и ее ближайшим соседом. Меньшие масштабы будут неразрешимы для данного временного ряда. Если на масштабах порядка L поверхность сильно искривлена, а функция сильно изменяется, то методы нелинейной динамики будут, скорее всего, бесполезны. Эта же проблема в несколько ином виде встречается, например, в задачах цифровой обработки сигналов (так называемая теорема Котельникова).

Поэтому можно сформулировать задачу оптимального выбора параметров реконструкции, так чтобы получаемый набор реконструированных векторов был наиболее информативен.

Для оценки информативности реконструкции необходимы критерии ее качества. Следует сразу заметить, что исчерпывающих критериев качества на сегодня не существует. Любой из описанных ныне в литературе критериев выбора не догма, а лишь руководство к действию. В том смысле, что для каждого критерия существуют ситуации, в которых он вообще не будет работать или будет давать далеко не оптимальные значения.

Тем не менее приведем несколько популярных рекомендаций по выбору параметров реконструкции. Но сначала сделаем несколько предварительных замечаний.

1. Вообще говоря, следует различать два временных интервала - интервал между элементами временного ряда и интервал (временной сдвиг, запаздывание, задержка) между компонентами вектора. Они не обязаны совпадать. Более того, доказательство теоремы Такенса не требует даже, чтобы временные сдвиги между компонентами были одинаковы. В принципе, можно даже поставить задачу оптимизации набора задержек, однако неясно, насколько существенный выигрыш можно получить.

2. Не обязательно соотносить момент t именно с первым элементом вектора. Иногда удобнее считать, что он относится к некоторой промежуточной точке, например, к середине временного интервала, захватываемого вектором.

3. Вообще говоря, реконструкции можно строить не только по скалярным временным рядам. Можно строить вектора и из нескольких наблюдаемых. При этом, однако, возникнет небольшая проблема, связанная с тем, как вычислять расстояние между такими векторами (т. е. как, например, из метров, литров и килограмм получать одно число — расстояние). Однако она обычно вполне разрешима.

В литературе можно найти много рекомендаций и способов выбора задержки τ и размерности вложения m. Как уже говорилось выше, ни на одно из них нельзя полностью полагаться. В простейших модельных случаях они все обычно работают, а для некоторого произвольного, а особенно экспериментального, временного ряда результаты очень часто бывают невразумительны.

Одна из основополагающих идей при анализе получившейся реконструкции состоит в следующем. Если реконструируется траектория динамической системы, то через каждую точку должна проходить только одна траектория, т. е. удовлетворительная реконструкция не должна содержать самопересечений траектории. Разумеется, что самопересечений в массиве дискретных точек, скорее всего никогда не будет, поэтому ищут так называемых «ложных близких соседей» — пары векторов, которые оказались близкими в реконструкции, но их прообразы находились далеко.

При всей своей интуитивной очевидности методика не допускает практически полезной строгой формулировки, поскольку использует нестрогие понятия «близкие» и «не близкие» пары. Строго их определить невозможно, потому что свойства функции априорно неизвестны. Поэтому при численной реализации метода и приходится опираться на интуицию и здравый смысл.

Первоначально для выбора задержки использовали качественную идею о том, что если компоненты, образующие вектор, будут «независимы» друг от друга, то реконструированные вектора будут нести в себе «наибольшее количество информации о системе». Более сложным вариантом была методика, основанная на теории информации [Хакен, Г. ]. Далее по построенным гистограммам рассчитываются энтропии и взаимная информация. Результат, однако, оказался интересным. Для простых модельных систем вроде системы Лоренца почти любой разумный выбор т был если и не хорош, то и не плох. Для более сложных систем, в которых нет одного ярко выраженного «псевдопериодического» поведения оказалось, что данные методики иногда просто невозможно использовать, поскольку автокорреляционная функция может вовсе не иметь первого нуля, а функция взаимной информации - первого минимума. Обе просто монотонно убывают с ростом т. Иногда ноль или минимум есть, но в качестве т оказывается далеко не оптимальным. Поэтому делались попытки разработать более сложные методы, напоминающие технику выбора размерности вложения го. Детали здесь опять таки излагать мы не будем, опишем только важнейшие из них. Самым интересным, пожалуй, оказалось то, что на качество реконструкции влияет не сама по себе величина τ, а временной интервал, захватываемый вектором z — между последним и первым его элементами. Мы будем называть его окнам реконструкции и обозначать w = (m — 1)τ . Далее предположим, что m достаточно велико, чтобы удовлетворять условию теоремы Такенса.

Влияние w на реконструкцию отличается от влияния m, хотя и может быть иногда интерпретировано также в терминах «ложных соседей». Удобнее его характеризовать термином «искажения реконструкции». Можно выделить два типа искажений. Один возникает, когда m слишком мало, проявляется, как правило, только для систем с непрерывным временем, и о нем можно получить представление на простейшем примере реконструкции сигнала cos t [1]. Он заключается в том, что образ реконструируемого множества оказывается «спрессован» вдоль некоторых направлений. Из-за этого, во-первых, возникают ложные соседи, а во-вторых, для изучения деталей аттрактора необ­ходимо различать очень мелкие масштабы, для чего в свою очередь нужны очень большие выборки; время измерения должно быть порядка времени возвращения в очень малую окрестность точки.

Второй тип искажений возникает, когда w слишком велико, но только для хаотических систем. Дискретность или непрерывность времени не важна. Характерным временным масштабом в этом случае выступает величина, обратная энтропии динамической системы. Этот тип искажений немного похож на результат действия «подковы Смейла»: множество как бы подвергается растяжению и складыванию, и вплоть до некоторых масштабов будет исследоваться не структура самого множества, а структура получившихся складок. При этом на соседних складках тоже возникают ложные соседи и на больших масштабах реконструкция может выглядеть как объект существенно большей размерности, чем на самом деле.

Задача выбора оптимальной наблюдаемой для построения реконструкции в литературе не рассматривалась. Видимо такая постановка нетипична для натур­ных экспериментов, а потому и интереса большого не представляет. Возможно, к подобному классу задач можно отнести проблему формирования сводных экономических индексов (биржевых, ценовых, потребительских и т. п.), однако, насколько нам известно, в контексте теории динамических систем данный вопрос не рассматривался.

Использованная литература:



  1. Малинецкий Г.Г., Подлазов А.В. Нелинейная динамика и хаос: Основные понятия. М.: КомКнига, 2006. 240 с.

  2. Бокс Дж., Джекинс Г. Анализ временных рядов. Прогноз и управление. М: Мир, 1974.

  3. Кашьяп Р.Л., Рао А.Р. Построение динамических стохастических моделей по экспериментальным данным. М.: Наука, 1983.

  4. Льюнг Л. Идентификация систем. Теория для пользователя. М.: Физматлит, 1991.

  5. Пугачев В.С., Синицын И.Н. Стохастические дифференциальные системы. М.: Наука, 1985.

  6. Хардле В. Прикладная непараметрическая регрессия. М.: Мир, 1993, 349 с.

  7. Малинецкий Г.Г., Потапов А.Б., Подлазов А.В. Нелинейная динамика: Подходы, результаты, надежды. - М.: КомКнига, 2006. - 280 с.


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©dogmon.org 2019
обратиться к администрации

    Главная страница