Российская Академия Наук
Отделение энергетики, машиностроения
механики и процессов управления
Федеральное государственное бюджетное учреждение науки
Институт машиноведения
им. А.А. Благонравова
Российской академии наук
Профессором М.М. Хрусталевым впервые в мире изучены стохастические дифференциальные игры при неполной информации игроков о состоянии, где получены глобальные условия равновесия по Нэшу в общем нелинейном случае [ I - III ]. При этом охватывается случай, когда вероятностная мера, описывающая распределение состояния процесса в текущий момент времени, не имеет плотности. Последнее важно при рассмотрении сложных систем, в которых некоторые блоки имеют детерминированное описание, а некоторые стохастическое. В частном случае одного игрока эти результаты дают условия оптимальности в стохастической задаче управления при неполной информации о состоянии.
Детально изучен случай оптимального управления линейными стохастическими системами с квадратичным критерием качества при неполной информации о состоянии. При полной информации о состоянии эта задача давно хорошо изучена и ее решение сводится к решению задачи Коши для матричного уравнения Риккати (как и в детерминированном случае). В существенно более важном для практики случае неполной информации о состоянии, изученном в работах М.М. Хрусталева, для синтеза оптимальной стратегии управления необходимо решать краевую задачу (а не задачу Коши) для системы матричных уравнений типа Риккати. Так как эти уравнения нелинейны, применение стандартных схем решения краевых задач малоэффективно. В настоящее время М.М. Хрусталевым и Д.С.Румянцевым разрабатываются эффективные специализированные методы решения такой краевой задачи.
В 2009 году Румянцев Дмитрий Станиславович защитил кандидатскую диссертацию на тему «Оптимальное управление стохастическими квазилинейными системами с информационными ограничениями» (научный руководитель М.М. Хрусталев). В диссертации и в совместных с М.М. Хрусталевым работах детально изучены более общие, чем линейные, квазилинейные динамические стохастические системы, в которых не только коэффициенты сноса, но и коэффициенты диффузии (коэффициенты при белом шуме) зависят линейно от переменных состояния и управлений. В случае полной информации о состоянии задача оптимального управления такими системами была изучена (см., например, работы Параева Ю.И.). В случае же неполной информации о состоянии работы М.М. Хрусталева и Д.С. Румянцева являются пионерскими, опережающими мировой уровень.
Развиваемое М.М. Хрусталевым и Д.С. Румянцевым научное направление охватывает также задачи, в которых сама модель исследуемой динамической системы имеет неопределенность (содержит случайные параметры), задачи с обрывом траекторий (учитывается вероятность гибели управляемого объекта) а также задачи управления с использованием идентификаторов состояния. Ценным качеством развиваемого подхода является то, что он позволяет строить для систем большой размерности оптимальные идентификаторы уменьшенной размерности. В прикладных задачах это позволяет получить приемлемое качество управления без излишнего переусложнения системы управления.
М.М. Хрусталев и Д.С. Румянцев занимаются также приложениями описанных результатов к задачам управления летательными аппаратами (как околоземными, так и космическими). Ряд их работ посвящено задачам оптимальной стабилизации спутников земли с гибкими элементами при их движении вокруг центра масс. Эти результаты применимы и в других сферах приложений: в макроэкономике и экономической динамике, в задачах управления наземными транспортными системами, в том числе трубопроводными, в энергетике, биологии и медицине и др.
В 2011 году были продолжены исследования методов оптимизации квазилинейных динамических стохастических систем со сложной структурой и их приложений к задачам управления космическими летательными аппаратами [16].
В 2011 году М.М. Хрусталевым получен новый, опережающий мировой уровень результат, опубликованный в заказной статье [17] номера журнала Автоматика и телемеханика, посвященного памяти А.М. Летова.
В этой статье предложен и строго обоснован метод синтеза стратегий управления стохастическими динамическими системами на неограниченном интервале времени. Синтезированная стратегия обеспечивает стохастическую устойчивость системы по заданному критерию и оптимальность затрат на стабилизацию в единицу времени по этому критерию. Предполагается, что каждая компонента стратегии управления может зависеть от своего, назначаемого априори, набора компонент вектора состояния, доступных измерению. Предлагается также метод синтеза не обязательно оптимальной стабилизирующей стратегии, обеспечивающей одно и то же значение критерия для всех допустимых процессов. Рассматривается общий нелинейный случай и частный случай линейной динамической системы и квадратичного критерия качества.
Применительно к линейным динамическим системам предложенная теория представляет собой аналог метода аналитического конструирования оптимальных регуляторов (АКОР) А.М. Летова для управляемых стохастических систем с неполной информацией о состоянии. В этом линейном случае метод доведен до конструктивной формы – системы алгебраических уравнений для набора коэффициентов, определяющих стратегию управления.
Однако, статья [17] закладывает лишь основы новой теории. Исследования в этом направлении будут продолжены в 2012 г. и в последующие годы.
Область научных интересов Н.И. Матросовой: изучение критических случаев в теории устойчивости с помощью метода векторных функций Ляпунова.
В ближайшее время планируется разработка новых высокоэффективных численных методов решения уравнения Ляпунова большой размерности и решения задач АКОР для стохастических систем при неполной информации о состоянии (М.М. Хрусталев, Н.И. Матросова, А.С. Халина).
Предполагается также создание теории оптимального управления динамическими системами, описываемыми стохастическими марковскими процессами с дискретным временем, с учетом их деградации и старения при неполной информации о состоянии (М.М. Хрусталев, В.А. Дроздов). Условия оптимальности таких систем в случае полной информации о состоянии хорошо известны. В характерном для прикладных задач случае, когда стратегия управления может зависеть лишь от части компонент вектора состояния, условия оптимальности не известны.