Электронная библиотека » Владимир Живетин » » онлайн чтение - страница 8


  • Текст добавлен: 1 октября 2015, 04:01


Автор книги: Владимир Живетин


Жанр: Прочая образовательная литература, Наука и Образование


Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Текущая страница: 8 (всего у книги 27 страниц) [доступный отрывок для чтения: 9 страниц]

Шрифт:
- 100% +
Детерминированные состояния динамических систем

I. Часто процесс построения математических моделей об объекте Х мира чувственных объектов включает два этапа. На первом этапе объект Х рассматривается в области детерминированных состояний (детерминированный объект), на втором объект Х погружается в вероятностное пространство, изучается как стохастический объект [21].

Как правило, построение моделей начинается с изучения детерминированных объектов. При этом без первых нет вторых, и в этом смысле можно говорить о первичности знаний, сформированных при изучении детерминированных объектов. Основным критерием истинности, начиная с эпохи Нового времени, считается критерий практики, согласно которому данная теория считается истинной, если она соответствует объективной, не зависящей от человека, реальности. В качестве такого критерия в наше время принят постулат Н.Г. Четаева [53]. Необходимым и достаточным условием того, что данная гипотеза есть закон, является следующее: отклонение опытных значений Х от теоретических Y должно быть меньше допустимой величины ошибки ε, т. е. | X Y | < ε [53]. Подобный критерий широко используется в современной физике, механике. Этот критерий является первичным критерием достоверности научных знаний.

На втором этапе исследования объект X = X(w) рассматривается под влиянием случайных, как правило, неконтролируемых внешних факторов (w). В этих условиях вновь появляется проблема достоверности научных знаний, которые могут быть использованы при построении мира искусственных объектов. Для иллюстрации сказанного рассмотрим пример.

В пространстве детерминированных состояний, когда рассматривается, например, движение самолета без учета влияния возмущающих факторов, уравнения его движения имеют вид


= f(x, u, t), z = φ(x, t), u = r(z, t),


где x = (x1, …, xn) – вектор параметров траектории полета; u – управление (вектор); z = (z1, …, zm) – вектор наблюдения; f, φ, ψ – известные функции.

Такие модели используются, как правило, для исследования устойчивости траектории движения самолета, определения скорости флаттера, т. е. определения области устойчивости состояния (колебаний) крыла, а также формирования, например, программного управления. Решение подобных задач проводится с помощью специально разработанных теорий, достоверность которых проверяется с помощью первичных критериев.

Следующий этап исследования объекта Х связан с введением в его структуру случайных или неопределенных (неконтролируемых) факторов. В этом случае, например, движение самолета описывается системой уравнений


= f(x, u, w, t), z = φ(x, v, t), u = ψ(z,t),


где w, v – возмущающие факторы соответственно внешнего и внутреннего происхождения, оказывающие воздействие на самолет и на средства измерения z параметров x(t) его траектории соответственно.

II. Рассмотрим задачу построения области устойчивых или безопасных состояний динамической системы. С этой целью в простейшем случае исходному объекту Ā, порождающему процесс х, который описывается системой типа (2.1) нелинейных дифференциальных уравнений, мы ставим в соответствие новый объект В, порождающий процесс, который описывается системой линейных дифференциальных уравнений вида = AΔx, где Δx = x0 xф; x0 – опорное, или невозмущенное, состояние; xфвозмущенное, или фактическое, состояние объекта x; Δx – отклонение возмущенного движения от невозмущенного (за счет начальных возмущений); A – матрица соответствующей размерности.

При этом мы рассматриваем объект Ā в момент времени t = t0, когда x = x(t0) = x0. Линеаризуем исходное уравнение. В результате матрица А имеет при t = t0 постоянные элементы, и тогда можно говорить о собственных значениях λi этой матрицы, которые должны быть отрицательными, чтобы процесс Δx, обусловленный случайным отклонением от заданной траектории, был затухающим, и тогда объект Ā будет устойчив. При этом модель, построенная согласно теории, достоверна, если мы устанавливаем, что | x y | < ε при всех t, т. е., например, процесс x на выходе физического объекта X отличается от процесса y, полученного, согласно теории объекта В, меньше, чем на ε. Установив | x y | < ε, где x, y, ε – детерминированные величины, мы признаем теорию и порожденные ею знания достоверными согласно постулату Н.Г. Четаева [53].

Полученные знания описывают только одну совокупность параметров x(t0) = (x01, …, x0n) траектории объекта Ā, вычисленных при t = t0. Этим параметрам соответствуют вполне определенные значения элементов aij(t0) матрицы А(t0) с вполне определенными значениями λi(t0) . При движении объекта параметры x(t) изменяются в некоторой области G, при этом изменяются aij(t) – элементы матрицы A, следовательно, и λi. Для каждого объекта существует область Gдоп допустимых значений параметров x(t), внутри которой ReλI < 0 для всех t, т. е. объект устойчив в общем случае относительно изменений x(t). В случае когда контролируемый параметр покидает область допустимых значений, т. е. x Gдоп, коэффициенты таковы, что t: i: λi ≥ 0 . Таким образом, теория позволяет нам определить Gдоп, т. е. область допустимых значений параметров x.

Проблема распространения полученных результатов на практике наталкивается на наличие погрешностей в определении aij(t0), соответствующих x(t0). При этом возникает соотношение


āij(t0) = aij(t0) + δaij(t0),


где aij(t0) – параметры, принятые при расчете λi(t0) и соответственно при построении Gдоп; āij(t0) – фактические значения aij(t0); δaij(t0) – погрешность.

Кроме погрешности δaij(t0), которая влияет на λi(t0) и Gдоп, возникает погрешность измерения x(t0). При этом имеем = x(t0) + δx(t0), где x(t0) – расчетное, а = xизм – фактическое значение x(t0); δx(t0) – погрешность измерения. Погрешности δaij, δx(t0) обусловливают необходимость изменения (как правило, уменьшения) области Gдоп до некоторой новой области Gодоп значения параметров x(t0) траектории полета, для которых условие x(t0) Gодоп недопустимо из условия устойчивости.

Для построения области Gодоп и оценки достоверности научных знаний на этапе внедрения в практику необходимы вторичные критерии достоверности научных знаний [21]. В случае когда исходная математическая модель описывает случайные функции или процессы, возникает аналогичная ситуация.

Отметим ряд понятий, связанных с устойчивостью.

I. Устойчивость применительно к движению.

1. Траектория движущейся динамической системы в некотором смысле мало отличается от движения при малых возмущениях начального положения динамической системы в фазовом пространстве. При этом рассматривается малость отклонения равномерно по t ≥ 0 (устойчивость по Ляпунову, равномерная устойчивость).

2. То же, что и в п. 1, но при малых возмущениях как начального положения динамической системы (в фазовом пространстве), так и самого закона движения (устойчивость при постоянно действующих возмущениях).

3. Когда начальное положение подчинено дополнительному условию (условная устойчивость).

4. Если малость возмущения и отклонения оговаривается лишь по некоторым параметрам (устойчивость по части переменным).

II. Устойчивость движения динамической системы как свойство системы сохранять некоторые черты фазового портрета при малых возмущениях закона движения (устойчивости теория, грубая система).

Теория устойчивости включает такие разделы, как [39, 40]:

– критерии устойчивости;

– область устойчивости;

– структурная устойчивость;

– функциональная устойчивость.

Исследованию множества допустимых (безопасных) и критических (опасных) состояний посвящено большое количество работ, среди которых выделим:

Устойчивости теории:

– устойчивость по Лагранжу;

– устойчивость по Ляпунову;

– теорема Пуанкаре;

– устойчивость по части переменных;

– Четаева функция (теорема о неустойчивости);

– устойчивость при постоянно действующих возмущениях;

– устойчивость по Пуассону.

При этом множество допустимых состояний динамических систем определяется из условий:

1) статической устойчивости, так, например, угол атаки самолета как динамической системы;

2) квазистатической устойчивости, так, например, самолета, когда скорость изменения угла атаки ≠ 0, а угловые скорости вращения вокруг осей OX – ωx; OY – ωy; OZ – ωz;

3) динамической устойчивости, так, например, для режима полета самолета, когда ωx ≠ 0, ωy ≠ 0, ωz ≠ 0 одновременно.

В момент выхода динамической системы из области Ωдоп нарушаются функциональные свойства системы, наступает хаос, целедостижение отсутствует, достоверность наших знаний о системе уменьшается.

Рассмотрим на простейших примерах теоретические основы построения области безопасных (допустимых) и опасных состояний.

I. Построение области безопасных состояний в случае статической устойчивости.

В качестве примера рассмотрим стержень, величину его прогиба φ(·), возникающего под действием силы Р (рис. 2.2) [7]. Критическая величина φкр может быть задана согласно следующим условиям:

1) φ(х) = 0, часто иное не допустимо;

2) φ(х) ≤ φкр ≠ 0 – иногда такое неравенство допустимо;

3) φ > φкр – стержень разрушается.

Положим, что контролю и управлению подлежит только сила Р. Используя статический подход Эйлера, можно найти критическую силу Ркр, равную максимальной величине Р, при которой выполняется равенство φ(х) = 0. При практическом применении метода, когда задана Ркр, необходимо найти: (EJ)кр – жесткость при изгибе, ее критическое значение, Sкр – площадь сечения стержня, его критическое значение. Эти величины задают область допустимых и критических значений Ωдоп и Ω.кр соответственно.


Рис. 2.2


Имея в виду, что сила Эйлера Рэ = π2EJ / l2, где l – длина стержня, EJ – жесткость при изгибе, задав EJ, определим критическую величину силы Р = Ркр. При этом критическому значению силы, т. е. Ркр, соответствует критическое значение EJ при заданной l, т. е. (EJ)кр. По полученному значению (EJ)кр мы можем найти критическое значение параметров сечения конструкции Sкр при заданных свойствах материала Таким образом, мы построили область


Ωкр = Ω(Ркр, (EJ)кр, Sкр).


В процессе эксплуатации нам надо контролировать только Р и обеспечивать условие РРкр. Здесь мы полагали, что Р – статическая нагрузка и изменение ее происходит достаточно медленно, так что динамикой



пренебрегаем, например, когда стержень «толстый».

II. Квазистатические режимы.

В случае когда нельзя пренебречь динамикой, например для такого стержня, для которого допустимы φ(х, t) ≠ 0, необходимо ее учитывать. Пусть сила Р изменяется периодически: Р(t) = Р0 + Рэcosωt. При этом φ(х, t) = f(t) sinx / l) (рис. 2.3), а f(t) задает амплитуду колебания стержня, которая определяется из уравнения



где



Здесь сила, действующая на стержень Р, разделена на две составляющие: статическую Р0 и динамическую Рэcosωt. Вся сложность в том, что для построения Ωкр нельзя рассматривать Р в виде суммы сил и пользоваться статическим подходом.

При определенных значениях ν(pjn) и α(ωjn) решения f(t), следовательно, и прогиб стержня φ(x, t) могут расти, и при некоторой величине ω = ωкр наступает резонанс. Значения ν и α, при которых φ(x, t) остаются ограниченными, образуют границу Sдоп области Ωдоп допустимых значений ν и α. Если (ν, α) Ωдоп, т. е. принадлежат критической области Ωкр, то ν = νкр, α = αкр, и амплитуда φ(x, t) возрастает по времени.


Рис. 2.3


На границе Sдоп и внутри Ωдоп колебания поддерживаются силой Р, не усиливаясь и не ослабевая. При этом α зависит не только от конструктивных параметров, но и от частоты колебаний. Критическое значение α зависит от ωкр, когда возникает резонанс. Таким образом, для ограничения α необходимо не только контролировать ω в момент времени t, но и упреждать момент времени достижения ωкр в силу инерционных свойств всякой динамической системы (управляющей изменением ω(t)), ограничивая не ωкр, а величину ωкр – Δω = ωкр k.

2.3. Качественная теория построения областей безопасных состояний динамической системы

Области безопасных состояний классической теории динамических систем строятся согласно показателям устойчивости [9]. При исследовании устойчивости объектов управления используется теория устойчивости систем нелинейных дифференциальных уравнений [40]. При некоторых упрощениях математическое описание таких объектов может быть сведено к системе линейных дифференциальных уравнений или разностных уравнений первого порядка и системе линейных алгебраических уравнений.

Состояние динамической системы характеризуется ее конфигурацией (состоянием) и скоростью изменения конфигурации (состояния), а закон движения задает скорость изменения состояния динамической системы.

При этом состояние динамической системы характеризуется с помощью величин x = (x1, …, xm). Причем двум различным наборам (векторам) х и x' отвечают различные состояния (справедливо и обратное), а близость всех xi и x'i означает близость соответствующих состояний динамической системы.

Закон движения в этом простейшем случае записывают в виде автономной системы обыкновенных дифференциальных уравнений:


= fi(x1, …, x), i = 1, …, m.


Рассматривая x1, …, xm как координаты точки х в т-мерном пространстве, можно геометрически описать соответствующее состояние динамической системы посредством этой точки х. Точку х называют фазовой (изображающей, представляющей), а пространство – фазовым пространством системы. Изменение состояния со временем изображается как движение фазовой точки х по некоторой линии, которую называют фазовой траекторией, или просто траекторией, в фазовом пространстве.

В фазовом пространстве определено векторное поле, сопоставляющее каждой точке х выходящий из нее вектор f(х) с компонентами


f1(х), f2(х), …, fm(х).


Тогда получим:


= f(x).          (2.2)


Дадим кинематическую интерпретацию уравнения (2.2).

Уравнение (2.2) означает, что в каждый момент времени векторная скорость движения фазовой точки х (вектор фазовой скорости) равна вектору f(х), исходящему из этой точки фазового пространства, где в данный момент находится движущаяся фазовая точка. Как правило, для нелинейной динамической системы (2.2) фазовое пространство включает в себя области допустимых Ωдоп и критических Ωкр состояний.

Дадим интерпретацию Ωдоп согласно теории дифференциальных уравнений. Если векторное поле f(х) дифференцируемо, то для каждой точки xi Xm существует ровно одно решение х(t) уравнения (2.2), имеющее х0 своим начальным значением x(0) = x0. Это означает, что при данном законе движения (2.2) состояние динамической системы в любой момент времени полностью определяется ее начальным состоянием. В противном случае (когда не выполняется условие дифференцируемости) существует множество траекторий для каждой x0 Xn. В первом случае пространству Xm поставим в соответствие область допустимых состояний Ωдоп; во втором пространству Xm поставим в соответствие область критических состояний Ωкр, включающую совокупность точек х0, которые обозначим (х0)кр.

В глобальной теории динамических систем принимается дополнительное предположение, что при любом начальном значении соответствующее решение определено при всех t. При решении локальных вопросов делаются предположения об особенностях поведения тех траекторий, которые покидают рассматриваемую область, например область Ωдоп фазового пространства.

Наилучшее практическое приближение дает локальная теория качественной теории дифференциальных уравнений. В этом случае исходная система нелинейных дифференциальных уравнений в нормальной форме



рассматривается не во всем пространстве x, t, а лишь в окрестности заданного решения. Тогда путем замены переменных в (2.3) задача сведется к изучению системы



где Y0 – вектор-функция в некотором смысле малая в сравнении с x.

Исследование поведения решений (2.4) в окрестности состояния равновесия, когда x = 0, составляет предмет локальной качественной теории дифференциальных уравнений. Наиболее полно исследован случай, когда элементы матрицы P постоянны, т. е. pij = const. При этом проблема сводится к анализу собственных значений матрицы P = (pij), осуществляемому согласно фундаментальному результату Ляпунова-Перрона [39]. Пусть k собственных значений постоянной матрицы Р имеют отрицательные действительные части, а остальные (n k) собственных значений имеют положительные действительные части. Тогда в пространстве х существуют два многообразия M и N размерности k и (n k) соответственно такие, что:

– если М, то → 0 при t +∞,

– если N, то → 0 при t –∞,

все остальные решения покидают окрестность начала координат как при возрастании, так и при убывании х.

Случаи, когда матрица Р имеет собственные числа с нулевой действительной частью, называются критическими.

В практических приложениях важной является ситуация, когда Р – матрица не с постоянными коэффициентами, а p'ij = pij(a, ), где а – параметры системы,  – начальные значения параметров х. Такая ситуация характерна при исследовании нелинейных динамических систем, описываемых (2.3), когда производится линеаризация системы в точке пространства М. При этом наиболее общий случай, когда а ≠ const, а зависит от х0.

Последнее наблюдается при решении задач, связанных, например, с высокоскоростными летательными аппаратами. В итоге пространство М задает область допустимых состояний Ωдоп, дополнения к которому есть Ωкр. В случае, когда pij = const, область Ωдоп неизменна.

В общем случае, когда pij = pij(a, x0), область Ωдоп = Ωдоп(а, x0). В некоторых частных случаях Ωдоп = Ωдоп(x0) или Ωдоп = Ωдоп(а). При этом на x и а накладываются соответствующие ограничения: x0 Ωдоп(x0), a Ωдоп(a).

Рассмотрим структуру управляемой и наблюдаемой модели. Пространство состояний нелинейного объекта описывается системой уравнений


= f(x(t), u(t), a(t),V(t), t), z(t) = g(x(t), u(t), n(t), t),


где x(t) – вектор состояния; u(t) – управляющий входной сигнал; a(t) – вектор параметров объекта; V(t) – входной шум (неизмеряемый входной сигнал); n(t) – вектор помех наблюдений (или измерений); z(t) – наблюдаемый выходной сигнал.

В процессе управления, как правило, не все координаты вектора х доступны наблюдению – контролю, следовательно, ограничению. Наблюдению доступны лишь часть фазовых координат и, как правило, некоторые функции (линейные или нелинейные) от них. Наблюдаемые процессы z(t) могут быть записаны для линейного случая в виде



или в матричном виде:


z(t) = c(t) x(t).


Вектор входного сигнала u(t) = (u1(t), …, un(t)) в динамической системе часто выполняет роль управляющих воздействий; для технических систем это, как правило, отклонение органов управления. Во всех случаях u(t) влияют на управляемые выходные координаты x(t) динамической системы, в целенаправленном изменении которых и состоит задача управления.

Однородное разностное уравнение объекта имеет вид


Δх = А(t)x.          (2.5)


Пусть φi(t)  – линейно независимые частные решения однородного уравнения (2.5). Матрица


Φ(t) = [φ1(t), , φn(t)]


называется фундаментальной матрицей решений уравнения (2.5) и удовлетворяет разностному уравнению


ΔΦ = А(t)Φ,


где ΔΦ = Φ(t + 1) – Φ(t).

Матрица


L(t, τ) = Φ(t–1(τ)


называется матрицей перехода и удовлетворяет разностному уравнению


ΔL(t, τ) = L(t + 1, τ) – L(t, τ) = А(t) L(t, τ),

L(τ, τ) = I,


отсюда следует


L(t + 1, t) = (I + A(t)) · L(t, τ).


Частное решение однородного уравнения (2.5) при начальном условии x(τ) записывается в виде


x(t) = L(t, τ) x(τ),


где L(t, τ) = L(t, t – 1) L(t – 1, t – 2) … L(τ + 1, τ) представляет собой прямое произведение матриц перехода от такта к такту.

При этом (2.5) имеет вид


x(t + 1) = L(t + 1, t) x(t) + B(t) u(t).          (2.6)


В случае если задано начальное условие x(τ) и управляющие воздействия u(θ), где θ = τ, τ + 1, …, решение уравнения (2.6) имеет вид



Вектор x(t) задает состояние объекта в текущий момент времени t. В последующие моменты времени θ > t вектор x(θ), а также вектор z(θ) зависят как от x(t), так и от управляющих воздействий u(τ), приложенных на интервале времени от t до θ.

Линейная управляемая система

Рассмотрим модель линейной управляемой системы с непрерывным временем в пространстве состояний:

– уравнение состояния


= Ax + Bu,           (2.7)


– уравнение выхода


z = Cx + Du,


– начальные условия x(t0) = x0.

Пусть A = (aij), B = (bij), aij = const, bij = const, тогда решение (2.7) имеет вид



Здесь Φ(t) – матрица перехода, или матрица фундаментальных решений. Если aij = const, то имеет место Φ(t) = eAt, где



Для нестационарной линейной модели в пространстве состояний


= A(t) x(t) + B(t) u(t),

z(t) = C(t) x(t) + D(t) u(t),

x(t0) = x0


решение имеет вид



где Ф(t0, t0) = J; [Φ(t, τ)]–1 = Φ(τ, t); J – единичная матрица;



Структура модели динамической линейной системы приведена на рис. 2.4. Она включена во внешнюю среду посредством ресурсного потенциала θ3 = (E, J, m), формируемого динамической системой. На рис. 2.4 подсистемы (1) и (2) с функциональными свойствами Ф1, Ф2 реализуют целеполагание и целедостижение соответственно, заданные, например, в виде программ, а исследуемая динамическая система представляет собой подсистему (3), осуществляющую целереализацию. Здесь θc – ресурсный потенциал, полученный из среды.

Сегодня в технических системах используется подход, суть которого состоит в следующем. Состояние динамической системы оценивается с помощью вектор-функции = (x1, x2, …, xn), каждая компонента которой в реальных системах может быть измерена. Эти величины характеризуют количественное состояние динамической системы в среде и называются динамическими переменными. Множество всех теоретически возможных значений хi называется фазовым пространством динамической системы.


Рис. 2.4


Как правило, хi являются переменными и число их конечно (обозначим это число через N). Тогда фазовое пространство динамической системы имеет конечную размерность и его можно отождествить с RN.

Влиянием Ф1, Ф2 при построении математических моделей технических систем пренебрегают.

Пусть динамическая система с непрерывным временем и сосредоточенными параметрами описывается системой обыкновенных дифференциальных уравнений вида


= f(x, сα),           (2.8)


где х = (х1, х2, …, хn); f = (f1, …, fn) – функция, характеризующая свойства динамической системы; сα = (с1, …, ск) – вектор управляющих параметров; x(t0) = x0 – начальные условия.

Как правило, правая часть уравнения (2.8) есть силовая функция, характеризующая энергетический потенциал как функцию фазовых координат х.

В общем случае силовая функция f(·) зависит не только от х, но и от некоторых параметров сα, которые в необходимой мере изменяют f(·) в процессе функционирования динамической системы. Как правило, с помощью сα осуществляют компенсацию внешних возмущающих факторов риска W(t).

Чтобы динамическая система была способна осуществлять реализацию заданной цели, она должна содержать из области допустимых значений такие показатели, как:

1) идентифицируемость (α1);

2) управляемость (α2);

3) наблюдаемость (α3);

4) устойчивость (α4).

Построение областей допустимых и критических состояний динамической системы осуществляется при следующих условиях:

1) статическом, когда = 0;

2) квазистатическом, > 0;

3) динамическом, >> 0.

Совокупность контролируемых параметров траектории движения (х 1, х2, …, хn) разбивается на три группы:

1) = (х1, х2, …, хm) – в статическом режиме;

2) = (хm, хm+1, …, хk) – в квазистатическом;

3) = (хk, хk+1, …, хn) – в динамическом.

Так, например, для самолета-истребителя:

– в первую группу включены α, β, γ – углы атаки, скольжения, крена соответственно;

– во вторую группу входят Vx, Vy, Vzпроекции скорости на оси ОХ, ОY, ОZ соответственно;

– в третью – ωx, ωy, ωz – проекции угловой скорости на оси ОХ, ОY, ОZ соответственно.

Расчет Ωдоп проводится из условий:

– статической устойчивости (прочности, аэродинамики) Ω(1)доп() = Ω(1,1)доп;

– квазистатической устойчивости Ω(1)доп() = Ω(1,2)доп;

– динамической устойчивости, например обусловленной ненулевыми величинами ωx, ωy, ωz, Ω(1)доп() = Ω(1,3)доп.

Наиболее надежно рассчитывается область Ω(1,1)доп. Здесь ошибки обусловлены отличием физической модели от физического (реального) объекта. Отметим, что изменение Ω(1,3)доп происходит по причине неустановившегося режима ( ≥ 0) и запаздывания динамической системы, а также имеет место зависимость Ω(1,3)доп от тдоп – допустимого времени пребывания (выброса) х в область Ωкр в хаотическом режиме.

Рассмотрим основные понятия, связанные с управляемостью, наблюдаемостью и идентифицируемостью [55] с целью установления их связи с безопасностью динамической системы. Пусть дискретное состояние динамической системы характеризуется моделью


x(k + 1) = Ax(k) + Bu(k),

y(k) = Cx(k),


где х – вектор состояния размерности n; u – управление; у – наблюдаемый выходной сигнал; А, В, С – матрицы соответствующих размерностей.

Идентификация необходима в динамической системе для устранения неоднозначности алгоритмов функционирования, управления и контроля. Динамическая система называется идентифицируемой, если по измерениям координат состояния объекта можно определить матрицу параметров (функциональных) системы А динамической системы.

Необходимое и достаточное условие идентифицируемости, т. е. существования единственной А, реализуется тогда, когда ранг матрицы [x(0); Ax(0); …; An–1x(0)] равен «n».

Динамическая система управляема, если можно найти такой вектор управления и, который из произвольного начального состояния переводит систему в некоторым образом заданное (целевое) конечное состояние за ограниченное время.

Приведем простейшие примеры решения задачи. Необходимо найти условия, накладываемые на матрицы А и В, при которых динамическая система под влиянием u(·) переходит из начального состояния х(0) в конечное заданное состояние х(n). Опуская выкладки, получим



В силу того, что x(n) задано, x(0) – известно, матрица An также известна, мы получаем условия для однозначного определения u(·) тогда и только тогда, когда матрица Р = [An–1B; An–2B; …; B] невырождена (имеет ранг r = n). При этом пара матриц (А, В) называется управляемой парой.

Динамическая система называется наблюдаемой, если по измерениям выходного сигнала у(·) в момент времени t можно определить ее состояние х(0). При известных значениях у(0), у(1), …, у(n – 1) единственное решение х(0) существует только тогда, когда матрица P1 = [C'; A'C'; …; (A')n–1C'] имеет ранг n (здесь А', C' означает транспонирование).

Согласно полученному, Р и Р1 могут быть невырожденными даже в том случае, когда некоторые элементы аij, cij матриц А и С будут равны нулю в процессе функционирования. В литературе существует более детальное рассмотрение этих понятий, например управляемость по состоянию и выходу, полная и общая, сильная и слабая; наблюдаемость полная и общая [55].

В работе [55] управляемость и наблюдаемость распространены на стохастический случай. Задача наблюдаемости для управляемых случайных процессов связана с таким случайным процессом, вероятностные характеристики которого могут изменяться в зависимости от заданной цели управления. Наиболее завершена в этом смысле теория марковских процессов и управляемых диффузионных процессов в случае наблюдений по полным данным. В стадии развития наблюдение по неполным данным – так называемые частично наблюдаемые процессы.

Задача формирования области допустимых состояний для динамической системы, включающей человека и машину, из условия наблюдаемости рассмотрена в работе [20, с. 407–425].

Рассмотрим пример. В качестве динамической системы выберем ту, которая описывается системой двух уравнений (рис. 2.5):



Рис. 2.5


Здесь возможны следующие случаи:

1) динамическая система находится в состоянии покоя, когда х1(0) = х2(0) = 0;

2) когда



т. е.



Данной системе в общем случае соответствуют собственные значения λ1 и λ2 и соответствующие собственные векторы и , которые должны быть в Ωдоп. Если λ2 = 0, то х(0) = α, и имеет место гармоника exp(x1t), а гармоника exp(λ2t) не идентифицируется. Если х(0) = β, то может идентифицироваться гармоника exp(λ2t). Таким образом, начальное условие х(0) должно возбуждать все гармоники, а это значит, что объект не должен содержать нулевых корней.

Определим опасные и безопасные состояния системы, связанные с изменением коэффициентов от а12 ≠ 0 и а21 ≠ 0 до нуля. Система управляема, если матрица



имеет ранг n = 2, т. е. когда а21 ≠ 0. Если а21 = 0, то ранг n ≠ 2 и динамическая система неуправляема по координате х2. При этом а12, а22 могут равняться нулю.

Система наблюдаема, если матрица



имеет ранг n = 2, т. е. когда а12 ≠ 0. В противном случае при а12 = 0 выходная координата у не содержит информации об х2. При этом а21 и а22 могут равняться нулю.

Система идентифицируется, если ранг матрицы



равен двум. Если столбцы линейно зависимы, то система не идентифицируется.


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 | Следующая
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации