Текст книги "Научный риск (введение в анализ)"
Автор книги: Владимир Живетин
Жанр: Прочая образовательная литература, Наука и Образование
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 22 (всего у книги 26 страниц)
Пусть даны метрические пространства Χ, Υ и функция f, определенная на D(f) X. Требуется решить уравнение
f(x) = y* при любом y* Y. (7.4)
Будем считать, что решение (7.4) существует и оно единственное. Необходимо отыскать элемент x*, который превращает (7.4) в тождество. Отметим, что только в простейших случаях (7.4) имеет аналитически точное решение x*. В общем случае имеет место приближенное решение (7.4).
Рассмотрим кратко задачу приближения в топологическом пространстве и возникающие при этом погрешности, влияющие на научный риск или достоверность научных знаний.
1. Близость приближенного решения. Пусть Сm – метрическое пространство, в котором для множества точек x Сm существует точка «а», для которой d(a, x) < δ есть открытый шар радиуса δ с центром а. При этом ошибка приближения измеряется метрикой d(xn, x), которая создается в процессе построения произвольного объекта – элемента x с помощью подходящего класса Сm и последовательности элементов x0, x1, x2, … из Сm. Так, например, приближение функции f(x) последовательностью функций S0(t), S1(t), Sk(t), … (частичные суммы бесконечного ряда) порождает погрешности δ0, δ1, δ2, … Если дано пространство С функций f(x), g(x), …, непрерывных в интервале 0 ≤ t ≤ 1, то можно использовать метрики
– максимальная ошибка (δmax);
– средняя квадратическая ошибка (δ2). При этом уравнение (7.4) заменяется на приближенное:
fn(xn) = y*. (7.5)
Решение (7.5) обозначается x*n : x*n Xn. Тогда зависимость между xn и x*n имеет вид xn = φn(x*n) Xn. Заметим, что xn может не принадлежать области D(f), так как отображение действует из Xn в X, а не в D(f) X.
Близость приближенного решения xn к точному x* измеряется величиной ρn = d(xn, x*). Имеет место сходимость, если . Если n – ограничено, то возникает ошибка ρn = δ, которая должна быть ограничена или учтена при оценке критерия достоверности научных знаний.
1. Условие аппроксимации. Для каждого оператора С (С: U → V) введем обозначения: D(C) – область задания; R(C) – область значений. Пусть X, Y – вещественные линейные нормированные пространства, в которых (7.4) имеет вид
Ax = y*, (7.6)
где А – линейный оператор из X в Y.
Учитывая полученные выше соотношения, предположим, что имеет место равенство fn(xn) = Anхn, где An : Xn → Yn. Если пространства Xn и Yn – конечномерные, D(An) = Xn, R(An) = Yn, существует A–1n, D(ψn) = Yn, D(φn) = Xn, тогда уравнение (7.6) заменяется приближенным:
Anxn = ψny*. (7.7)
Считают, что последовательность операторов An аппроксимирует А на элементе х D(A), если мера аппроксимации
Таким образом, условие аппроксимации имеет вид
3. Погрешности метода. Пусть X, Y – линейные нормируемые полные пространства; А – линейный оператор из X в Y с областью задания D(A) X. Пусть существует обратный оператор А–1, доставляющий единственное решение x* для (7.6).
При решении (7.6) возможны погрешности метода или погрешности первого рода, обусловленные искажениями в А и y* в виде (А + В) и (y* + η) соответственно, т. е. имеет место
(A + B)x = y* + η. (7.8)
Определим оценку ρ = d(x0, x*), где x0 – решение (7.8); x* – решение (7.6). Предположим, что в (7.8) оператор B – ограниченный и малый по норме ||B||. Обозначим
μ(A) = || A || · || A–1 ||,
где ||A · x || ≤ ||A || · || x ||. Тогда имеет место оценка вида
Наличие вычислительных погрешностей δ, которые называют невязкой: δ = (A + B) – (y* + η), где удовлетворяет уравнению (A + B)x = y* + z + δ, приводит к следующей оценке:
Величины ρ, δ, d характеризуют научные потери или риски.
В заключение данного раздела сформулируем одну из основных задач научного риска:
Требуется разработать методы и средства расчета допустимой величины отклонения (ρ(x, y), d(x0, x*), …), согласно требованиям практической реализации теоретических результатов.
7.2. О достоверности научных знаний в естествознании
Проблема разработки критериев достоверности научных знаний обусловлена не только тем, что «…любая система включает в себя элементы, не могущие быть обоснованными теоретическими средствами вообще, но и тем, что без наличия подобного ряда элементов не может существовать никакая научная система знаний…» [39].
Множество искусственных объектов, построенных на основании достоверных научных знаний, ограничено в связи с тем, что объем и глубина научных знаний малы по сравнению с тем, что требуется от них для создания мира искусственных объектов, обслуживающего нашу жизнь.
В подавляющем большинстве уже созданные искусственные объекты не обеспечены на 100 % достоверными научными знаниями. Наука гарантирует правильность идей и свойств лишь в ограниченной области существования (функционирования) этих объектов. Мир искусственный так же, как и физический, обладает чрезвычайно большим количеством объектов с различными свойствами, для изучения каждого из которых теория должна иметь необходимый инструментарий.
Рис. 7.2
Пусть GB (рис. 7.2) есть множество искусственных объектов. И только часть G0 этих объектов создана с использованием достоверных научных знаний, их свойства научно обоснованы, причем во всей области их существования, т. е. области B0, в которой изменяются выходные параметры х(t), их состояния, и B1, B2, в которых изменяются внешние и внутренние возмущающие факторы W(t) и V(t) соответственно.
Научные знания разделим на научные знания, полученные чисто экспериментальным и чисто теоретическим путем (рис. 7.3): x – граница научных знаний, полученных с помощью (с использованием) чувственного мира человека, в том числе эксперимента; y – граница научных знаний, полученных с помощью (с использованием) абстрактных теорий, созданных человеком; Vнз – объем научных знаний; Dнз – объем достоверных научных знаний; ΔDнз – объем недостоверных научных знаний.
Рис. 7.3
Наличие границы x, связанной с микромиром, подчеркивает творец квантовой механики В. Гейзенберг (1976 г.) [14]. Наличие границы «y» убедительно подтверждает директор Института философии П.В. Копнин (1971 г.) [39]. Наличие области G1 подчеркивает Р. Оппенгеймер (1967 г.). Что же такое область G3? Это бесконечно малая величина в сравнении с G1 и G2. Рассмотрим ряд примеров, иллюстрирующих данную мысль.
7.2.1. Детерминированные состояния объектаI. Часто процесс формирования современных научных знаний об объекте Х мира чувственных объектов включает два этапа. На первом этапе объект Х рассматривается в области детерминированных состояний (детерминированный объект), на втором – объект Х погружается в вероятностное пространство, изучается как стохастический объект [68].
Как правило, формирование научных знаний начинается с изучения детерминированных объектов. При этом без первых нет вторых, и в этом смысле можно говорить о первичности знаний, сформированных при изучении детерминированных объектов. Достоверность или истинность научных знаний, сформулированных в виде детерминированных – представленных, в том числе в виде детерминированных объектов Y, выявляется с помощью критериев типа |x – y| < ε (см. 1.4), где ε – погрешность (детерминированная) измерения; x, y – процессы состояния детерминированных объектов. Подобные критерии широко используются в современной физике, механике. В силу сказанного они являются первичными критериями достоверности научных знаний.
На втором этапе исследования объект X = X(w) рассматривается под влиянием случайных, как правило, неконтролируемых факторов (w). В этих условиях вновь появляется проблема достоверности научных знаний, которые могут быть использованы при построении мира искусственных объектов. Для иллюстрации сказанного рассмотрим пример.
В пространстве детерминированных состояний, когда рассматривается, например, движение самолета без учета влияния возмущающих факторов, уравнения его движения имеют вид
= f(x, u, t), z = φ(x, t), u = ψ(z, t),
где x = (x1, …, xn) – вектор параметров траектории полета; u – управление (вектор); z = (z1, …, zm) – вектор наблюдения; f, φ – известные функции.
Такие модели используются, как правило, для исследования устойчивости траектории движения самолета [59], определения скорости флаттера, т. е. определения области устойчивости состояния (колебаний) крыла, а также формирования, например, программного управления. Решение подобных задач проводится с помощью специально разработанных теорий, достоверность которых проверяется с помощью первичных критериев.
Следующий этап исследования объекта Х связан с введением в его структуру случайных или неопределенных (неконтролируемых) факторов. В этом случае, например, движение самолета описывается системой уравнений
= f(x, u, w, t), z = φ(x, v, t), u = ψ(z, t),
где w, v – возмущающие факторы (внешнего и внутреннего происхождения), оказывающие воздействие собственно на самолет и на средства измерения z параметров x(t) его траектории соответственно.
II. Рассмотрим решение задачи устойчивости. С этой целью в простейшем случае исходному объекту x мы ставим в соответствие новый объект y (y = Δx), который описывается системой линейных дифференциальных уравнений вида = AΔx, где Δx = x0 – xф; x0 – опорное или невозмущенное состояние; xф – возмущенное или фактическое состояние объекта x; Δx – отклонение возмущенного движения от невозмущенного (за счет начальных возмущений); A – матрица соответствующей размерности.
При этом мы рассматриваем объект X в момент времени t0. Линеаризуем исходное уравнение, в результате матрица А имеет при t = t0 постоянные элементы, и тогда можно говорить о собственных значениях λi этой матрицы, которые должны быть отрицательными, чтобы процесс Δx был затухающим, и тогда самолет будет устойчив. При этом теория достоверна, если мы устанавливаем, что | xi – yi | < ε, т. е., например, процесс xi на выходе физического объекта X отличается от процесса yi, полученного согласно теории объекта Y, меньше чем на ε. Установив | x – y | < ε, где x, y, ε – детерминированные величины, мы признаем теорию и порожденные ею знания достоверными согласно постулату Н.Г. Четаева [64].
Полученные знания описывают только одну точку в пространстве параметров x(t0) = (x01, …, x0n) траектории самолета, вычисленных при t = t0. Этим параметрам соответствуют вполне определенные значения элементов aij(t0) матрицы А(t0) с вполне определенными значениями λi(t0) . При полете самолета параметры x(t) изменяются в некоторой области G, при этом изменяются aij(t) – элементы матрицы A, следовательно, и λi. Для каждого самолета существует область Gдоп параметров x(t), внутри которой Reλi < 0, т. е. самолет устойчив в общем случае относительно изменений x(t). В случае когда x Gдоп, коэффициенты aij таковы, что значения λi ≥ 0 . Таким образом, теория позволяет нам определить Gдоп, т. е. область допустимых значений параметров x.
Проблема распространения полученных результатов на практике наталкивается на наличие погрешностей в определении aij(t0), соответствующих x(t0). При этом возникает
āij(t0) = aij(t0) + δaij(t0),
где aij(t0) – параметры, принятые при расчете λi(t0) и, соответственно, при построении Gдоп; āij(t0) – фактические значения aij(t0); δaij (t0) – погрешность.
Кроме погрешности δaij(t0), которая влияет на λi(t0) и Gдоп, возникает погрешность измерения x(t0). При этом имеем: = x(t0) + δx(t0), где x(t0) – расчетное, а – фактическое значение x(t0); δx(t0) – погрешность измерения. Погрешности δaij, δx(t0) обусловливают необходимость изменения (как правило, уменьшения) области Gдоп до некоторой новой области G0доп значения параметров x(t0) траектории полета, для которых условие x(t0) G0доп недопустимо из условия устойчивости.
Для построения области G0доп и оценки достоверности научных знаний на этапе внедрения в практику необходимы вторичные критерии достоверности научных знаний. В случае когда исходная математическая модель описывает случайные функции или процессы, возникает аналогичная ситуация.
7.2.2. Задача оптимальной фильтрацииРассмотрим задачу фильтрации случайных процессов, результаты которой в виде оптимальной оценки наблюдаемого процесса x(t) используются в теории управления.
Первые результаты в классической теории фильтрации сигналов и предсказания были получены А.Н. Колмогоровым и Н. Винером для стационарных систем. В качестве входного сигнала фильтра рассматривался процесс z(t) = h(t + r) + f(t), где h(t + r) – полезный сигнал; r > 0 – задача прогноза; r = 0 – задача фильтрации; f(t) – помеха, стационарный случайный процесс с нулевым средним значением. При этом получено необходимое и достаточное условие минимума дисперсии:
M{ε2} = M{[h(t + r) – x(t)]2},
где х(t) – оценка полезного сигнала h(t). Область применимости такой теории оказалась слишком узкой. Погрешности определяются не только выходом из заданной области, но и видом f(t) в самой области.
С целью уменьшения погрешности теории, в том числе расширения области ее применимости, на втором этапе, используя многообразие пространственно-временных методов, Шинбрат, Стиг, Пугачев, Парзен решили ряд трудных проблем в области нестационарной теории фильтрации и теории предсказания. Третий этап блестяще завершила работа Калмана, Бьюси [70], которой предшествовали работы Фоллэна, Хэнсона.
В работах Бьюси найдены явные соотношения между оптимальными весовыми функциями и дисперсией ошибки наблюдения, где также дан прямой вывод корреляционного уравнения и уравнения оптимального фильтра для широкого класса нестационарных сигналов и статистик помех. В завершающей работе этапа получено нелинейное дифференциальное уравнение типа Риккати для корреляционной матрицы ошибки оптимального фильтра. При этом использовались две идеи: динамическая система рассматривалась в режиме перемещения в пространстве состояния; линейная фильтрация рассматривалась как ортогональная проекция в гильбертовом пространстве.
Структура модели оптимальной оценки процесса х задается в виде
где z = С(t)x(t) + v(t); А(t,τ) – матрица вида (n × p), элементы которой непрерывные и дифференцируемые по обоим аргументам, выбрана так, что M{x(t) – }2 достигает минимума; С(t) – матрица с заданными элементами nij; v – вектор шумов (погрешностей) измерения.
Рассмотрим фильтр Калмана для стационарной системы с бесконечным временем наблюдения [57]. При этом оптимальный фильтр описывается дифференциальным уравнением
где Р – симметрическая положительно-определенная матрица; С – матрица; R – симметрическая положительно-определенная m × матрица; z = Cx = v(t); cov{v(t), v*(τ)} = δ(t – τ)R(t), δ(t) – дельта-функция.
Существенным моментом здесь является асимптотическая устойчивость (7.9), так как характеристические числа матрицы В = A – PCTR–1C имеют отрицательные действительные части. При этом матрица А(t) в (7.9) получена из уравнений, описывающих состояние стационарной системы, например, в момент времени t0: Δx = A Δx + Bu. В полете, когда x = (x1,…, xn) изменяются, изменяется А, что приводит к изменению Р. В результате мы приходим к случаю, рассмотренному выше. Из всего сказанного следует вывод: для оптимального фильтра существует область Ωдоп параметров x, в которой имеет место (7.9). Если x Ωдоп, (7.9) теряет смысл, что обусловливает необходимость введения вторичных критериев достоверности знаний относительно оптимальной оценки.
Дальнейшая задача состоит в перенесении полученных знаний из мира абстрактных объектов (А-объектов) в искусственный, построенный человеком, который в совокупности с физическим миром представляет мир вещественных объектов (В-объектов).
Наиболее идеальным объектом применения разработанной теории фильтрации является космическая техника, а также эконометрика. При этом для построения фильтра Калмана необходимо знать коэффициенты матриц в уравнениях (7.9), и во многих космических приложениях они действительно могут быть вычислены из вполне определенной динамики системы. Кроме того, шум, например, в системах телеметрии близок к белому, что обусловливает близость результатов в теории к реальным процессам. Однако при более детальном рассмотрении проблемы измерения мы убеждаемся, что помеха измерения не всегда является белым шумом, а представляет собой, в некоторых случаях, гауссовский случайный процесс.
В связи с этим подчеркнем, что достоверные научные знания в теории фильтрации получены в весьма узкой области объектов гауссовской природы, для которых линейная оценка является не только наилучшей среди линейных оценок, но и наилучшей среди нелинейных, если она построена в условиях минимума
M{(x – f(y))2}, где f(y) = .
Итак, исходя из указанных условий, получен фильтр, который охватывает некоторую область объектов G1, и для этих объектов получены достоверные знания объема Vнз в виде моделей фильтров и математических моделей для параметров этих фильтров (уравнение ковариационной матрицы). Однако в реальности имеют место объекты, образующие область G2, в которых погрешности (v) – либо усеченный гауссовский процесс, либо равномерно распределенная ограниченная функция. И в этом случае теория Калмана не работает [22], а на границе этой области необходимо разработать вторичные критерии достоверности знаний.
В работе [22] рассмотрена задача построения погрешности v(t) измерения (наблюдения). Полученная при этом модель существенно сложнее рассмотренных выше. Основные ее отличия: погрешности имеют ограниченный диапазон изменений, что сказывается на плотности вероятностей; погрешность есть композиция различных составляющих погрешностей, в том числе с равномерным и гауссовским законами распределения. Для построения оптимальной оценки нужно расширить область G1 так, чтобы она включала G2, которая включает объекты с указанными погрешностями, и увеличить объем научных знаний от (Vнз) до (Vнз)2 области G2.
Кроме сказанного, существует другая проблема, которая связана с подтверждением достоверности научных знаний для распространения их на вещественные (искусственные) объекты.
Пусть рассматривается динамический объект, для которого, как правило, существуют ограничения на параметры x(t) его состояния вида x(t) ≤ xкр, где xкр – такие значения параметров x, превышение которых приводит к катастрофе (потере устойчивости, разрушению).
Пусть для этой системы мы построили фильтр Калмана, с помощью которого формируется оптимальная оценка для процесса x(t). Как правило, оценка используется в динамической системе для целей управления.
С учетом сказанного, кроме оптимальности мы должны рассмотреть влияние на процесс управления, а именно, возникновение ситуации, связанной с выходом в область критических значений x, в силу того что x(t) зависит от , т. е. x = x(t, ). Однако для того, чтобы использовать при управлении процессом x(t), на который наложены ограничения вида x(t) Ωдоп, мы должны быть уверены, что погрешность оптимальной оценки находится в некоторой области значений, такой, что показатели риска (вероятности) не превышают допустимых значений. По этой причине необходимы критерии, с помощью которых гарантируется с определенной достоверностью отсутствие катастрофы, связанной с выходом x из Ωдоп.
7.3. Вторичные критерии достоверности научных знаний
В силу существования различных подходов к построению критериев достоверности научных знаний рассмотрим отдельно объекты, с помощью которых формируются детерминированные и случайные функции (процессы) и, в частности, величины.
В качестве примера рассмотрим проблему проектирования самолета нового класса. Пусть, согласно существующим теориям аэродинамики, прочности, наблюдения (контроля), управления, спроектирован самолет и в итоге расчетов получена расчетная дальность полета LP = X. В реальности для идеальных условий полета, принятых при расчетах, совершен полет на максимальную дальность. В результате получена фактическая дальность Lф = Υ, в общем случае отличная от расчетной.
Вычислив | X – Υ | = ρ, мы получили, что погрешность теоретических расчетов составляет ρ = ε. Пусть допустимая величина ρ задана и равна εдоп. В случае если ε < εдоп, теория признается достоверной, а примененный критерий в дальнейшем будем называть первичным.
Аналогично можно рассмотреть в задаче устойчивости (см. п. 7.2.1) в качестве критерия | хi –~ yi |= ρ, где хi, уi, – корни характеристического уравнения.
В дальнейшем в основу процедуры количественной оценки достоверности научных знаний положим постулат Н.Г. Четаева [64], являющийся постулатом достоверности законов механики и физики (см. главу I). При этом мы предполагаем, что X – детерминированный процесс, значение которого может быть измерено с некоторой погрешностью ε, максимальная величина которой нам известна. Назовем этот критерий первичным критерием достоверности научных знаний.
Правообладателям!
Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.