Текст книги "Научный риск (введение в анализ)"
Автор книги: Владимир Живетин
Жанр: Прочая образовательная литература, Наука и Образование
Возрастные ограничения: +12
сообщить о неприемлемом содержимом
Текущая страница: 21 (всего у книги 26 страниц)
Глава VII. Естествознание. Численные критерии достоверности научных знаний. Научный риск
Рассмотрим схематично процедуру создания мира абстрактных объектов (глава I). Как правило, в исходных посылках мы имеем дело с объектами Fφ физического мира. Так, например, объектом математического описания является траектория полета летательного аппарата в трехмерном пространстве, заданном в виде прямоугольной декартовой системы координат. Таким образом, мы имеем объект Fφ в трехмерном пространстве R3, в котором может быть введено расстояние с помощью соответствующих шкал измерения A1. Объекты Fφ отображаются человеком в пространство П1 чувственного мира в виде объектов Fr, которые в некотором смысле подобны Fφ с сохранением расстояний со шкалой измерения А2.
На следующем этапе объекты Fr отображаются в математические объекты F′a, описываемые математическими моделями Ma в пространстве П3 c соответствующей метрикой. Этот объект в общем случае изучается с целью перевода его в пространство П4 абстрактных объектов Fa, описываемых абстрактными моделями. Если не существуют необходимые теории для исследования таких объектов в пространстве П4, то объект отображают в пространство П5 в виде Foa. В пространстве П5 (или, в частности, П4) производится исследование его свойств и устанавливается соответствие, в том числе с помощью моделей M′a и Moa, между объектами F′a и Foa, которые замещают заданный объект. Индекс «o» означает, что мы имеем дело не с самим объектом F′a, а с объектом, который назовем оценкой, полученной различным образом.
7.1. Абстрактные объекты и их модели
7.1.1. Математические модели, основные понятияОписание физических объектов, например, таких как самолет, требует упрощенных описаний с помощью словесных, символических, в том числе физических моделей (так, например, моделей самолета для продувки в аэродинамической трубе), которые подходящим образом «абстрагируют» выбранные существенные свойства физических объектов.
Математическая модель включает в себя абстрактные, символические модели математических объектов, такие как числа, векторы, матрицы, тензоры, и описывает отношения между этими объектами в виде гипотетического правила, связывающего два или более символических объекта, согласно структуре изучаемого, например, физического объекта.
Различие между математическими моделями и абстрактными моделями можно проиллюстрировать на следующем примере. Пусть мы рассматриваем коротко периодическое давление самолета. Тогда изменение угла атаки α самолета мы можем задать дифференциальным уравнением второго порядка:
где a, b – заданные коэффициенты, в частности постоянные величины; f(t) – внешнее возмущение. При этом α имеет размерность – градусы, а , – скорость и ускорение изменения α(t). Представленную модель относят к математическим моделям физического объекта.
Пусть мы рассматриваем уравнение + a + x = f(t), в котором x, , не имеют размерности. В этом случае имеет место абстрактная модель, которая может быть использована для исследования широкого круга объектов.
На практике нам часто приходится использовать теоретически исследованные абстрактные модели для описания физических объектов. При этом необходимо осуществить переход от физического объекта к абстрактной модели и последней ставить в соответствие математическую модель.
При создании математических моделей используются нижеследующие понятия, правила и т. п., которые включают в себя:
1) математические объекты: числа, векторы, матрицы, тензоры и т. п.;
2) математические операции и бинарные отношения;
3) правила для математических объектов;
4) правила соответствия и т. п.
Многие отношения могут быть описаны при помощи математических операций и бинарных отношений, связывающих один или несколько объектов с другим объектом или множеством объектов. Так, например, «равенство» и отношение эквивалентности двух объектов. Аксиоматическое определение каждого класса математических объектов влечет за собой наличие правила, устанавливающего, являются ли два данных математических объекта a и b эквивалентными, в том числе «равными» или неразличимыми с точки зрения модели, т. е. a = b или нет. Для всех математических объектов a, b, c справедливы правила:
а = а (рефлексивность отношения равенства);
из а = b следует, что b = a (симметрия);
из a = b, b = c следует, что a = c (транзитивность).
Данному правилу удовлетворяют, например, векторы, для которых введены соответствующие операции.
Математическая модель будет подходящим образом воспроизводить выбранные стороны (свойства) физического явления, если можно установить правила соответствия, связывающие специфические (изучаемые) физические объекты и отношения (свойства) с определенными математическими объектами и отношениями (свойствами). Конструктивное определение вводит новую математическую модель, пользуясь уже известными математическими понятиями и объектами, например, с помощью матриц.
Абстрактная модель с ее абстрактными объектами произвольной природы, отношениями и операциями определяется непротиворечивым набором правил (определяющих аксиом), вводящих операции, которыми можно пользоваться, и устанавливающих общее отношение между их результатами. Так вводится аксиоматическое определение абстрактивной модели с помощью ее свойств.
Непротиворечивость такого определения доказывается конструктивным построением примера, удовлетворяющего определяющим аксиомам, независимость которых должна быть установлена. В качестве примера рассмотрим современную абстрактную алгебру. При этом имеются в виду следующие области алгебры: абстрактная алгебра, элементарная алгебра; теория алгебраических операций, используемая в связи со специфической моделью (матричная алгебра, тензорная алгебра); линейная алгебра, булева алгебра.
Современная абстрактная алгебра имеет дело с математическими моделями, определяемыми в терминах бинарных операций, т. е. «алгебраических операций», например, «сложение» и «умножение», которые связывают пары математических объектов соответствующими операциями. К моделям такого рода относятся: группы, кольца, поля, векторные пространства и линейные алгебры, булева алгебра. В математической теории (абстрактных) моделей выделяются:
1. Модели с одной определяющей операцией из соответствующей алгебры с выделением класса G абстрактных объектов, называемых группой (в том числе абелевой, конечной и бесконечной), подгруппой с гомеоморфизмом и изоморфизмом групп.
2. Модели с двумя определяющими операциями с выделением класса R абстрактных объектов, называемых кольцом.
3. Модели, включающие в себя более одного класса математических объектов (линейные векторные пространства и линейная алгебра), где вводится класс U абстрактных объектов, которые называются векторами, а скалярами называются элементы α, β кольца R, когда в линейном векторном пространстве определены две операции (векторное сложение и умножение вектора на скаляр).
4. Модели, допускающие определения предельных процессов (топологические пространства), включают класс C абстрактных объектов (точек) х, образующих топологическое пространство C, наделенных рядом свойств [16], и в котором вводится: окрестность объекта (точки) x C; непрерывность, гомеоморфизм; топология, окрестность и сходимость в метрическом пространстве; метрические пространства со специальными свойствами, точечные множества, когда рассматривается приближение функции f (t) последовательностью функций S0(t), S1(t), S2(t), … (частичные суммы бесконечного ряда функции g(t)) с использованием метрики:
где t [0; Т], которая приводит к определению равномерной сходимости или метрики:
представляющей приближения по методу наименьших квадратов (средняя квадратическая ошибка).
5. Комбинации моделей, прямое произведение, топологическое произведение и прямая сумма, включающие следующие обобщения:
– декартовым произведением называются абстрактные объекты класса С, элементы (объекты) которого представляют собой всевозможные упорядоченные множества {а1, а2, …} объектов а1, а2, …, взятых соответственно из классов С1, С2, …; при этом {а1, а2, …} = {b1, b2, …} в том и только том случае, когда a1 = b1, a2 = b2, …;
– прямым произведением G = G1 G2 двух групп абстрактных объектов G1, G2 называется группа G, образованная всеми упорядоченными парами {а1, а2}, где а1 G1, а2 G2, а умножение вводится как {a1, a2}{b1, b2} = {a1b1, a2b2};
– прямое произведение действительных векторных пространств U = U1 U2, где U1, U2 – два действительных векторных пространства; так, например, построение тензоров как внешнее произведение векторов;
– топологические произведения двух топологических пространств С1 и С2 есть их декартовое произведение с топологией, т. е. семейством открытых множеств, представляющим собой произведение любых двух множеств S1 и S2, где S1, S2 – открытые множества в С1 и С2 соответственно;
– прямая сумма двух векторных пространств U1 U2 = U, двух колец R1 R2 = R, двух линейных алгебр связана с операцией над абстрактными объектами a1 и a2, взятыми из соответствующих пространств, колец, алгебр.
Логические комбинации абстрактных моделей, в том числе сложение и умножение, описываемые в рамках булевой алгебры, включают: булевы функции, приведение их к каноническому виду; логическое отношение включения; полную аддитивность и алгебру меры; изоморфизм булевых алгебр.
Функции абстрактных объектов суть набор правил (x → x'), ставящих каждому объекту x из класса С в соответствие некоторые объекты х' из класса C'', и называются преобразованием или отображением класса С в класс C'', при этом x' есть функция вида x' = x'(x) = f(x), аргумент х с областью определения С и множеством значений, содержащихся в С. Классы С и C'' могут быть различными или совпадать.
7.1.2. О близости абстрактных (математических) объектовВ качестве абстрактных объектов будем рассматривать:
– функции f(x), определенные на Rn;
– функции-параметры f(x, t), порожденные системами с распределенными параметрами, зависящими не только от времени t, но и от пространственных координат x X.
– случайные процессы x(t), порожденные динамическими системами, подверженные воздействию как внутренних, так и внешних случайных факторов, в том числе в виде случайных процессов w(t).
Пусть в качестве абстрактного объекта имеется объект, описываемый математической моделью
= f(x, u, w) или ψ(x, u, w) = 0,
где ψ – оператор; f – функция; x(t), w(t) – случайные векторные процессы; u – векторное управление.
С помощью известных абстрактных теорий решение этого уравнения мы можем найти в виде x(t). При этом, зная x(t), можем судить: о свойствах заданного абстрактного объекта, в том числе его устойчивости; о возможности выхода объекта в область критических состояний; о возможности достижения изучаемым объектом некоторого заданного множества Ω в момент времени T.
Имея указанную математическую модель и соответствующее ей экспериментальное значение на выходе физического объекта y(t), мы обязаны их сравнить. В идеальной ситуации должно выполняться условие x(t) = у(t) t [0, Т]. Но это возможно только в простейших ситуациях, а в общем случае можем потребовать | x – y | < ε. При этом необходима топология (в частности матрица) для различных практически важных абстрактных объектов, включающих:
– функции-процессы;
– процессы с распределенными параметрами;
– процессы с неопределенными факторами;
– стохастические процессы.
Часто необходимо рассматривать один процесс в разных моделях, разных пространствах с помощью различных теорий. Кроме того, необходимо задать расстояние, например, в метрическом пространстве, когда каждой паре его элементов – объектов x, y – поставлено в соответствие действительное число ρ(x, у) – расстояние между ними.
Рассмотрим два вида ограничений, вносимых при построении абстрактной модели. Пусть имеем два объекта: один заданный (фактический), обозначим его U; другой объект, обозначим его V, построен нами в качестве абстрактной модели. При этом ставится задача выбрать (построить) метрическое пространство с метрикой ρ и ввести оценку δ возможного отличия U от V, т. е. ρ(u, v) < δ. В качестве таких пространств следует рассматривать:
Метрическое пространство, представляющее множество С[а,в] всех непрерывных действительных функций, определенных на сегменте [а, b] с расстоянием отклонения относительно друг друга
Это пространство обозначается так же, как и множество С[а,в] точек этого пространства.
Метрическое пространство С2[а,в], называемое пространством непрерывных функций с квадратичной метрикой, где расстояние определено как
Математическая модель соответствует данному математическому объекту, абстрактная модель – абстрактному объекту, математический объект – физическому объекту.
7.1.3. Качественно одинаковые функцииРассмотрим метод, позволяющий определить, когда две функции близки, а в более частном случае эквивалентны или качественно одинаковые [16]. При этом предполагается, что известен первичный критерий достоверности знаний, полученных в процессе научных исследований в мире абстрактных объектов (см. главу I).
Пусть дана функция f(x), и в процессе теоретических исследований ей поставлена в соответствие функция g(x), где x = (x1, x2, …, xn). Необходимо задать условие соответствия или близости и оценить возможность перехода от f(x) к функции g(x), теоретические свойства которой нам известны. Необходимо задать расстояние между ними, т. е. ввести метрику (топологию). Пусть функции определены на множестве Rn и дифференцируемы требуемое число раз. Введем топологию рядов Тейлора, представив f(x) в точке x0 Rn в виде
где fi, fij – производные первого и второго порядка функции f(x) в точке x0 = (x01, x02, …, x0n). При этом f(x) есть функция не только х, но и х0 в некотором евклидовом пространстве, так как fi, fij, … вычислены в точке x0. Если количество членов (7.1) равно k, то можно считать, что коэффициенты fi, fij, …, fij…k принадлежат пространству RD, где
включает постоянный член; линейные члены; квадратные члены и так далее до членов k-й степени. Если (7.1) содержит k слагаемых, то он называется k-струей функции f в точке x0 и обозначается jkf(x0) RD.
Метрику в пространстве RD рядов Тейлора, с помощью которой задается расстояние между искомыми функциями f и g, можно ввести следующим образом:
Если D конечно, то расстояние между ∑ и g можно задать так:
Соотношения (7.2), (7.3) различным образом задают расстояние между f и g, а также ε-окрестность функции f которая содержит все функции g, отстоящие от f на расстоянии, меньше ε. Если k конечно, то (7.2) и (7.3) порождают эквивалентные топологии [51]. Если k → ∞ (D → ∞), то топологии различны. При k → ∞ для (7.2) имеем топологию C∞ в точке x0.
Если расстояние между g(x) и f(x) в Ck(C∞) топологии в точке x0 меньше, чем ε, для всех x0 Rn, то говорят, что g(x) принадлежит ε-окрестности функции f(x) в Ck(C∞) топологии. Две функции, близкие друг другу в топологии Ck, имеют свойство быть равными почти всюду на Rn, а их соответствующие производные до k-й степени также равны почти всюду на Rn. Назовем такие функции качественно одинаковыми.
Подобные топологии, определяемые коэффициентами членов ряда Тейлора, предполагают однозначное соответствие между функциями и их рядами Тейлора. Это возможно только тогда, когда f(x) – аналитическая в точке x0, т. е. ее ряд Тейлора в этой точке сходится к f(x) в окрестности точки x0.
Если рассматривается или получена в процессе исследования гладкая функция f1(x), имеющая то же разложение в ряд Тейлора, что и аналитическая f(x), то равенство f(x) = f1(x) здесь может не выполняться. Отметим, что для любой аналитической функции f(x) существует большое семейство гладких функций, не тождественных f(x), т. е. отличающихся на ε ≠ 0. Однако отображение функции в евклидово пространство RD с целью получения топологии в силу многих полезных свойств получило широкое распространение. В приложениях обычно считают соответствие между f(x) и рядом Тейлора взаимно однозначным.
В силу сказанного можно рассматривать условия устойчивости функции [17]: функция является устойчивой или структурно-устойчивой, если ее свойства не изменяются под действием возмущений. При этом воздействие возмущения на данную функцию f(x) вводится с помощью семейства функций F(x, a) такого, что f = f(x), где x = (x1, …, xn); F = F(x, a), где a = (a1, …, ar), F(x, a)|a=0 = f(x), которая называется r-мерной деформацией функции f(x). При этом можно полагать a = ε, где ε RD малы.
Рис. 7.1
Отметим ряд особенностей, свойственных отображению Rn в Rm, и обусловленные этими особенностями погрешности, являющиеся источниками научного риска.
1. Случай, когда рассматривается отображение Rn в Rm. Известно [17], что структурно-устойчивые функции образуют плотное множество в пространстве всех отображений типа Rn в R1. В результате любую функцию можно сколь угодно близко аппроксимировать структурно-устойчивыми функциями. В случае отображений F : Rn → Rm такое утверждение неверно. В самом деле, если F – отображение многообразия X в многообразие Y, т. е. X Y, то множество структурно-устойчивых отображений F : X → Y не плотно во множестве всех таких отображений, если параметры (n, m) принадлежат заштрихованной области вместе с границей (рис. 7.1), т. е. мы получили критическую область отображений.
2. Случай отображения Rn в R1 при n → ∞. Результаты теории о локальном характере потенциальных функций V(x), в том числе теоремы о неявных функциях, канонических формах в окрестности критической точки, включая и семейство таких функций V(x, c), представляющие собой отображения Rn → R1 и Rn Rk → R1 соответственно, изложены в функциональном анализе [16].
Когда размерность пространства Rn стремится к бесконечности (т. е. n → ∞), возможны модели, содержащие погрешности теории, обусловливающие научный риск. Так, например, для конечномерного пространства состояний ненулевые собственные значения оператора устойчивости обязательно отделены от нуля, поскольку число собственных значений конечно. В бесконечномерном случае это необязательно, поэтому можно ожидать новых явлений, сопровождающихся потерей устойчивости [17].
По этому поводу следует сказать, что существует n = nкр, начиная с которого следует ожидать новых результатов. В силу того, что результаты, относящиеся к f : Rn → R1, известны и теоретически верны, но на практике скорость сходимости мала, для оценки nкр необходимы вторичные критерии применимости теории при исследовании абстрактных объектов.
7.1.4. Оценка близости процессов с распределенными параметрамиРасширим полученные результаты на процессы с распределенными параметрами. Предположим, что в качестве изучаемого объекта А рассматривается система, параметры которой зависят не только от времени t, но и от пространственных координат х, т. е. имеем ψi(x, t) , где x = (x1, x2, …, xm), т. е. ψ(·) задана в Rm+1 – евклидовом пространстве.
Необходимо построить абстрактный процесс φi(x, t) средствами абстрактных теорий таким образом, чтобы, во-первых, ψi и φi отличались не более чем на заданную величину εi, а εi должно быть выбрано так, чтобы свойства полученного (абстрактного) объекта были в каком-то смысле достоверными по отношению к заданному объекту А. В отличие от f(x), рассмотренной ранее, в данном случае, изучая объект А, приходится иметь дело с системой функций ψi(x, t) , которая удовлетворяет:
– некоторым заданным граничным условиям, с помощью которых в физическом мире учитывается взаимодействие объекта с окружающей средой;
– начальному условию ψi0(x) = ψi(x, t0), которое характеризует состояние объекта в начальный момент времени и отражает влияние ψi0 на ψi(·).
Итак, предположим, что ψi(·) – система функций, порожденная объектом А, а φi(·) – система функций, порожденная тем объектом В, который мы можем изучать с помощью существующих теорий абстрактного мира. Разность εi(x, t) = ψi(x, t) – φi(x, t) подлежит изучению. Систему функций εi представим в виде векторной функции ε(x, t) = (ε1(x, t), ε2(x, t), …, εn(x, t)).
При построении объекта В мы должны ввести меру отклонения свойств объекта В от А для каждого момента времени t [t0, ∞). В первом приближении вполне достаточна равномерная малость отклонения εi(x, t) по всей области Ω, где x1, x2, …, xn – координаты этой области, а ψi определены в m-мерном евклидовом пространстве Rm, в любой момент времени t ≥ t0, т. е. |εi(x, t)| < ε0 при всех х Ω и t [t0, ∞), где ε0 – малое положительное число, заданное из дополнительных соображений, например, безопасности состояния объекта.
Как указано в предыдущем разделе, решение задачи может быть получено с помощью топологии рядов Тейлора. Однако, как и ранее, здесь равномерная малость погрешности не означает малость отклонений ее как отдельных, так и производных более высокого порядка, что обусловливает отличие объектов А и В. Какова цена такого отличия и ее последствия – предмет специальных исследований.
В работе [62] для процессов с распределенными параметрами вводится мера процесса ε(x, t) в виде вещественного функционала ρ = ρ(ε(·, t), t). С помощью меры ρ задается близость процессов ψ и φ в момент времени t. Если ρ не зависит от t, то ρ = ρ(ε). Так, например, в качестве меры выбираются
При этом близость процессов предлагается оценивать по двум мерам: ρ и ρн. Мера отклонения ρн от времени t не зависит. Она позволяет задать начальную близость процессов φi и ψi (εi = ψi = φi) при t = 0 в виде ρн < δ, в то время как ρ < ε задает близость φi и ψ при t > 0. Если при этом мы определяем процессы ψi как фактические или заданные, а процессы φi определяем теоретическим образом, и будем рассматривать условие их близости, то результаты работы [62], сформулированные как устойчивость систем с распределенными параметрами, могут быть использованы в решении проблемы построения абстрактной модели абстрактного объекта.
Правообладателям!
Это произведение, предположительно, находится в статусе 'public domain'. Если это не так и размещение материала нарушает чьи-либо права, то сообщите нам об этом.