Текст книги "Теорема века. Мир с точки зрения математики"
Автор книги: Анри Пуанкаре
Жанр: Прочая образовательная литература, Наука и Образование
сообщить о неприемлемом содержимом
Текущая страница: 11 (всего у книги 35 страниц) [доступный отрывок для чтения: 12 страниц]
Обсуждение трех предыдущих примеров, столь различных во всех отношениях, до некоторой степени обнаруживает, с одной стороны, значение того, что философы называют принципом достаточного основания, а с другой – важность того факта, что некоторые свойства являются общими для всех непрерывных функций. Изучение вероятности в физических науках приведет нас к тому же результату.
III. Вероятность в физических науках. Перейдем теперь к проблемам, относящимся к тому, что я назвал выше второй степенью незнания; это – те проблемы, в которых известен закон, но неизвестно начальное состояние системы. Я мог бы умножать число примеров, но я возьму только один; каково в настоящее время вероятное распределение малых планет на зодиаке?
Мы знаем, что они подчиняются законам Кеплера: мы можем даже, не изменяя ничего в природе проблемы, допустить, что все их орбиты круговые и расположены в одной и той же известной нам плоскости. Зато мы совершенно не знаем, каково было их начальное распределение. И все же мы, не колеблясь, можем утверждать, что теперь это распределение приблизительно равномерно. Почему?
Пусть b будет долготой малой планеты в начальный момент, т. е. в момент, равный нулю, пусть а – средняя скорость ее движения; ее долгота в настоящий момент t будет at + b. Сказать, что распределение планет в настоящий момент равномерно, это все равно что сказать, что средняя величина из синусов и косинусов кратного аргумента at + b есть нуль. Почему же мы утверждаем это?
Изобразим каждую малую планету точкой на плоскости, именно точкой, координаты которой в точности суть а и b. Все эти изображающие точки будут заключены в некоторой области плоскости, но так как их очень много, то эта область окажется усеянной точками. Впрочем, мы ничего не знаем о распределении этих точек.
Как приложить исчисление вероятностей в данном случае? Какова вероятность того, что одна или несколько изображающих точек находятся в такой-то части плоскости? Вследствие нашего незнания нам приходится ввести произвольную гипотезу. Чтобы выяснить природу этой гипотезы, я использую вместо математической формулы грубый, но конкретный образ.
Представим себе, что поверхность нашей плоскости покрыта воображаемой материей, плотность которой переменна, но изменяется она непрерывно. Условимся принять, что вероятное число изображающих точек, приходящихся на данную часть плоскости, пропорционально количеству находящейся здесь воображаемой материи. Поэтому, если мы имеем на плоскости две области одинаковых размеров, то вероятности того, что точка, изображающая одну из наших малых планет, находится в той или другой из этих областей, будут относиться, как средние плотности воображаемой материи в той или другой области.
Вот, следовательно, два распределения: одно – действительное, где изображающие точки крайне многочисленны, крайне скучены, но разделены, как молекулы материи по атомистической гипотезе; другое – расходящееся с действительностью, где наши изображающие точки заменены воображаемой непрерывной материей. Относительно последней мы знаем, что она не может быть реальной, но наше незнание вынуждает нас принять ее.
Если бы затем мы имели какое-нибудь представление о действительном распределении изображающих точек, то мы могли бы условиться так, чтобы во всякой области плотность этой воображаемой непрерывной материи была приблизительно пропорциональна числу изображающих точек или, если угодно, числу атомов, заключающихся в этой области. Но и этот прием невозможен, наше незнание столь велико, что мы принуждены выбирать произвольно функцию, определяющую плотность нашей воображаемой материи. Мы вынуждены принять только одну гипотезу, которой мы почти не в состоянии избежать, – мы предположим эту функцию непрерывной. Этого, как мы увидим, достаточно для того, чтобы мы могли сделать некоторое заключение.
Каково вероятное распределение малых планет в момент t? Или, иначе, каково вероятное значение синуса долготы в момент t, т. е. sin(аt + b)? Мы начали с произвольного соглашения; если мы примем его, то это вероятное значение вполне определено. Разобьем плоскость на элементы площади. Рассмотрим значение sin(at + b) в центре каждого из этих элементов; умножим эту величину на площадь элемента и на соответствующую плотность воображаемой материи; составим затем сумму для всех элементов плоскости. Эта сумма по определению будет искомой вероятной средней величиной, которая окажется, таким образом, выраженной при помощи двойного интеграла.
Можно сначала подумать, что эта средняя величина будет зависеть от выбора функции φ, определяющей плотность воображаемой материи, и что так как эта функция φ произвольна, то в зависимости от произвольного выбора, который мы сделаем, мы можем получить какую угодно среднюю величину. Но это совсем не так.
Простое вычисление показывает, что наш двойной интеграл очень быстро убывает с возрастанием t.
Таким образом, я совершенно не знал, какую гипотезу мне допустить относительно вероятности того или иного начального распределения; но каково бы ни было сделанное допущение, результат будет тот же: это и выводит меня из затруднения.
Какова бы ни была функция φ, средняя величина стремится к нулю с возрастанием t, и так как малые планеты, конечно, совершили очень большое число обращений, то я могу утверждать, что эта средняя величина очень мала.
Я могу выбрать φ по своему желанию, однако с одним ограничением: эта функция должна быть непрерывной; и в самом деле, с точки зрения субъективной вероятности выбор прерывной функции был бы неразумным; какое основание имел бы я, например, предполагать, что начальная долгота может быть равна именно 0°, но что она не может быть заключена между 0° и 1°?
Но трудность возникает вновь, если стать на точку зрения объективной вероятности – если мы перейдем от нашего воображаемого распределения, где воображаемая материя предполагалась непрерывной, к действительному распределению, где наши изображающие точки образуют собой как бы дискретные атомы.
Среднее значение sin(at + b) представится просто через
1/n ∑ sin(at + b)
где n – число малых планет. Вместо двойного интеграла, относящегося к непрерывной функции, мы имеем сумму дискретных членов, и между тем никто серьезно не усомнится в том, что это среднее значение будет на самом деле очень мало.
Именно вследствие того, что наши изображающие точки крайне скучены, наша дискретная сумма вообще будет очень мало отличаться от интеграла.
Интеграл есть предел, к которому стремится сумма членов, когда число этих членов беспредельно возрастает. Если членов очень много, то сумма будет очень мало отличаться от своего предела, т. е. от интеграла, и то, что я сказал о последнем, будет справедливо и для суммы.
Тем не менее существуют исключительные случаи.
Если бы, например, для всех малых планет имело место равенство b = π/2 – at, то в момент t долгота всех планет равнялась бы π/2 и среднее значение было бы, очевидно, равно 1. Для этого было бы необходимо, чтобы в момент t = 0 все малые планеты были размещены на некоторой спирали особенной формы с крайне тесно сближенными витками. Всякий признает, что подобное начальное распределение крайне невероятно (и даже если допустить его в действительности, то распределение было бы неравномерным для некоторого момента, например, 1 января 1900 г., но оно перешло бы в равномерное через несколько лет).
Однако почему мы признаем такое начальное распределение невероятным? Необходимо это выяснить, так как если бы мы не имели основания отбросить эту нелепую гипотезу как не заслуживающую доверия, то все бы рушилось и мы уже ничего не могли бы утверждать относительно вероятности того или иного действительного распределения.
Мы опираемся здесь опять-таки на принцип достаточного основания, принцип, к которому постоянно приходится возвращаться. Мы могли бы допустить, что вначале планеты были распределены приблизительно на прямой линии или что они были расположены неравномерно; но, как нам кажется, нет достаточного основания предполагать, что неизвестная причина, породившая их, действовала, следуя столь правильной и в то же время столь сложной кривой, которая представлялась бы выбранной умышленно как раз для того, чтобы нынешнее распределение не было равномерным.
IV. Красное и черное. Вопросы теории азартных игр, например игры в рулетку, в сущности, вполне аналогичны тем, которые мы только что рассматривали.
Представим себе циферблат, разделенный на большое число равных делений, попеременно красных и черных; в центре его укреплена вращающаяся стрелка; после сильного разгона эта стрелка, сделав значительное число оборотов, остановится против одного из делений. Вероятность того, что это деление красное, очевидно, равна х/2.
Стрелка повернулась на угол θ, заключающий в себе несколько окружностей: я не знаю, какова вероятность того, что стрелка отброшена с такой силой, чтобы этот угол был заключен между θ и θ + dθ; но я могу ввести условное положение – могу допустить, что эта вероятность равна φ(θ)dθ; что касается функции φ(θ), то я могу выбрать ее вполне произвольно, нет ничего, что могло бы руководить мной в этом выборе; однако я, естественно, буду предполагать эту функцию непрерывной.
Пусть ε – длина (она считается по окружности радиуса, равного единице) каждого красного или черного деления. Надо вычислить интеграл от φ(θ)dθ, распространяя его, с одной стороны, на все красные деления, с другой – на все черные, и затем сравнить полученные результаты.
Рассмотрим промежуток 2ε, заключающий одно красное деление и следующее за ним черное. Пусть М и m – наибольшее и наименьшее значения функции φ(θ) в этом промежутке. Интеграл, распространенный на красные деления, будет меньше Σmε; интеграл, распространенный на черные деления, будет больше Σmε; следовательно, разность их будет меньше Σ(М − m)ε. Но если функция φ предположена непрерывной, если, с другой стороны, промежуток ε очень мал сравнительно с полным углом, описанным стрелкой, то разность М − m будет крайне мала. Поэтому и разность двух интегралов будет очень мала и вероятность будет очень близка к 1/2.
Всякому понятно, что, не зная ничего о функции φ, я должен действовать так, как если бы вероятность была равна 1/2. Ясно, с другой стороны, что если, становясь на объективную точку зрения, я буду наблюдать известное число выпадений, наблюдение даст мне приблизительно столько же выпадений черного, сколько и красного. Все игроки знают этот объективный закон, но он вовлекает их в одну странную ошибку, которая им часто указывалась, но в которую они всегда впадают снова. Когда красное выпало, например, шесть раз подряд, они ставят на черное, рассчитывая на верный выигрыш; ведь очень редко бывает, говорят они, чтобы красное выпадало семь раз подряд.
В действительности вероятность выигрыша и в этом случае остается равной 1/2. Правда, наблюдение показывает, что серии из семи последовательных красных крайне редки; но серия из шести красных, за которой следует один черный, является столь же редкой. Им бросилась в глаза редкость серий из семи красных; но они не обращали внимания на редкость серий из шести красных и одного черного единственно потому, что подобные сочетания меньше поражают внимание.
V. Вероятность причин. Я перехожу к проблемам вероятности причин – проблемам, наиболее важным с точки зрения их применений в науке. Пусть, например, две звезды расположены на небесной сфере очень близко друг к другу. Не является ли эта видимая близость результатом простой случайности, и не находятся ли эти звезды – хотя они расположены почти на одном и том же луче зрения – на очень различных расстояниях от Земли, а следовательно, на значительном отдалении одна от другой? Или мы имеем здесь действительную близость? Вот это и есть проблема вероятности причин. Прежде всего я напомню, что всякий раз, обсуждая проблемы вероятности событий, которыми мы занимались до сих пор, мы всегда должны были выдвигать некоторое условное положение, более или менее оправдываемое. И если чаще всего результат был в известной мере независим от этого условного положения, то это лишь в силу известных гипотез, которые позволили нам a priori отбросить, например, разрывные функции или некоторые нелепые соглашения.
Нечто аналогичное встретим мы, занимаясь вероятностью причин. Некоторое действие может быть произведено причиной А или причиной В. Действие наблюдалось; ищется вероятность того, что оно обусловлено причиной А; это – вероятность причины a posteriori. Но я не мог бы вычислить ее, если бы некоторое более или менее оправдывающееся условное положение не позволило мне наперед знать, какова априорная вероятность того, что причина А вступит в действие; я подразумеваю здесь вероятность этого события для того, кто еще не наблюдал самого действия.
Для большей ясности я возвращусь к примеру игры в экарте, к которому я прибегал выше; мой партнер сдает карты в первый раз и открывает короля – какова вероятность, что это шулер? Обычное применение формул дает 8/9 – результат, очевидно, крайне удивительный. Если исследовать дело ближе, то вычисление оказывается выполненным так, как если бы я, еще не садясь за игорный стол, уже признал, что у меня один шанс против двух за то, что мой партнер – нечестный игрок. Такая гипотеза нелепа, ибо в этом случае я, конечно, не стал бы с ним играть; этим выясняется и нелепость заключения.
Условное положение об априорной вероятности было неоправданным; поэтому и вычисление апостериорной вероятности привело меня к недопустимому результату. Отсюда видна важность предварительного условного положения. Я прибавлю еще, что если совсем не вводить условного положения, то проблема вероятности a posteriori не имела бы никакого смысла; всегда приходится это делать либо явно, либо молчаливо.
Перейдем к примеру более научного характера. Я хочу определить некоторый экспериментальный закон; когда я буду знать его, его можно будет представить с помощью некоторой кривой; я делаю несколько отдельных наблюдений; пусть каждое из них изобразится некоторой точкой. Получив ряд различных точек, я провожу между ними кривую, стараясь возможно меньше уклоняться от них и в то же время сохранить для моей кривой правильную форму, без угловых точек, без слишком резких изгибов, без внезапного изменения радиуса кривизны. Эта кривая представит мне вероятностный закон, и я допускаю, что она не только дает мне значения функции, промежуточные между наблюдаемыми, но что и самые наблюдаемые значения она дает точнее, чем прямое наблюдение (потому-то я и проводил ее вблизи моих точек, но не через самые точки).
Такова проблема вероятности причин. Действиями здесь являются зарегистрированные мною результаты измерений; они зависят от сочетания двух причин – истинного закона явления и погрешностей наблюдения. Задача состоит в том, чтобы, зная действия, отыскать вероятность того, что явление подчиняется такому-то закону, и вероятность того, что наблюдения искажены такой-то погрешностью. Тогда наиболее вероятный закон соответствует проведенной кривой, и наиболее вероятная ошибка наблюдения представится расстоянием соответствующей точки от этой кривой.
Но проблема не имела бы никакого смысла, если бы я до всякого наблюдения не составил себе идею о вероятности a priori того или иного закона и о шансах ошибки, которую я могу совершить.
Если мои инструменты хороши (и это я знал бы до наблюдения), то я не позволю моей кривой значительно уклоняться от точек, представляющих непосредственные измерения. Если же они плохи, то я мог бы отступить от этих точек несколько больше, лишь бы получить кривую, менее извилистую, в целях упорядоченности я мог бы принести и бо́льшую жертву.
Однако почему же я стараюсь провести кривую без извилин? Потому, что закон, представляемый непрерывной функцией (или функцией, у которой производные высшего порядка малы), я уже a priori рассматриваю как более вероятный сравнительно с законом, не удовлетворяющим этому условию. Без этой уверенности рассматриваемая проблема не имела бы никакого смысла; интерполяция была бы невозможна; нельзя было бы вывести закон из конечного числа наблюдений; наука не существовала бы.
Пятьдесят лет тому назад физики рассматривали более простой закон как более вероятный, чем закон сложный, при прочих равных условиях. Они ссылались на этот принцип в защиту закона Мариотта против опытов Реньо. Теперь они отказались от этой веры; и между тем как часто они бывают вынуждены поступать так, как если бы они сохранили эту веру! Как бы то ни было, именно от этого направления осталась вера в непрерывность, и мы только что видели, что если бы эта вера в свою очередь исчезла, то экспериментальная наука стала бы невозможной.
VI. Теория погрешностей. Мы пришли, таким образом, к обсуждению теории погрешностей, которая находится в непосредственной связи с проблемой вероятности причин. И здесь мы снова констатируем следствия, – а именно, известное число расходящихся между собою наблюдений – и стараемся разгадать причины, которыми вызываются, с одной стороны, истинное значение измеряемых величин, с другой – ошибки, допущенные в каждом отдельном наблюдении. Надо было бы вычислить, какова a posteriori вероятная величина каждой ошибки и затем каково вероятное значение измеряемой величины.
Но, как я уже выяснил, нельзя было бы предпринять это вычисление, если не допустить a priori, т. е. до всякого наблюдения, некоторого закона вероятности погрешностей. Существует ли какой-либо закон погрешностей?
Закон погрешностей, принятый всеми вычислителями, есть закон Гаусса, который представляется некоторой трансцендентной кривой, известной под названием «колокола».
Но прежде всего следует напомнить классическое различие между ошибками систематическими и случайными. Если мы измеряем некоторую длину слишком длинной мерой, мы всегда получим число слишком малое, и бесполезно будет повторять измерение несколько раз; это – ошибка систематическая. Если мы измеряем точным метром, мы можем тем не менее ошибиться, но мы будем ошибаться то в ту, то в другую сторону, и когда мы возьмем среднее из большого числа измерений, ошибка будет стремиться к уменьшению. Это – ошибки случайные.
С самого начала ясно, что систематические ошибки не могут удовлетворять закону Гаусса; но удовлетворяют ли ему случайные ошибки? Были многочисленные попытки доказать это; но почти все они являются грубо ошибочными умозаключениями. Тем не менее закон Гаусса можно доказать, опираясь на следующие гипотезы: общая ошибка есть результирующая очень большого числа частных и независимых ошибок; каждая из частных ошибок очень мала и, кроме того, подчиняется закону вероятности – какому угодно, при одном непременном условии: что вероятность положительной ошибки та же, что и вероятность ошибки, равной и противоположной по знаку. Очевидно, что эти условия будут выполняться часто, хотя и не всегда, и мы можем сохранить название случайных за теми ошибками, которые им удовлетворяют.
Отсюда видно, что метод наименьших квадратов является законным не во всех случаях; вообще физики доверяют ему меньше, чем астрономы. Несомненно, это зависит от того, что астрономы, кроме систематических ошибок, с которыми они встречаются наравне с физиками, принуждены еще бороться с одной крайне важной и вполне случайной причиной ошибок: я имею в виду атмосферные колебания.
Очень любопытно послушать физика, беседующего с астрономом о методе наблюдения: физик, убежденный, что одно хорошее измерение стоит многих плохих, прежде всего со всей предосторожностью заботится о том, чтобы исключить все систематические ошибки до последней; астроном возражает ему: «но таким образом вы сможете наблюдать лишь небольшое число звезд; случайные ошибки не исчезнут».
Какой вывод следует из этого? Можно ли и впредь применять метод наименьших квадратов? Мы должны рассуждать так: мы исключили все систематические ошибки, какие только могли подозревать; мы хорошо знаем, что существуют еще и другие, но мы не можем их открыть; между тем надо сделать выбор и принять какую-то окончательную величину, которая должна быть рассматриваема как вероятная; очевидно, лучшее, что мы можем сделать для этого, – это применить метод Гаусса. Таким образом, мы применим только практическое правило, относящееся к субъективной вероятности. Больше сказать нечего.
Но некоторые хотят идти дальше и утверждают не только то, что вероятная величина равна тому-то, но еще то, что вероятная ошибка, вошедшая в результат, равна тому-то. Это совершенно незаконно. Это было бы верно лишь в том случае, если бы мы были уверены, что исключены все систематические ошибки; но мы об этом совершенно ничего не знаем. Пусть мы имеем два ряда наблюдений; прилагая правило наименьших квадратов, мы находим, что вероятная ошибка, относящаяся к первому ряду, вдвое меньше, чем во втором. Однако второй ряд может быть предпочтительнее, чем первый, так как первый может быть искажен большой систематической ошибкой. Все, что мы можем сказать, – это то, что первый ряд, вероятно, предпочтительнее второго, так как его случайная ошибка меньше и так как мы не имеем никакого основания утверждать, что систематическая ошибка для одного ряда больше, чем для другого: ведь мы об этом решительно ничего не знаем.
VII. Заключения. В настоящей главе я изложил немало проблем, не разрешив ни одной из них. Тем не менее я не сожалею о том, что написал о них, так как это, может быть, побудит читателя поразмыслить над этими тонкими вопросами.
Как бы то ни было, существует несколько пунктов, по-видимому, твердо установленных. Чтобы предпринять какое-либо вычисление вероятности – даже просто для того, чтобы это вычисление имело смысл, – надо взять в качестве исходной точки некоторую гипотезу или условное положение, которые всегда содержат известную долю произвола. При выборе этого условного положения мы не можем руководствоваться ничем, кроме принципа достаточного основания. К несчастью, этот принцип очень неопределенен и растяжим и, как мы видели в нашем беглом обзоре, принимает различные формы. Форма, под которой мы встречаем его чаще всего, – это вера в непрерывность: вера, которую трудно было бы оправдать убедительным рассуждением, но без которой никакая наука не была бы возможна. Наконец, исчисление вероятностей может быть с пользой применено в тех проблемах, в которых результат не зависит от принятой вначале гипотезы, лишь бы только эта гипотеза удовлетворяла условию непрерывности.
Правообладателям!
Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.Читателям!
Оплатили, но не знаете что делать дальше?