Электронная библиотека » Ральф Винс » » онлайн чтение - страница 3


  • Текст добавлен: 10 июня 2022, 13:11


Автор книги: Ральф Винс


Жанр: Зарубежная образовательная литература, Наука и Образование


сообщить о неприемлемом содержимом

Текущая страница: 3 (всего у книги 28 страниц) [доступный отрывок для чтения: 9 страниц]

Шрифт:
- 100% +
Основные концепции

Вероятность задается числом от 0 и 1, которое определяет, насколько вероятен результат, где 0 – это полное отсутствие вероятности происхождения определенного события, а 1 означает, что рассматриваемое событие определенно произойдет. Процесс независимых испытаний (отбор с замещением) – это последовательность результатов, где значение вероятности постоянно от одного события к другому. Бросок монеты является примером такого процесса. Каждый бросок имеет вероятность 50/50 независимо от результата предыдущего броска. Даже если последние 5 раз выпадал орел, вероятность того, что при следующем броске выпадет орел, все равно не изменится и составит 0,5.

Другой тип случайного процесса характеризуется тем, что результат предыдущих событий влияет на значение вероятности, и, таким образом, значение вероятности непостоянно от одного события к другому. Эти виды событий называются процессами зависимых испытаний (отбор без замещения). Игра «21 очко» является примером такого процесса. После того как вытаскивают карту, состав колоды изменяется. Допустим, что новая колода перемешивается и одна карта удалена, скажем бубновый туз. До удаления этой карты вероятность вытянуть туза была 4/52, или 0,07692307692. Теперь, когда туза вытащили из колоды и не вернули обратно, вероятность вытянуть туза при следующем ходе составляет 3/51, или 0,05882352941.

Различие между независимыми и зависимыми испытаниями состоит в том, что вероятность или фиксирована (независимые попытки), или меняется (зависимые попытки) от одного события к другому в зависимости от предыдущих результатов. Фактически это и есть единственное различие.

Серийный тест

Когда в случае с колодой карт мы проводим отбор без замещения, можно путем проверки определить, существует ли зависимость. Для определенных событий (таких как поток прибыли и убытков по сделкам), где зависимость не может быть определена путем проверки, мы будем использовать серийный тест. Серийный тест подскажет нам, имеет ли наша система больше (или меньше) периодов последовательных выигрышей и проигрышей, чем случайное распределение.

Цель серийного теста – найти счет Z для периодов выигрышей и проигрышей в системной торговле. Счет Z означает, на сколько стандартных отклонений вы удалены от среднего значения распределения. Таким образом, счет Z = 2,00 означает, что вы на 2 стандартных отклонения удалились от среднего значения (ожидание случайного распределения периодов выигрышей и проигрышей).

Счет Z – это просто число стандартных отклонений, на которое данные отстоят от среднего значения нормального распределения вероятности. Например, счет Z = 1,00 означает, что данные, которые вы тестируете, отклонены на 1 стандартное отклонение от среднего значения.

Счет Z затем переводится в доверительную границу, которая иногда также называется степенью достоверности. Площадь под кривой нормального распределения вероятности шириной в 1 стандартное отклонение с каждой стороны от среднего значения равна 68 % всей площади под этой кривой. Преобразуем счет Z в доверительную границу. Связь счета Z и доверительной границы следующая: счет Z является числом стандартных отклонений от среднего значения, а доверительная граница – долей площади под кривой, заполненной при таком числе стандартных отклонений.


При минимальном количестве 30 закрытых сделок мы можем рассчитать счет Z. Попытаемся узнать, сколько периодов выигрышей (проигрышей) можно ожидать от данной системы? Соответствуют ли периоды выигрыша (проигрыша) тестируемой системы ожидаемым? Если нет, существует ли достаточно высокая доверительная граница, чтобы допустить, что между сделками существует зависимость, т. е. зависит ли результат текущей сделки от результата предыдущих сделок?

Ниже приведено уравнение серийного теста. Счет Z для торговой системы равен:


Z = (N * (R – 0,5) – X) / ((X * (X – N)) / (N – 1)) ^ (1/2), (1.1)


где N – общее число сделок в последовательности;

R – общее число серий выигрышных или проигрышных сделок;

X = 2 * W * L;

W – общее число выигрышных сделок в последовательности;

L – общее число проигрышных сделок в последовательности.

Этот расчет можно провести следующим образом.

1. Возьмите данные по вашим сделкам.

а) Общее число сделок, т. е. N.

б) Общее число выигрышных сделок и общее число проигрышных сделок.

Теперь рассчитайте Х:

Х = 2 * (Общее число выигрышей) * (Общее число проигрышей).

в) Общее число серий в последовательности, т. е. R.

2. Предположим, что произошли следующие сделки:


– 3, +2, +7, –4, +1, –1, +1, +6, –1, 0, –2, +1.


Чистая прибыль составляет +7. Общее число сделок 12, поэтому N = 12. Теперь нас интересует не то, насколько велики выигрыши и проигрыши, а то, сколько было выигрышей и проигрышей, а также серий. Поэтому мы можем перевести наш ряд сделок в простую последовательность плюсов и минусов. Отметьте, что сделка с нулевой прибылью считается проигрышем. Таким образом:


Как видим, последовательность состоит из 6 прибылей и 6 убытков, поэтому Х = 2 * 6 * 6 = 72. В последовательности есть 8 серий, поэтому R = 8. Мы называем серией каждое изменение символа, которое встречается при чтении последовательности слева направо (т. е. хронологически).

1. Последовательность будет выглядеть следующим образом:



2. Вычислите значение выражения:

N * (R – 0,5) – X.


Для нашего примера:

= 12 * (8–0,5) – 72 = 12 * 7,5 – 72 = 90–72 = 18.

3. Вычислите значение выражения:

(X * (X – N)) / (N – 1).


Для нашего примера:

= (72 * (72–12)) / (12 – 1) = (72 * 60) / 11 = 4320 / 11 = 392,727272.


4. Возьмите квадратный корень числа, полученного в п. 3. В нашем примере:


392,727272 ^ (1/2) = 19,81734777.


5. Разделите ответ из п. 2 на ответ из п. 4. Это и есть счет Z. В нашем примере:


18 / 19,81734777 = 0,9082951063.


6. Теперь преобразуйте счет Z в доверительную границу. Распределение периодов является биномиальным. Однако, когда рассматриваются 30 или больше сделок, мы можем использовать нормальное распределение как близкое к биномиальному. Таким образом, если вы используете 30 или более сделок, вы просто можете преобразовать ваш счет Z в доверительную границу, основываясь на уравнении (3.22) для нормального распределения.


Серийный тест подскажет вам, содержит ли ваша последовательность выигрышей и проигрышей больше или меньше полос (серий выигрышей или проигрышей), чем можно было бы ожидать от действительно случайной последовательности, в которой нет зависимости между испытаниями. Так как в нашем случае мы находимся на уровне относительно низкой доверительной границы, то можно допустить, что между сделками в этой последовательности нет зависимости.

Если счет Z имеет отрицательное значение, то при расчете доверительной границы просто возьмите его абсолютное значение. Отрицательный счет Z говорит о положительной зависимости, т. е. полос меньше, чем при нормальном распределении вероятности, и, следовательно, выигрыши порождают выигрыши, а проигрыши порождают проигрыши. Положительный счет Z говорит об отрицательной зависимости, т. е. полос больше, чем при нормальном распределении вероятности, и, следовательно, выигрыши порождают проигрыши, а проигрыши порождают выигрыши.

Какой уровень доверительной границы считать приемлемым? Статистики, как правило, рекомендуют доверительную границу не менее 90 %. Некоторые рекомендуют доверительную границу свыше 99 %, чтобы быть уверенным, что зависимость существует, другие рекомендуют менее строгий минимум 95,45 % (2 стандартных отклонения).

Очень редко система демонстрирует доверительную границу выше 95,45 %, чаще всего она менее 90 %. Даже если вы найдете систему с доверительной границей от 90 до 95,45, это не будет золотым самородком. Чтобы убедиться в зависимости, на которой можно хорошо заработать, вам нужно как минимум 95,45 %.

Пока зависимость находится на приемлемой доверительной границе, вы можете изменить систему, чтобы улучшить торговые решения, даже если не понимаете основной причины зависимости. Если вы узнаете причину, то сможете оценить, когда зависимость действовала, а когда нет и когда можно ожидать изменения степени зависимости.

До настоящего момента мы смотрели на зависимость только с точки зрения того, была ли последняя сделка выигрышем или проигрышем. Теперь мы попытаемся определить, есть ли в последовательности выигрышей и проигрышей зависимость или нет. Серийный тест на наличие зависимости автоматически принимает в расчет процент выигрышей и проигрышей. Однако серийный тест по периодам выигрышей и проигрышей учитывает последовательность выигрышей и проигрышей, но не их размер. Для того чтобы получить истинную независимость, не только сама последовательность выигрышей и проигрышей должна быть независимой, но и размеры выигрышей и проигрышей в последовательности также должны быть независимыми. Выигрыши и проигрыши могут быть независимыми, однако их размеры могут зависеть от результатов предыдущей сделки (или наоборот). Возможным решением является проведение серийного теста только с выигрышными сделками. При этом полосы выигрышей следует разделить на длинные (по сравнению со средним значением распределения вероятности) и менее длинные, и только затем искать зависимость между размером выигрышных сделок. Потом необходимо провести ту же процедуру с проигрышными сделками.

Корреляция

Есть другой и, может быть, лучший способ определения зависимости между размерами выигрышей и проигрышей. Этот метод позволяет рассмотреть размеры выигрышей и проигрышей с совершенно другой стороны, и, когда он используется вместе с серийным тестом, взаимосвязь сделок измеряется с большей глубиной. Для количественной оценки зависимости или независимости данный метод использует коэффициент линейной корреляции r, который иногда называют пирсоновским r.

Посмотрите на рис. 1.2. На нем изображены две абсолютно коррелированные последовательности. Мы называем это положительной корреляцией.



Рис. 1.2. Положительная корреляция (r = +1,00)



Рис. 1.3. Отрицательная корреляция (r = –1,00)


Теперь посмотрите на рис. 1.3. Он показывает две последовательности, которые находятся точно в противофазе. Когда одна линия идет вверх, другая следует вниз (и наоборот). Мы называем это отрицательной корреляцией.

Формула для коэффициента линейной корреляции r двух последовательностей Х и Y такова (черта над переменной обозначает среднее арифметическое значение):



Расчет следует производить следующим образом.

1. Вычислите среднее Х и Y (т. е.  и ).


2. Для каждого периода найдите разность между Х и , а также Y и .


3. Теперь рассчитайте числитель. С этой целью для каждого периода перемножьте ответы из шага 2, другими словами, для каждого периода умножьте разность между Х и  на разность между Y и .


4. Сложите результаты, полученные в шаге 3, за все периоды. Это и есть числитель.


5. Теперь найдите знаменатель. Для этого возьмите результаты шага 2 для каждого периода как для разностей Х, так и для разностей Y и возведите их в квадрат (теперь они будут положительными значениями).


6. Сложите возведенные в квадрат разности Х за все периоды. Проделайте ту же операцию с возведенными в квадрат разностями Y.


7. Извлеките квадратный корень из суммы возведенных в квадрат разностей Х, которые найдены в шаге 6. Теперь проделайте то же с Y, взяв квадратный корень суммы возведенных в квадрат разностей Y.


8. Умножьте два результата, которые вы нашли в шаге 7, т. е. умножьте квадратный корень суммы возведенных в квадрат разностей Х на квадратный корень суммы возведенных в квадрат разностей Y. Это и есть знаменатель.


9. Разделите числитель, который вы нашли в шаге 4, на знаменатель, который вы нашли в шаге 8. Это и будет коэффициент линейной корреляции r.


Значение r всегда будет между +1,00 и –1,00. Значение 0 указывает, что корреляции нет.

Теперь посмотрите на рис. 1.4. Он представляет следующую последовательность из 21 сделки:


1, 2, 1, –1, 3, 2, –1, –2, –3, 1, –2, 3, 1, 1, 2, 3, 3, –1, 2, –1, 3.


Чтобы понять, есть ли какая-либо зависимость между предыдущей и текущей сделкой, мы можем использовать коэффициент линейной корреляции. Для значений Х в формуле для r возьмем P&L по каждой сделке. Для значений Y в формуле для r возьмем ту же самую последовательность P&L, только смещенную на одну сделку. Другими словами, значение Y – это предыдущее значение Х (рис. 1.5).



Рис. 1.4. Отдельные результаты 21 сделки



Рис. 1.5. Отдельные результаты 21 сделки, сдвинутые на 1 сделку


Средние значения различаются, потому что вы усредняете только те X и Y, которые частично перекрывают друг друга, поэтому последнее значение Y (3) не вносит вклад в , а первое значение Х (1) не вносит вклад в .

Числитель является суммой всех значений из столбца Е (0,8). Чтобы найти знаменатель, мы извлечем квадратный корень из итогового значения столбца F и получим 8,555699, потом извлечем квадратный корень из итогового значения столбца G и получим 8,258329, затем перемножим их, что даст в результате 70,65578. Теперь разделим числитель 0,8 на знаменатель 70,65578 и получим 0,011322. Это наш коэффициент линейной корреляции r. В данном случае коэффициент линейной корреляции 0,011322 едва ли о чем-то говорит, но для многих торговых систем он может достигать бóльших значений. Высокая положительная корреляция (по крайней мере 0,25) говорит о том, что большие выигрыши редко сменяются большими проигрышами, и наоборот. Отрицательные значения коэффициента корреляции (между –0,25 и –0,30) подразумевают, что после больших проигрышей следуют большие выигрыши, и наоборот. Для заданного количества сделок с помощью метода, известного как преобразование Z Фишера, коэффициент корреляции можно преобразовать в доверительный уровень. Эта тема рассматривается в приложении C. Отрицательную корреляцию так же, как и положительную, можно использовать в своих интересах. Например, если обнаружена отрицательная корреляция и система показала большой проигрыш, то в следующей сделке можно ожидать большого выигрыша и, таким образом, открыть больше контрактов, чем обычно. Если и эта сделка принесет убыток, то он не должен быть очень большим (из-за отрицательной корреляции).

Наконец, при определении зависимости вы должны провести тесты по разным сегментам данных. Для этого разбейте ваши данные на две или более частей. Если вы увидите зависимость в первой части, тогда посмотрите, существует ли эта зависимость во второй части и т. д. Это поможет исключить случаи, где появляется кажущаяся зависимость, но фактически ее нет.

Использование этих двух инструментов (серийный тест и коэффициент линейной корреляции) поможет ответить на многие вопросы, однако только в том случае, если у вас есть достаточно высокая доверительная граница и/или достаточно высокий коэффициент корреляции. Большую часть времени эти инструменты вряд ли будут вам полезны, так как слишком часто во фьючерсных торговых системах зависимость отсутствует. Если вы получите данные, указывающие на зависимость, то следует обязательно воспользоваться этим обстоятельством в торговле, вернуться и включить новое правило в торговую логику, чтобы использовать зависимость. Другими словами, вы должны вернуться и изменить логику торговой системы, чтобы она учитывала эту зависимость (минуя определенные сделки или разбивая систему на две различных системы: например, одна – для сделок после выигрышей, а другая – для сделок после проигрышей). Таким образом, можно утверждать, что, если в сделках появляется зависимость, вы не максимизировали систему. Зависимость, если она найдена, надо использовать (для этого измените правила системы), пока она не исчезнет. Первой ступенью в управлении деньгами является использование и, следовательно, удаление любой зависимости в сделках. Чтобы узнать о зависимости больше, прочитайте приложение C «Подробнее о зависимости: разворотные точки и тест длины фазы».

Мы рассмотрели зависимость в отношении торговых прибылей и убытков. Можно также поискать зависимость между индикатором и последующей сделкой или между любыми двумя переменными. Чтобы узнать больше об этих концепциях, посмотрите приложение B, а именно раздел «Биномиальное распределение», посвященный статистической оценке торговой системы.

Обычные ошибки в отношении зависимости

Будучи трейдерами, мы должны исходить из того, что в большинстве рыночных систем зависимости не существует, т. е. при торговле в данной рыночной системе мы находимся в среде, где результат следующей сделки не предсказуем на основе результата (результатов) предыдущих сделок. Это не значит, что в рыночных системах никогда не бывает зависимости между сделками. Речь идет о том, что нам следует действовать так, будто зависимости не существует, пока не будет убедительных доказательств обратного. Это произойдет в случае, если счет Z и коэффициент линейной корреляции указывают на зависимость на рынке даже с оптимизированными параметрами системы. Если мы посчитаем, что зависимость есть, когда нет убедительных доказательств, то обманем сами себя и не получим хороших торговых результатов. Даже если система показала зависимость при доверительной границе 95 % для всех значений параметра, это недостаточно высокая доверительная граница, чтобы с уверенностью говорить, что на определенном рынке или в определенной системе зависимость между сделками существует.

Первая ошибка заключается в том, что мы можем отвергнуть гипотезу, которую следует принять. Если, однако, мы принимаем гипотезу, когда ее следует отвергнуть, то совершаем другую ошибку. Не зная заранее, верна или нет гипотеза, мы должны решить, какую цену мы готовы заплатить за первую ошибку, а какую – за вторую. Иногда одна ошибка серьезнее, чем другая, и в таких случаях мы должны решить, принимать или отвергать неподтвержденную гипотезу, выбирая меньшее из двух зол.

Допустим, вы хотите использовать определенную торговую систему, но не уверены, будет ли она работать при торговле в режиме реального времени. Здесь гипотеза состоит в том, что торговая система будет хорошо работать в режиме реального времени. Вы решаете принять гипотезу и торговать с помощью этой системы. Если гипотеза не подтвердится, то вы совершите вторую ошибку и заплатите за нее проигрышами. С другой стороны, если вы решите не торговать по системе, которая на самом деле окажется прибыльной, то совершите первую из рассмотренных нами ошибок. В этом случае цена, которую вы заплатите, – это упущенные прибыли. Что лучше? Ясно, что упущенная прибыль. Хотя из этого примера можно сделать вывод, что если вы собираетесь торговать по системе в режиме реального времени, то ей, конечно, надо быть прибыльной на прошлых данных, но существует и другой мотив для использования этого примера. Если мы допустим, что зависимость есть, когда фактически ее нет, то совершим вторую ошибку. Цена, которую мы заплатим, – реальный убыток. Однако если мы допустим, что зависимости нет, а она на самом деле есть, то совершим первую ошибку и упустим прибыль. Согласитесь, что лучше упустить прибыль, чем понести реальные убытки. Поэтому, пока не будет убедительного доказательства зависимости, вам лучше исходить из того, что прибыли и убытки в торговле (неважно, по механической системе или нет) не зависят от предыдущих результатов. Здесь, как может показаться, существует некий парадокс. Во-первых, если существует зависимость в сделках, то система подоптимальна[1]1
  Система подоптимальна, если ее можно оптимизировать. – Прим. ред.


[Закрыть]
. Однако о зависимости никогда нельзя говорить с полной уверенностью. Если мы будем действовать, будто зависимость есть (когда фактически ее нет), мы совершим более дорогостоящую ошибку, чем если бы действовали, будто зависимости нет (когда фактически она есть). Допустим, что в системе с историей из 60 сделок на основе серийного теста обнаружена зависимость с доверительным уровнем 95 %. Мы хотим, чтобы наша система была оптимальной, поэтому соответствующим образом изменяем ее правила, чтобы использовать замеченную зависимость. Предположим, после этого у нас остается 40 сделок и зависимости больше нет, в результате мы приходим к выводу, что правила системы оптимальны. Теперь при 40 сделках мы получаем более высокое оптимальное f, чем при 60 (более подробно об оптимальном f далее в этой главе). Если вы будете торговать по этой системе с новыми правилами, использующими зависимость, применяя более высокое сопутствующее оптимальное f, а зависимости на самом деле нет, то результат будет ближе к 60 сделкам, чем к 40 сделкам, в которых были показаны лучшие результаты. Таким образом, f, которое вы выбрали, будет сдвинуто вправо, что выразится в потерях, которые вы понесете из-за того, что предположили зависимость. Если зависимость присутствует, тогда вы будете ближе к пику кривой f, допускающей, что зависимость существует. Если бы вы решили, что зависимости нет, когда фактически она есть, то вы были бы слева от пика кривой f и ваша система была бы подоптимальной (но вы потеряете меньше, чем если бы были справа от пика).

Короче говоря, ищите зависимость. Если она обнаружится с достаточно высокой вероятностью, тогда измените правила системы, чтобы использовать эту зависимость. В противном случае, при отсутствии убедительного статистического доказательства зависимости, считайте, что ее не существует (и вы понесете меньшие потери, если фактически зависимость все же существует).


Страницы книги >> Предыдущая | 1 2 3 4 5 6 7 8 9 | Следующая
  • 0 Оценок: 0

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?


Популярные книги за неделю


Рекомендации