Системы и методы биржевой торговли (страница 8)
Распределение цен на другие физические товары, включая сельскохозяйственную продукцию, металлы и энергию, будет похоже на распределение цен для пшеницы. Они будут смещены влево (больше случаев более низких цен) и иметь длинный хвост из более высоких цен, растянутый вправо. Многие товары сезонные, что позволяет им каждый год «начинать с начала». Финансовые рынки совершенно другие по своей природе, и многие из них продолжают все время расти. Цены на валюту могут колебаться на 25 % и более, но могут двинуться в любую сторону, если экономика США или другой страны претерпевает структурные изменения.
При наблюдении за более короткими ценовыми периодами для отслеживания трендов или переходов можно использовать удлиненные модели. Подробнее об этом смотрите в главе 18, особенно в разделах «Важность формы распределения» и «Рыночный профиль Стидлмайера».
Медиана и мода
Для определения параметров распределения часто используются еще два измерения – медиана и мода. Медиана, или «середина», полезна для нахождения «центра» данных – если данные упорядочены, это то значение, которое находится в середине. Медиана зачастую является лучшим показателем, чем среднее, так как позволяет исключить влияние экстремумов, которые могут искажать среднее арифметическое. Недостатком ее является то, что для нахождения средней точки нужно упорядочить все данные, а также ее бесполезно использовать при небольшом количестве данных.
Мода – это наиболее часто встречающееся значение. На рис. 2.3 модой является самый высокий столбик плотности распределения в сегменте 400.
При нормальном распределении ценового ряда мода, среднее и медиана равны, однако чем больше нарушается симметрия данных, тем дальше расходятся эти параметры. Их взаимоотношение выглядит следующим образом:
Среднее → Медиана → Мода
Нормальное распределение обычно называют колоколообразной кривой, где значения располагаются поровну с обеих сторон от среднего. В большинстве случаев при работе с ценовыми данными и результатами торговли распределение смещается вправо (имеет положительную асимметрию с хвостом вправо) и сглаживается или обрезается слева (в направлении более низких цен или торговых убытков), как мы видим на рис. 2.3. Если бы вам потребовалось построить график распределения торговых прибылей и убытков для системы следования за трендом с фиксированным стоп-лоссом, вы получили бы прибыли, варьирующие от нуля до очень больших величин, а вот убытки были бы теоретически ограничены размером стоп-лосса. На самом деле, этот график выглядел бы очень похоже на диаграмму распределения цен на пшеницу. Асимметричные распределения будут важны, когда позднее в этой главе мы займемся измерением вероятности. В торговой среде «нормальных» распределений, которые статистики также иногда называют гауссовскими, не бывает.
Краткий обзор основных методов усреднения
Каждый метод усреднения обладает своим уникальным смыслом и полезностью. Ниже вкратце обобщаются их основные характеристики.
На среднее арифметическое одинаково влияет каждый элемент данных, но оно чувствительно к экстремумам больше, чем другие методы.
Среднее геометрическое наиболее важно при использовании данных, представляющих процентные величины, коэффициенты или темпы изменения. Его нельзя использовать с отрицательными числами.
Среднее гармоническое лучше всего применимо к временным изменениям и, наряду со средним геометрическим, используется в экономике для анализа цен. Оно рассчитывается труднее и потому менее популярно, чем любое другое среднее.
Мода – это самое распространенное значение, определяемое только плотностью распределения. Это точка наибольшей концентрации, она указывает типичное значение в разумно большой выборке.
Медиана представляет собой срединное значение. Она наиболее полезна, когда необходимо найти центр неполного множества. Она нечувствительна к экстремальным колебаниям, и ее просто найти, но для этого требуется упорядочение данных, что может замедлить вычисление.
Моменты распределения: среднее, дисперсия, асимметрия и эксцесс
Сомнение заставляет испытывать неудобство, но уверенность делает человека смешным.
Китайская пословица
Моменты распределения описывают форму распределения точек данных, т. е. их расположение вокруг среднего. Существует четыре таких момента: среднее, дисперсия, асимметрия и эксцесс.
1. Среднее – это центр, или среднее значение, вокруг которого расположены другие точки данных.
2. Дисперсия – это удаленность отдельных точек от среднего.
3. Асимметрия – это смещение распределения влево или вправо относительно среднего.
4. Эксцесс – островершинность распределения.
Поскольку о среднем мы уже говорили, начнем со второго момента. В последующих расчетах мы будем использовать букву с черточкой для обозначения среднего значения для ряда n цен; прописную букву P – для обозначения совокупности всех цен, а строчную p – для обозначения отдельных цен. Такая система обозначений позволяет легко увидеть общее между моментами распределения. Итак, среднее рассчитывается как:
Дисперсия (второй момент) и стандартное отклонение
Дисперсия (Var) очень похожа на среднее отклонение (mean deviation – MD), которое не возводит разности в квадрат и является лучшей оценкой дисперсии. Она рассчитывается как:
Обратите внимание на то, что дисперсия равна квадрату стандартного отклонения, var = s2 = σ2, это один из наиболее распространенных статистических показателей. В Excel дисперсия записывается как функция дисп, а в TradeStation как variance(series, n).
Стандартное отклонение (s), обозначаемое чаще всего буквой σ (сигма), является особой формой измерения среднего отклонения от среднего, в которой используется среднеквадратичное отклонение
где разности между отдельными ценами и средней ценой возводятся в квадрат, чтобы повысить значимость экстремумов, а затем результат приводится в норму путем извлечения квадратного корня. Этот популярный показатель, часто используемый в настоящей книге, определяется в Excel с помощью функции СТАНДОТКЛОН, а в TradeStation – функции StdDev(price, n), где n – количество цен.
Стандартное отклонение является самым популярным измерителем дисперсии данных наряду с волатильностью, или риском. В идеально нормальном множестве данных одно стандартное отклонение от среднего представляет совокупность приблизительно 68 % данных, два стандартных отклонения от среднего включают 95,5 % всех данных, а три стандартных отклонения охватывают 99,7 %, т. е. почти все данные. И хотя гарантировать включение всех данных невозможно, в случае нормального распределения можно исходить из того, что 3,5 стандартных отклонения включают 100 % данных. На рис. 2.4 показаны эти группировки стандартного отклонения.
Рис. 2.4. Нормальное распределение и процентная область, охватываемая одним стандартным отклонением от среднего арифметического
Термин z-оценка, или стандартизированная оценка, показывает количество стандартных отклонений от среднего значения для конкретной точки данных. Например, если точка данных имеет z-оценку 2,0, это означает, что она находится в двух стандартных отклонениях от среднего.
Асимметрия (третий момент)
В большинстве случаев, однако, ценовые данные имеют ненормальное распределение. У физических биржевых товаров, таких как золото, зерновые, энергоносители и даже процентные ставки (выраженные как доходность), цены находятся больше времени на низких уровнях и намного меньше времени на максимумах. Возьмем, например, цену на золото. Она достигала максимума в $800 за унцию в январе 1980 г. и затем в $1895 в сентябре 2011 г. (см. рис. 2.5). После пика 1980 г. цена упала и оставалась в диапазоне $250–400 за унцию в течение большей части следующих 20 лет. Если взять данные за этот период, то средняя цена для него составляет $325, а одно стандартное отклонение равно $140. При нормальном распределении два стандартных отклонения дали бы нам попадание 95 % данных между $45 и $605, что далеко от реальности. Если использовать данные за весь период 1978–2017 гг., то получим среднюю цену в $607 и стандартное отклонение в $408. В этом случае два стандартных отклонения дали бы нам диапазон от –$391 до $1423, что также не соответствует действительности.
Распределение плотности (рис. 2.6) показывает два узла, один с ценами на уровне $400, и еще одну область с ценами на уровне $1300. В обоих случаях справа есть длинный хвост, что говорит о наличии асимметрии (рис. 2.7). Асимметрия отражает величину отклонения от симметричного распределения, заставляющего кривую выглядеть короче слева (в направлении более низких цен) и длиннее справа (в направлении более высоких цен). Удлиненную сторону называют хвостом, и если более длинный хвост находится справа, то говорят о положительной асимметрии. В случае отрицательной асимметрии хвост находится слева.
Асимметрия рассчитывается по формуле:
Рис. 2.5. Наличные цены на золото
Рис. 2.6. Распределение плотности цен на золото
Рис. 2.7. Асимметрия. Почти все распределения цен имеют положительную асимметрию с более длинным хвостом справа, где цены выше
Асимметрия с точки зрения среднего, медианы и моды
При абсолютно нормальном распределении среднее, медиана и мода совпадают. Когда цены демонстрируют положительную асимметрию, что типично для периода более высоких цен, среднее перемещается вправо дальше всего, мода – меньше всего, а медиана оказывается где-то посередине между ними. Хорошее представление об асимметрии дает разность между средним и модой. Разность скорректирована с учетом дисперсии в виде стандартного отклонения распределения:
В умеренно асимметричном распределении расстояние между средним и модой оказывается в три раза больше разности между средним и медианой. Эту взаимосвязь можно также записать следующим образом:
Асимметрия в распределениях на различных относительных уровнях цен
Поскольку минимальные уровни цен большинства биржевых товаров определяются себестоимостью производства, распределения цен демонстрируют явное сопротивление падению ниже этих порогов. Это способствует возникновению положительной асимметрии на рынках соответствующих товаров. Для краткосрочных периодов, когда цены находятся на необычно высоких уровнях вследствие дисбаланса спроса и предложения, а не структурных изменений, характерны волатильность и неустойчивость. Отрицательная асимметрия, возникшая из-за них, может иметь тяжелый верх и создавать область, где дальнейшее повышение цен кажется невозможным. Между очень высокими и очень низкими уровнями цен мы можем найти плотность распределения, которая выглядит нормальной. На рис. 2.8 показано изменение в распределении цен в течение, скажем, 20 дней, когда цены резко идут вверх. Среднее показывает центры распределения по мере того, как оно изменяется, сдвигаясь от положительной к отрицательной асимметрии. Этот пример показывает, что нормальное распределение не подходит для всех случаев анализа цен и что логарифмическое, экспоненциальное или степенное распределение подходит лучше всего для долгосрочного анализа.
Рис. 2.8. Изменение распределения на различных уровнях цен. A, B и C – последовательно увеличивающиеся средние значения трех краткосрочных распределений. Они показывают, как распределение изменяется, сдвигаясь от положительной к отрицательной асимметрии