Системы и методы биржевой торговли (страница 7)
О средних значениях
Закон больших чисел
Начнем с начала, с закона больших чисел. Этот принцип часто понимается неправильно. На закон больших чисел чаще всего ошибочно ссылаются, когда ожидают, что ненормально продолжительная последовательность убытков компенсируется равным периодом прибыли. Этот же закон лежит в основе неверного предположения, что рынок, который в настоящее время переоценен или перекуплен, затем должен стать недооцененным или перепроданным. Закон больших чисел говорит совершенно не об этом. Он означает, что в большой выборке большинство событий рассеивается близко к среднему значению таким образом, что типичные значения существенно превосходят нетипичные, делая их незначимыми.
Этот принцип проиллюстрирован на рис. 2.1, где число средних величин чрезвычайно велико, поэтому добавление небольшой аномальной группировки с одной стороны средней группы почти нормальных данных не нарушает равновесия. Это все равно что влияние единственного пассажира на аэробус. Вес одного человека не имеет значения для самолета и ни на что не влияет, даже когда человек перемещается по салону. Длительная череда прибылей, убытков или необычно продолжительное движение цен в одном направлении – это просто редкое, аномальное событие, которое со временем сглаживается подавляюще большим количеством нормальных событий. Дальнейшее описание этой проблемы и ее влияния на торговлю приведено в главе 22 в разделе «Методы азартной игры – теория выбросов».
Рис. 2.1. Закон больших чисел. Нормальные события значительно превосходят аномальные. Для создания равновесия нет необходимости в чередовании экстремальных событий – максимум-минимум и т. д.
Как использовать средние значения
В работе с числами нередко бывает необходимо использовать репрезентативные значения. Иногда можно достичь гораздо лучшего понимания, если превратить набор отдельных цен в общую характеристику – среднее значение некоего диапазона цен. Например, средняя розничная цена одного фунта кофе на Северо-Востоке более значима при расчете стоимости жизни, чем цена в любом отдельно взятом магазине. Однако не все данные можно комбинировать или усреднять без потери смысла. Среднее всех цен, взятых за один день, ничего не скажет ни о каком отдельном рынке, который является частью среднего значения. Усредняя цены несвязанных вещей, например пачки кукурузных хлопьев, нормо-часа в авторемонтной мастерской и немецкого индекса DAX, мы получим число весьма сомнительной ценности. Среднее группы чисел должно иметь какой-то полезный смысл.
Среднее может запутать и по-другому. Рассмотрим цены на кофе, выросшие в течение года с $0,40 до $2,00 за фунт. Средняя цена этого продукта составляет $1,20, однако она не учитывает время, в течение которого кофе продавался по разным ценам. В табл. 2.1 рост цены на кофе разделен на четыре равных интервала. Как видно, время, проведенное на каждом из этих уровней, обратно пропорционально росту цен. Иными словами, цены находились на более низких уровнях в течение более длительных, а на более высоких – в течение более коротких периодов, что совершенно нормально для поведения цены.
Если учесть время, проведенное на каждом уровне цены, становится видно, что средняя цена должна быть ниже $1,20. Правильную среднюю цену можно рассчитать, при условии, что известно количество дней в каждом интервале, используя средневзвешенное значение цены
и соответствующий интервал
Этот результат может изменяться в зависимости от количества используемых временных интервалов, однако он дает лучшее представление о правильной средней цене. Существуют две другие средние величины, для которых время является важным элементом, – это среднее геометрическое и среднее гармоническое.
Таблица 2.1. Взвешивание среднего значения
Среднее геометрическое
Среднее геометрическое представляет функцию роста, в которой изменение цены от 50 до 100 столь же важно, как и изменение от 100 до 200. Его следует использовать с процентными величинами, а не с сырыми ценами. Если существует n цен, a1, a2, a3… an, то геометрическим средним является n корень из произведения n цен
G = (a1×a2×a3×…×an)1/n
или в Excel:
product(a1, a2, a3,…, an)^(1/n)
Чтобы решить это математически, нужно преобразовать приведенное выше уравнение в любую из двух форм:
или
Эти два решения эквивалентны. Член ln является натуральным логарифмом. (Обратите внимание, что в Excel для расчета натурального логарифма используется функция LOG). Используя уровни цен из табл. 2.1, записываем
Игнорируя временные интервалы, подставляем в первое уравнение:
Следовательно:
ln(G) = 4,6462,
G = 104,19.
Если среднее арифметическое, взвешенное по времени, составляет 105,71, то среднее геометрическое дает 104,19.
Среднее геометрическое имеет преимущества применительно к экономике и ценам. Классический пример – сравнение десятикратного повышения цены со 100 до 1000 с падением до одной десятой со 100 до 10. Среднее арифметическое двух величин (10 и 1000) равно 505, а среднее геометрическое дает
G = (10×1000)1/2 = 100
и показывает относительное распределение цен как функцию сопоставимого роста. Благодаря этому свойству геометрическое среднее лучше подходит для усреднения коэффициентов, которые могут представляться как в виде дроби, так и процента.
Среднее квадратичное
Среднее квадратичное чаще всего используется для оценки погрешности. Оно рассчитывается следующим образом:
Среднее квадратичное представляет собой квадратный корень из среднего арифметического квадратов величин. Лучше всего оно известно как основа для расчета стандартного отклонения. Мы поговорим об этом далее в этой главе в разделе «Моменты распределения».
Среднее гармоническое
Среднее гармоническое – еще одно взвешенное по времени среднее, но оно не тяготеет к более высоким или более низким величинам, как среднее геометрическое. В качестве простого примера рассмотрим среднюю скорость автомобиля, проезжающего 4 мили со скоростью 20 миль в час, а затем 4 мили со скоростью 30 миль в час. Среднее арифметическое дало бы 25 миль в час, без учета того, что 12 минут машина ехала со скоростью 20 миль в час, а 8 минут – 30 миль в час. Средневзвешенное значение составило бы
Среднее гармоническое рассчитывается как
что можно также выразить как
Для двух-трех значений можно использовать более простую форму:
Это позволяет видеть некоторую закономерность в решении. При скоростях 20 и 30 миль в час решение представляется как
что аналогично средневзвешенному значению. Возьмем еще раз первоначальное множество чисел и рассчитаем для него среднее гармоническое:
Мы могли бы применить среднее гармоническое к колебаниям цен, где первое колебание равно 20 пунктам за 12 дней, а второе колебание составляет 30 пунктов за 8 дней.
Отношение между средними значениями
Показатели центральной тенденции из предыдущего раздела используются для описания формы и экстремумов движения цены. Их также можно описать с помощью распределения плотности, о чем мы поговорим в следующем разделе. Общее отношение между тремя основными средними значениями, когда распределение не идеально симметрично, следующее:
Распределение цен
Измерение распределения дает общее представление о том, чего ожидать. Мы не можем знать, какой будет цена S&P через год, но если текущая цена равна 2400, то мы можем утверждать с высокой уверенностью, что она будет находиться между 2100 и 2700, и с меньшей уверенностью, что она ограничится коридором между 2300 и 2500; нет практически никакого шанса угадать диапазон точно. Нижеследующие методы измерения распределения позволят вам определять вероятность (т. е. доверительный уровень) наступления события.
Во всех статистических примерах, включенных в эту книгу, мы будем использовать в качестве выборочных данных ограниченное количество цен и – в некоторых случаях – отдельные торговые прибыли и убытки. Мы будем измерять характеристики выборки, находить форму распределения, оценивать, как результаты малой выборки соотносятся с большой и насколько две выборки подобны друг другу. Все эти измерения показывают, что малые выборки менее надежны, но их можно использовать, если вы понимаете величину ошибки или различие в форме распределения по сравнению с ожидаемым распределением большой выборки.
Плотность распределения
Плотность распределения (называемая также гистограммой) может давать хорошую картину характеристик данных. Теоретически мы ожидаем, что цены на биржевые товары будут больше времени находиться на низких уровнях, повышаясь лишь ненадолго. Эта модель показана на рис. 2.2 (цены на пшеницу с 1978 по 2017 г.). Чаще всего цена находится там, где спрос и предложение сбалансированы, это называется равновесием. Когда предложение недостаточно или возникает неожиданный спрос, цена на короткое время повышается, пока или спрос не удовлетворится, или предложение не увеличится до уровня спроса. Несмотря на краткосрочность, скачок цен может быть значительным и дать «толстый хвост» вытянутого вправо распределения, как показано на рис. 2.3. Обычно слева есть небольшой хвост, когда в течение периодов высокого предложения цены иногда опускаются ниже себестоимости.
Рис. 2.2. Цены на пшеницу, 1978–2017 гг.
Чтобы рассчитать распределение плотности, разделим диапазон цен на 20 сегментов.
● Возьмем самое высокое и самое низкое значение за рассматриваемый период и разделим разность на 19, чтобы получить размер одного сегмента.
● Затем, начиная с самой низкой цены, прибавляем размер сегмента, чтобы получить второе значение, прибавляем размер сегмента ко второму значению, чтобы получить третье значение, и т. д.
● В конце концов мы получаем 20 сегментов от самой низкой до самой высокой цены.
Excel избавляет нас от необходимости вести дальнейшие расчеты вручную. Для этого вам нужно подключить надстройку Данные / Пакет анализа, включая Гистограмму. Чтобы выполнить анализ, следуйте плану.
1. Импортируйте цены закрытия интересующего вас рынка.
2. Создайте набор сегментов (карманов) на основе диапазона данных. В нашем случае это цены на пшеницу от 200 до 1300 (выраженные в центах). Создайте столбец, который начинается с нуля и возрастает до 1300 с шагом в 50.
3. Теперь пройдите в раздел Данные / Пакет анализа и откройте окно Гистограмма.
4. Входной интервал – это цены закрытия.
5. Интервал карманов – это созданный нами столбец значений от 0 до 1300.
6. Для вывода результатов укажите Новый рабочий лист.
7. Нажмите на OK.
Программа заполнит все сегменты (карманы) и графически представит результаты, как показано на рис. 2.3.
Рис. 2.3. Распределение плотности цен на пшеницу, демонстрирующее хвост справа
Распределение плотности показывает, что цена чаще всего попадала в диапазон между $4,00 и $4,50 за бушель. Справа хвост растянут до $12 за бушель, что соответствует толстому хвосту. При нормальном распределении цены не превышали бы $6. Отсутствие ценовых данных ниже $2,00 объясняется тем, что фермеры отказываются продавать ниже порога себестоимости себе в убыток. Цены на пшеницу также можно рассматривать с учетом инфляции или изменения курса доллара США, о чем мы поговорим в конце этой главы.