Exemplos de estratégias de par de par


Exemplo de comércio de pares.


Assim como os comerciantes de ações apenas de longa data digitalizam os mercados para títulos adequados, um comerciante de pares deve começar com uma lista de pares potencialmente relacionados. Isso implica a realização de pesquisas para encontrar valores mobiliários que tenham algo em comum e ndash; se o relacionamento é devido ao setor (como o setor automotivo) ou ao ativo (por exemplo, títulos). Embora qualquer par aleatório possa ser teoricamente correlacionado, é mais provável que encontremos correlação em valores mobiliários que tenham algo em comum para começar.


O próximo passo atua como um filtro, ou um meio pelo qual podemos reduzir o número de pares potenciais em nossa aljava. Uma maneira é usar um coeficiente de correlação para determinar quão estreitamente dois instrumentos estão relacionados. A Figura 4 mostra um gráfico diário do contrato e-mini S & amp; P 500 (em vermelho) e do contrato D-e-mini (em verde). Abaixo do gráfico de preços é um indicador que mostra o coeficiente de correlação (em amarelo). Podemos ver a partir do gráfico que, durante o período de tempo avaliado, o ES e o YM estão altamente correlacionados, com valores que variam em torno de 0,9. Nós manteremos o par ES / YM na nossa lista de potenciais pares de candidatos.


Figura 4 O contrato e-mini S & amp; P 500 (em vermelho) e o e-mini Dow (em verde) mostram potencial como comércio de pares. A confirmação visual do preço, respaldada por resultados quantitativos do coeficiente de correlação (em amarelo), mostra que os dois instrumentos estão altamente correlacionados. Imagem criada com a TradeStation.


Figura 5 Este gráfico diário de WMT (em vermelho) e TGT (em verde) mostra que este não é um par ideal (pelo menos não durante o período de tempo testado). Uma revisão visual dos preços, confirmada pelos resultados do coeficiente de correlação (em amarelo) indica uma falta de correlação entre os dois estoques. Imagem criada com a TradeStation.


Um componente contínuo do processo é pesquisar e testar idéias comerciais e determinar métodos absolutos de avaliação de pares e definir divergências. Os comerciantes terão que responder perguntas como O que constitui & ldquo; suficiente & rdquo; divergência da tendência para iniciar um comércio? e como isso será avaliado (por exemplo, usando dados de um indicador de taxa de preço com sobreposições de desvio padrão). Em geral, os comerciantes devem se concentrar em dados quantificáveis: i. e., & ldquo; Eu entrarei em um comércio de pares quando o preço exceder dois desvios padrão. & Rdquo; A Figura 6 mostra dois ETFs & ndash; SPY (em vermelho) e DIA (em verde) & ndash; em um gráfico diário. Abaixo do gráfico de preços é um indicador de taxa de propagação (em azul), com uma +/- uma e duas sobreposições de desvio padrão (linhas pontilhadas). A média aparece em rosa.


Figura 6 Um gráfico diário dos ETFs SPY (em vermelho) e DIA (em verde). Um indicador de taxa de spread aparece abaixo do gráfico de preços, juntamente com uma sobreposição de desvio padrão. Imagem criada com a TradeStation.


Muitos comerciantes usam uma abordagem neutra em dólares para dimensionar a posição ao negociar pares. Usando este método, os lados longo e curto do comércio são inseridos com valores em dólares iguais. Por exemplo, um comerciante quer entrar em um comércio de pares com ações A, negociando em US $ 100 por ação e ações B, negociando em US $ 50 por ação. Para alcançar uma posição neutra em dólares, o comerciante terá que comprar duas ações do estoque B por cada ação da ação A. Por exemplo:


Longo 100 ações do estoque A = $ 10.000; e curto 200 ações do estoque B = $ 10.000.


Compre o underperformer e venda o overperformer.


Uma vez que as regras de negociação são atendidas, o comerciante comprará a segurança de desempenho inferior e simultaneamente venderá a segurança de desempenho excessivo. Na Figura 7, a taxa de propagação excedeu dois desvios padrão e ocorreu uma configuração comercial em nosso par ES / YM. Aqui, uma posição longa é inserida com dois contratos ES, e uma posição curta simultânea de dois contratos é tomada no YM.


Figura 7 Uma negociação é aberta no par ES / YM. A interface de entrada da ordem aparece no lado esquerdo da tela (caixa de entrada de uma ordem para o ES; uma para o YM). As linhas horizontais vermelhas e verdes na parte superior mostram o P / L em tempo real para cada posição. Imagem criada com a TradeStation.


Tal como acontece com a maioria dos investimentos, o momento da saída é fundamental para o sucesso do comércio. É importante aplicar princípios de gerenciamento de dinheiro para negociações de pares, incluindo o uso de ordens protetor de stop-loss e metas de lucro. Os níveis ideais são tipicamente determinados através de uma extensa modelagem histórica. A Figura 8 mostra o comércio ES / YM, saiu usando um nível de lucro líquido conservador.


Figura 8 O comércio ES / YM é encerrado com um pequeno lucro líquido. Imagem criada com a TradeStation.


Pairs Trading usando Técnicas Drivadas por Dados: Estratégias de Negociação Simples Parte 3.


Pairs trading é um bom exemplo de uma estratégia baseada em análises matemáticas. Vamos demonstrar como alavancar dados para criar e automatizar uma estratégia de negociação de pares.


Princípio subjacente.


Digamos que você tenha um par de títulos X e Y que tenham algum link econômico subjacente, por exemplo, duas empresas que fabricam o mesmo produto como Pepsi e Coca Cola. Você espera que a proporção ou a diferença nos preços (também chamada de spread) desses dois permaneçam constantes com o tempo. No entanto, de tempos em tempos, pode haver uma divergência no spread entre esses dois pares causada por mudanças provisórias de oferta / demanda, grandes pedidos de compra / venda para uma segurança, reação para notícias importantes sobre uma das empresas, etc. Neste cenário , um estoque se move enquanto o outro se move em relação um ao outro. Se você espera que esta divergência volte ao normal com o tempo, você pode fazer um comércio de pares.


Quando há uma divergência temporária, o comércio de pares seria vender o estoque de superação (o estoque que subiu) e comprar o estoque de baixo desempenho (o estoque que se deslocou para baixo). Você está fazendo uma aposta de que o spread entre as duas ações acabaria por convergir, quer o estoque superativo que se movesse de volta para baixo ou o estoque com desempenho inferior que se movia de volta ou ambos - seu comércio ganhará dinheiro em todos esses cenários. Se ambos os estoques se movem para cima ou se deslocam juntos sem alterar o spread entre eles, você não faz nem perde dinheiro.


Assim, a negociação de pares é uma estratégia de negociação neutra do mercado, permitindo que os comerciantes lucrem com praticamente qualquer condição de mercado: tendência de alta, tendência de baixa ou movimento lateral.


Explicando o conceito: começamos por gerar dois títulos falsos.


Vamos gerar um X e um modelo de segurança falsos, é um retorno diário, tirando de uma distribuição normal. Em seguida, realizamos uma soma cumulativa para obter o valor de X em cada dia.


Agora, nós geramos Y, que tem um link econômico profundo para X, então o preço de Y deve variar de forma similar ao X. Nós modelamos isto tomando X, deslocando-o e adicionando algum ruído aleatório extraído de uma distribuição normal.


Cointegração.


Cointegração, muito semelhante à correlação, significa que a relação entre duas séries variará em torno de uma média. As duas séries, Y e X seguem o seguimento:


onde ⍺ é a relação constante e e é ruído branco. Leia mais aqui.


Para troca de pares para trabalhar entre duas vezes, o valor esperado da relação ao longo do tempo deve convergir para a média, ou seja, eles devem ser cointegrados.


A série temporal que construímos acima é cointegrada. Vamos traçar a relação entre os dois agora, para que possamos ver como isso parece.


Testes de Cointegração.


Existe um teste conveniente que vive em statsmodels. tsa. stattools. Devemos ver um valor p muito baixo, como criamos artificialmente duas séries que são tão cointegradas quanto fisicamente possível.


Nota: Correlação vs. Cointegração.


A correlação e cointegração, embora teoricamente similares, não são as mesmas. Vejamos exemplos de séries que estão correlacionadas, mas não cointegradas, e vice-versa. Primeiro, vamos verificar a correlação das séries que acabamos de gerar.


Isso é muito alto, como seria de esperar. Mas como duas séries estarão correlacionadas, mas não cointegradas? Um exemplo simples é duas séries que apenas divergem.


Teste de Cointegration p-value: 0.258.


Um simples exemplo de cointegração sem correlação é uma série normalmente distribuída e uma onda quadrada.


Teste de Cointegration p-value: 0.0.


A correlação é incrivelmente baixa, mas o valor p mostra uma cointegração perfeita!


Como fazer um comércio de pares?


Como duas séries temporais cointegradas (como X e Y acima) derivam para e separadas umas das outras, haverá momentos em que a propagação é alta e as vezes em que a propagação é baixa. Nós fazemos um comércio de pares comprando uma segurança e vendendo outra. Desta forma, se ambos os títulos forem juntos ou subissem juntos, nós não fazemos nem perdemos dinheiro - nós somos neutros no mercado.


Voltando a X e Y acima, seguem Y = ⍺ X + e, de modo que a relação (Y / X) se mova em torno de seu valor médio ⍺, ganhamos dinheiro com a razão dos dois que retornam à média. Para fazer isso, observaremos quando X e Y estiverem distantes, ou seja, é muito alto ou muito baixo:


Going Long the Ratio Isto é quando o índice ⍺ é menor do que o habitual e esperamos que ele aumente. No exemplo acima, colocamos uma aposta nessa comprando Y e vendendo X. Iniciando a Ratio Isto é quando o índice ⍺ é grande e esperamos que ele se torne menor. No exemplo acima, colocamos uma aposta nessa vendendo Y e comprando X.


Observe que sempre temos uma "posição coberta": uma posição curta ganha dinheiro se a segurança vendida perder valor, e uma posição longa ganhará dinheiro se um valor de ganhos de segurança, de modo que somos imunes ao movimento geral do mercado. Nós apenas fazemos ou perdemos dinheiro se os valores mobiliários X e Y se movimentarem uns com os outros.


Usando Dados para encontrar títulos que se comportem assim.


A melhor maneira de fazer isso é começar com títulos que você suspeita que possam ser cointegrados e realizar um teste estatístico. Se você apenas executa testes estatísticos em todos os pares, você será preso ao viés de comparação múltiplo.


O compartimento de comparações múltiplas é simplesmente o fato de que há uma maior chance de gerar incorretamente um valor p significativo quando muitos testes são executados, porque estamos executando muitos testes. Se 100 testes forem executados em dados aleatórios, devemos esperar ver 5 p-valores abaixo de 0,05. Se você estiver comparando n valores para co-integração, você realizará comparações n (n-1) / 2 e você deverá esperar muitos valores p significativos, o que aumentará conforme você aumenta. Para evitar isso, escolha um pequeno número de pares que você tenha motivos para suspeitar que pode ser cointegrado e testar individualmente. Isso resultará em menos exposição ao viés de comparações múltiplas.


Então, vamos tentar encontrar alguns títulos que exibem cointegração. Vamos trabalhar com uma cesta de estoques de tecnologia de grande capitalização dos EUA - S & amp; P 500. Esses estoques operam em um segmento similar e poderiam co-integrar os preços. Escaneamos uma lista de títulos e testamos a cointegração entre todos os pares. Retorna uma matriz de pontuação de teste de cointegração, uma matriz de valor de p e quaisquer pares para os quais o valor de p foi inferior a 0,05. Este método é propenso a múltiplos compartimentos de comparação e, na prática, os títulos devem estar sujeitos a uma segunda etapa de verificação. Ignore isso por causa deste exemplo.


Nota: Nós incluímos o mercado de referência (SPX) em nossos dados - o mercado impulsiona o movimento de tantos títulos que muitas vezes você pode encontrar dois títulos aparentemente cointegrados; mas na realidade eles não estão cointegrados um com o outro, mas ambos conintegrados com o mercado. Isso é conhecido como uma variável de confusão e é importante verificar o envolvimento do mercado em qualquer relacionamento que você encontrar.


Agora vamos tentar encontrar pares cointegrados usando nosso método.


Parece que 'ADBE' e 'MSFT' são cointegrados. Vamos dar uma olhada nos preços para garantir que isso realmente faça sentido.


A proporção parece que ele se moveu em torno de uma média estável. A razão absoluta não é muito útil em termos estatísticos. É mais útil normalizar o nosso sinal, tratando-o como um escore z. O escore Z é definido como:


Z Pontuação (Valor) = (Valor - Média) / Desvio Padrão.


Na prática, isso geralmente é feito para tentar dar alguma escala aos dados, mas isso assume uma distribuição subjacente. Normalmente normal. No entanto, muitos dados financeiros normalmente não são distribuídos, e devemos ter muito cuidado para não simplesmente assumir a normalidade, ou qualquer distribuição específica ao gerar estatísticas. A verdadeira distribuição de índices pode ser muito gordo e propensos a valores extremos, desordenando nosso modelo e resultando em grandes perdas.


É mais fácil observar agora que a relação agora se move em torno da média, mas às vezes é propensa a grandes divergências da média, das quais podemos tirar vantagens.


No entanto, quando falamos sobre os fundamentos da estratégia de negociação de par e identificamos títulos co-integrados com base no preço histórico, vamos tentar desenvolver um sinal de negociação. Primeiro, recapitulemos os passos no desenvolvimento de um sinal comercial usando técnicas de dados:


Recolher dados confiáveis ​​e limpar dados Criar recursos a partir de dados para identificar um sinal de negociação / lógica Os recursos podem ser médias móveis ou proporções de dados de preço, correlações ou sinais mais complexos - combine estes para criar novos recursos. Gerar um sinal de negociação usando esses recursos, ou seja, os instrumentos são uma compra, uma venda ou neutro.


Etapa 1: configure seu problema.


Aqui estamos tentando criar um sinal que nos diz se a relação é uma compra ou uma venda no próximo instante no tempo, ou seja, nossa variável de previsão Y:


Y = Ratio é comprar (1) ou vender (-1) Y (t) = Sign (Ratio (t + 1) - Ratio (t))


Observe que não precisamos prever os preços reais das ações, ou mesmo o valor real da relação (embora possamos), apenas a direção do próximo movimento na proporção.


Passo 2: colete dados confiáveis ​​e precisos.


A Auquan Toolbox é sua amiga aqui! Você só precisa especificar o estoque que deseja negociar e a fonte de dados para usar, e puxa os dados necessários e o limpa por dividendos e divisões de estoque. Então, nossos dados aqui já estão limpos.


Estamos usando os seguintes dados do Yahoo em intervalos diários para dias de negociação nos últimos 10 anos (


2500 pontos de dados): Abrir, fechar, alto, baixo e volume de negociação.


Passo 3: dados divididos.


Não esqueça deste passo super importante para testar a precisão de seus modelos. Estamos usando o seguinte Treinamento / Validação / Teste de divisão.


Idealmente, também devemos fazer um conjunto de validação, mas iremos ignorar isso por enquanto.


Etapa 4: engenharia de recursos.


O que poderiam ser características relevantes? Queremos prever a direção do movimento de proporção. Nós vimos que nossos dois títulos são cointegrados, de modo que o índice tende a se deslocar e reverter para o meio. Parece que nossas características devem ser certas medidas para a média da relação, a divergência do valor atual da média para poder gerar o nosso sinal de negociação.


Vamos usar os seguintes recursos:


60 dias Média em Movimento da Proporção: Medida do rolamento significa 5 dias Média de Mover da Relação: Medida do valor atual do desvio padrão médio de 60 dias Pontuação z (5d MA - 60d MA) / SD 60d.


O Z Score do rolling significa realmente revela a natureza reversa média da proporção!


Passo 5: Seleção do modelo.


Vamos começar com um modelo realmente simples. Olhando para o gráfico de pontuação z, podemos ver que sempre que o recurso de pontuação z fica muito alto, ou muito baixo, ele tende a reverter. Vamos usar + 1 / -1 como nossos limiares por muito alto e muito baixo, então podemos usar o seguinte modelo para gerar um sinal comercial:


Ratio é comprar (1) sempre que o z-score é inferior a -1,0, porque esperamos que o score z volte para 0, portanto, o índice para aumentar Ratio é vendido (-1) quando o z-score está acima de 1,0 porque esperamos z pontuação para voltar para 0, portanto, proporção para diminuir.


Passo 6: treinar, validar e otimizar.


Finalmente, vamos ver como nosso modelo realmente faz em dados reais? Vamos ver como é esse sinal nas relações reais.


O sinal parece razoável, parece que vendemos a proporção (pontos vermelhos) quando ele é alto ou aumentado e recomprá-lo quando baixo (pontos verdes) e diminuindo. O que isso significa para ações reais que estamos negociando? Vamos dar uma olhada.


Observe como às vezes ganhamos dinheiro na perna curta e às vezes na perna longa, e às vezes ambas.


Estamos satisfeitos com o nosso sinal nos dados de treinamento. Vamos ver que tipo de lucros esse sinal pode gerar. Nós podemos fazer um backtester simples que compra 1 ratio (comprar 1 estoque ADBE e taxa de venda x estoque MSFT) quando a proporção é baixa, vender 1 proporção (vender 1 estoque ADBE e comprar taxa x estoque MSFT) quando é alto e calcular PnL destes comércios.


Então essa estratégia parece rentável! Agora podemos otimizar ainda mais alterando nossas janelas médias móveis, mudando os limiares para comprar / vender e sair de posições etc. e verificar melhorias de desempenho em dados de validação.


Nós também poderíamos tentar modelos mais sofisticados, como Logisitic Regression, SVM etc, para fazer nossas previsões 1 / -1.


Por enquanto, digamos que decidimos avançar com esse modelo, o que nos traz.


Passo 7: Backtest em dados de teste.


Backtesting é simples, podemos usar nossa função de cima para ver PnL em dados de teste.


O modelo faz muito bem! Isso torna nosso primeiro modelo de negociação de pares simples.


Evite a superposição.


Antes de terminar a discussão, gostaríamos de dar uma menção especial à superposição. A superposição é a armadilha mais perigosa de uma estratégia comercial. Um algoritmo de superposição pode realizar maravilhosamente em um backtest, mas falha miseravelmente em novos dados invisíveis - isso significa que não descobriu nenhuma tendência de dados e nenhum poder de previsão real. Vamos dar um exemplo simples.


Em nosso modelo, usamos estimativas de parâmetros de rolagem e talvez desejemos otimizar o comprimento da janela. Podemos decidir simplesmente iterar sobre todo o comprimento de janela possível e razoável e escolher o comprimento com base em qual nosso modelo executa o melhor. Abaixo, escrevemos um loop simples para marcar comprimentos de janela com base em dados de treinamento e encontrar o melhor.


Agora, verificamos o desempenho do nosso modelo em dados de teste e achamos que esse comprimento de janela está longe de ser ótimo! Isso ocorre porque nossa escolha original foi claramente superada para os dados da amostra.


Caber claramente aos nossos dados de amostra nem sempre dar bons resultados no futuro. Apenas por diversão, deixe plotar os comprimentos de comprimento calculados a partir dos dois conjuntos de dados.


Podemos ver que qualquer coisa entre 20-50 seria uma boa escolha para a janela.


Para evitar a superposição, podemos usar o raciocínio econômico ou a natureza do nosso algoritmo para escolher o tamanho da janela. Nós também podemos usar filtros de Kalman, que não exigem que especifiquemos um comprimento; Este método será abordado em outro caderno mais tarde.


Próximos passos.


Nesta publicação, apresentamos algumas abordagens introdutórias simples para demonstrar o processo de desenvolvimento de uma estratégia de negociação de pares. Na prática, deve-se usar estatísticas mais sofisticadas, algumas das quais estão listadas aqui.


Expoente de Hurst Half-life of mean reversion inferido de um filtro de Ornstein-Uhlenbeck Kalman filtros.


Ao bater palmas mais ou menos, você pode nos indicar quais são as histórias que realmente se destacam.


Equipe Auquan.


A Auquan pretende envolver pessoas de diversas origens para aplicar as habilidades de seus respectivos campos para desenvolver estratégias de negociação de alta qualidade. Acreditamos que pessoas extremamente talentosas equipadas com conhecimento e atitude adequados podem projetar algoritmos de negociação bem-sucedidos.


Uma Introdução Básica para Pairs Trading.


Pairs trading ou Statistical Arbitrage é uma estratégia de negociação de ações que tenta ser neutra no mercado e capturar o spread entre dois estoques correlacionados à medida que retornam ao preço médio. É conhecido por alguns como # 8220; arbitragem estatística & # 8221 ;, mas & # 8220; negociação de pares & # 8221; é o nome mais comum usado para se referir a esta técnica.


Simplificando, é a compra e venda simultânea de dois estoques que se seguem quando divergem do padrão normal; na expectativa de que o padrão normal seja retomado em breve. Em outras palavras, os comerciantes encontram duas ações que tendem a se mover juntas. O comerciante compraria ações A e venderia estoque B curto.


Clique aqui para saber como utilizar as Bandas Bollinger com uma abordagem quantificada e estruturada para aumentar suas margens de negociação e garantir maiores ganhos com o Trading com Bollinger Bands® & # 8211; Um guia quantificado.


A troca de pares também é feita com opções, futuros e cestas de ações, mas isso é forragem para futuros artigos. Este artigo abordará os conceitos básicos de negociação de pares, mostrando-lhe um método simples de 4 etapas para troca de pares. Também fornecerei exemplos e apontei-o na direção certa para obter mais informações sobre esta tática de negociação de ações altamente efetiva, muitas vezes usada pelos profissionais de negociação.


Aqui está o método simples de 4 passos para começar na negociação em pares.


Etapa 1. Escolha o par de ações.


Isso pode soar como a parte mais difícil do processo, mas é bastante simples na sua forma mais bruta.


Existem inúmeros métodos complicados para escolher o par de ações, mas tudo se resume a encontrar duas ações que estão correlacionadas em movimento. Comece por procurar ações que tenham sentido ser semelhantes.


Aqui estão vários exemplos:


Estes são apenas um pequeno número de ações que podem ser usadas em troca de pares devido à sua correlação em movimento.


Etapa 2. Confirmar confirmação visual com gráficos.


Os gráficos de preços Eyeballing são uma maneira muito básica de determinar a correlação de pares. Olhe para gráficos de ações que você acha que devem ser correlacionados para encontrar vários que realmente se movem juntos. Existem muitas maneiras mais complexas de fazer isso, mas desta forma é a mais simples.


Passo 3. Criar um gráfico de proporção de preços.


Este é outro procedimento complicado, mas realmente simples. A maioria das plataformas de gráficos pode fazer isso automaticamente.


Um gráfico de taxa de preços É um gráfico de ambos os estoques plotados juntos. É calculado pela divisão de um preço das ações para o outro. Estes são normalmente gráficos de linha e medem o desvio do spread médio ou médio entre os dois estoques no par.


Passo 4. Compre um estoque. Venda um estoque curto.


Quando a linha da razão de preço se move para seu primeiro ou segundo desvio do tempo médio para entrar no comércio. Você quer passar o estoque atrasado e diminuir o desempenho excessivo.


Seu lucro está em qualquer lugar na propagação, pois ele volta ao meio. Quando você começa, combine o valor do dólar em cada estoque e não compartilhe o número, isso mantém as coisas iguais nos movimentos. Há muitas maneiras de dimensionar os negócios, este é apenas o método mais rudimentar.


Este é o comércio de par em sua forma mais simples. Não é um método à prova de engano. Os comerciantes podem e perdem dinheiro. No entanto, a negociação de pares é um método comprovado para lucros consistentes. Mais importante, lembre-se de utilizar paradas quando o comércio de pares. É possível que ambos os lados do comércio possam perder, então saiba o quanto você está disposto a perder antes de executar seu primeiro comércio de pares.


Dave Goodboy é vice-presidente de marketing para um fundo multi-estratégia baseado em Nova York.


Artigos recentes sobre TradingMarkets.


Informação da companhia.


The Connors Group, Inc.


10 Exchange Place, Suite 1800.


Jersey City, NJ 07302.


Recursos da empresa.


Propriedades.


Conecte-se com TradingMarkets.


© Copyright 2017 The Connors Group, Inc.


Não se deve presumir que os métodos, técnicas ou indicadores apresentados nesses produtos serão lucrativos ou que não resultarão em perdas. Os resultados passados ​​de qualquer comerciante ou sistema de negociação individual publicado pela Companhia não são indicativos de retornos futuros desse comerciante ou sistema, e não são indicativos de retornos futuros que sejam realizados por você. Além disso, os indicadores, estratégias, colunas, artigos e todas as outras características dos produtos da Companhia (coletivamente, a "Informação") são fornecidos apenas para fins informativos e educacionais e não devem ser interpretados como conselhos de investimento. Os exemplos apresentados no site da empresa são apenas para fins educacionais. Essas configurações não são solicitações de qualquer ordem para comprar ou vender. Consequentemente, você não deve confiar unicamente na Informação ao fazer qualquer investimento. Em vez disso, você deve usar a Informação apenas como ponto de partida para fazer pesquisas independentes adicionais para permitir que você forme sua própria opinião sobre os investimentos. Você sempre deve verificar com seu conselheiro financeiro licenciado e conselheiro fiscal para determinar a adequação de qualquer investimento.


OS RESULTADOS DE DESEMPENHO HIPOTÉTICOS OU SIMULADOS TÊM CERTAS LIMITAÇÕES INERENTES. DESEJO UM REGISTRO DE DESEMPENHO REAL, OS RESULTADOS SIMULADOS NÃO REPRESENTAM NEGÓCIO REAL E NÃO PODEM SER IMPACTOS POR CORREÇÃO E OUTRAS TAXAS DE SLIPPAGE. TAMBÉM, DESDE QUE OS NEGÓCIOS NÃO SEJAM REALMENTE EXECUTOS, OS RESULTADOS PODEM TENER SOB OU COMENTÁRIOS COMPLEMENTARES PARA O IMPACTO, SE HAVER, DE CERTOS FATORES DE MERCADO, TAL COMO FALTA DE LIQUIDEZ. PROGRAMAS DE NEGOCIAÇÃO SIMULADOS EM GERAL SÃO TAMBÉM SUJEITOS AO FATO QUE ESTÃO DESIGNADOS COM O BENEFÍCIO DE HINDSIGHT. NENHUMA REPRESENTAÇÃO ESTÁ FAZENDO QUE QUALQUER CONTA VÁ OU SEJA PROBABILITÁVEL PARA ALCANÇAR LUCROS OU PERDAS SIMILARES ÀOS MOSTRADOS.


Pairs Trading usando Técnicas Drivadas por Dados: Estratégias de Negociação Simples Parte 3.


Pairs trading é um bom exemplo de uma estratégia baseada em análises matemáticas. Vamos demonstrar como alavancar dados para criar e automatizar uma estratégia de negociação de pares.


Princípio subjacente.


Digamos que você tenha um par de títulos X e Y que tenham algum link econômico subjacente, por exemplo, duas empresas que fabricam o mesmo produto como Pepsi e Coca Cola. Você espera que a proporção ou a diferença nos preços (também chamada de spread) desses dois permaneçam constantes com o tempo. No entanto, de tempos em tempos, pode haver uma divergência no spread entre esses dois pares causada por mudanças provisórias de oferta / demanda, grandes pedidos de compra / venda para uma segurança, reação para notícias importantes sobre uma das empresas, etc. Neste cenário , um estoque se move enquanto o outro se move em relação um ao outro. Se você espera que esta divergência volte ao normal com o tempo, você pode fazer um comércio de pares.


Quando há uma divergência temporária, o comércio de pares seria vender o estoque de superação (o estoque que subiu) e comprar o estoque de baixo desempenho (o estoque que se deslocou para baixo). Você está fazendo uma aposta de que o spread entre as duas ações acabaria por convergir, quer o estoque superativo que se movesse de volta para baixo ou o estoque com desempenho inferior que se movia de volta ou ambos - seu comércio ganhará dinheiro em todos esses cenários. Se ambos os estoques se movem para cima ou se deslocam juntos sem alterar o spread entre eles, você não faz nem perde dinheiro.


Assim, a negociação de pares é uma estratégia de negociação neutra do mercado, permitindo que os comerciantes lucrem com praticamente qualquer condição de mercado: tendência de alta, tendência de baixa ou movimento lateral.


Explicando o conceito: começamos por gerar dois títulos falsos.


Vamos gerar um X e um modelo de segurança falsos, é um retorno diário, tirando de uma distribuição normal. Em seguida, realizamos uma soma cumulativa para obter o valor de X em cada dia.


Agora, nós geramos Y, que tem um link econômico profundo para X, então o preço de Y deve variar de forma similar ao X. Nós modelamos isto tomando X, deslocando-o e adicionando algum ruído aleatório extraído de uma distribuição normal.


Cointegração.


Cointegração, muito semelhante à correlação, significa que a relação entre duas séries variará em torno de uma média. As duas séries, Y e X seguem o seguimento:


onde ⍺ é a relação constante e e é ruído branco. Leia mais aqui.


Para troca de pares para trabalhar entre duas vezes, o valor esperado da relação ao longo do tempo deve convergir para a média, ou seja, eles devem ser cointegrados.


A série temporal que construímos acima é cointegrada. Vamos traçar a relação entre os dois agora, para que possamos ver como isso parece.


Testes de Cointegração.


Existe um teste conveniente que vive em statsmodels. tsa. stattools. Devemos ver um valor p muito baixo, como criamos artificialmente duas séries que são tão cointegradas quanto fisicamente possível.


Nota: Correlação vs. Cointegração.


A correlação e cointegração, embora teoricamente similares, não são as mesmas. Vejamos exemplos de séries que estão correlacionadas, mas não cointegradas, e vice-versa. Primeiro, vamos verificar a correlação das séries que acabamos de gerar.


Isso é muito alto, como seria de esperar. Mas como duas séries estarão correlacionadas, mas não cointegradas? Um exemplo simples é duas séries que apenas divergem.


Teste de Cointegration p-value: 0.258.


Um simples exemplo de cointegração sem correlação é uma série normalmente distribuída e uma onda quadrada.


Teste de Cointegration p-value: 0.0.


A correlação é incrivelmente baixa, mas o valor p mostra uma cointegração perfeita!


Como fazer um comércio de pares?


Como duas séries temporais cointegradas (como X e Y acima) derivam para e separadas umas das outras, haverá momentos em que a propagação é alta e as vezes em que a propagação é baixa. Nós fazemos um comércio de pares comprando uma segurança e vendendo outra. Desta forma, se ambos os títulos forem juntos ou subissem juntos, nós não fazemos nem perdemos dinheiro - nós somos neutros no mercado.


Voltando a X e Y acima, seguem Y = ⍺ X + e, de modo que a relação (Y / X) se mova em torno de seu valor médio ⍺, ganhamos dinheiro com a razão dos dois que retornam à média. Para fazer isso, observaremos quando X e Y estiverem distantes, ou seja, é muito alto ou muito baixo:


Going Long the Ratio Isto é quando o índice ⍺ é menor do que o habitual e esperamos que ele aumente. No exemplo acima, colocamos uma aposta nessa comprando Y e vendendo X. Iniciando a Ratio Isto é quando o índice ⍺ é grande e esperamos que ele se torne menor. No exemplo acima, colocamos uma aposta nessa vendendo Y e comprando X.


Observe que sempre temos uma "posição coberta": uma posição curta ganha dinheiro se a segurança vendida perder valor, e uma posição longa ganhará dinheiro se um valor de ganhos de segurança, de modo que somos imunes ao movimento geral do mercado. Nós apenas fazemos ou perdemos dinheiro se os valores mobiliários X e Y se movimentarem uns com os outros.


Usando Dados para encontrar títulos que se comportem assim.


A melhor maneira de fazer isso é começar com títulos que você suspeita que possam ser cointegrados e realizar um teste estatístico. Se você apenas executa testes estatísticos em todos os pares, você será preso ao viés de comparação múltiplo.


O compartimento de comparações múltiplas é simplesmente o fato de que há uma maior chance de gerar incorretamente um valor p significativo quando muitos testes são executados, porque estamos executando muitos testes. Se 100 testes forem executados em dados aleatórios, devemos esperar ver 5 p-valores abaixo de 0,05. Se você estiver comparando n valores para co-integração, você realizará comparações n (n-1) / 2 e você deverá esperar muitos valores p significativos, o que aumentará conforme você aumenta. Para evitar isso, escolha um pequeno número de pares que você tenha motivos para suspeitar que pode ser cointegrado e testar individualmente. Isso resultará em menos exposição ao viés de comparações múltiplas.


Então, vamos tentar encontrar alguns títulos que exibem cointegração. Vamos trabalhar com uma cesta de estoques de tecnologia de grande capitalização dos EUA - S & amp; P 500. Esses estoques operam em um segmento similar e poderiam co-integrar os preços. Escaneamos uma lista de títulos e testamos a cointegração entre todos os pares. Retorna uma matriz de pontuação de teste de cointegração, uma matriz de valor de p e quaisquer pares para os quais o valor de p foi inferior a 0,05. Este método é propenso a múltiplos compartimentos de comparação e, na prática, os títulos devem estar sujeitos a uma segunda etapa de verificação. Ignore isso por causa deste exemplo.


Nota: Nós incluímos o mercado de referência (SPX) em nossos dados - o mercado impulsiona o movimento de tantos títulos que muitas vezes você pode encontrar dois títulos aparentemente cointegrados; mas na realidade eles não estão cointegrados um com o outro, mas ambos conintegrados com o mercado. Isso é conhecido como uma variável de confusão e é importante verificar o envolvimento do mercado em qualquer relacionamento que você encontrar.


Agora vamos tentar encontrar pares cointegrados usando nosso método.


Parece que 'ADBE' e 'MSFT' são cointegrados. Vamos dar uma olhada nos preços para garantir que isso realmente faça sentido.


A proporção parece que ele se moveu em torno de uma média estável. A razão absoluta não é muito útil em termos estatísticos. É mais útil normalizar o nosso sinal, tratando-o como um escore z. O escore Z é definido como:


Z Pontuação (Valor) = (Valor - Média) / Desvio Padrão.


Na prática, isso geralmente é feito para tentar dar alguma escala aos dados, mas isso assume uma distribuição subjacente. Normalmente normal. No entanto, muitos dados financeiros normalmente não são distribuídos, e devemos ter muito cuidado para não simplesmente assumir a normalidade, ou qualquer distribuição específica ao gerar estatísticas. A verdadeira distribuição de índices pode ser muito gordo e propensos a valores extremos, desordenando nosso modelo e resultando em grandes perdas.


É mais fácil observar agora que a relação agora se move em torno da média, mas às vezes é propensa a grandes divergências da média, das quais podemos tirar vantagens.


No entanto, quando falamos sobre os fundamentos da estratégia de negociação de par e identificamos títulos co-integrados com base no preço histórico, vamos tentar desenvolver um sinal de negociação. Primeiro, recapitulemos os passos no desenvolvimento de um sinal comercial usando técnicas de dados:


Recolher dados confiáveis ​​e limpar dados Criar recursos a partir de dados para identificar um sinal de negociação / lógica Os recursos podem ser médias móveis ou proporções de dados de preço, correlações ou sinais mais complexos - combine estes para criar novos recursos. Gerar um sinal de negociação usando esses recursos, ou seja, os instrumentos são uma compra, uma venda ou neutro.


Etapa 1: configure seu problema.


Aqui estamos tentando criar um sinal que nos diz se a relação é uma compra ou uma venda no próximo instante no tempo, ou seja, nossa variável de previsão Y:


Y = Ratio é comprar (1) ou vender (-1) Y (t) = Sign (Ratio (t + 1) - Ratio (t))


Observe que não precisamos prever os preços reais das ações, ou mesmo o valor real da relação (embora possamos), apenas a direção do próximo movimento na proporção.


Passo 2: colete dados confiáveis ​​e precisos.


A Auquan Toolbox é sua amiga aqui! Você só precisa especificar o estoque que deseja negociar e a fonte de dados para usar, e puxa os dados necessários e o limpa por dividendos e divisões de estoque. Então, nossos dados aqui já estão limpos.


Estamos usando os seguintes dados do Yahoo em intervalos diários para dias de negociação nos últimos 10 anos (


2500 pontos de dados): Abrir, fechar, alto, baixo e volume de negociação.


Passo 3: dados divididos.


Não esqueça deste passo super importante para testar a precisão de seus modelos. Estamos usando o seguinte Treinamento / Validação / Teste de divisão.


Idealmente, também devemos fazer um conjunto de validação, mas iremos ignorar isso por enquanto.


Etapa 4: engenharia de recursos.


O que poderiam ser características relevantes? Queremos prever a direção do movimento de proporção. Nós vimos que nossos dois títulos são cointegrados, de modo que o índice tende a se deslocar e reverter para o meio. Parece que nossas características devem ser certas medidas para a média da relação, a divergência do valor atual da média para poder gerar o nosso sinal de negociação.


Vamos usar os seguintes recursos:


60 dias Média em Movimento da Proporção: Medida do rolamento significa 5 dias Média de Mover da Relação: Medida do valor atual do desvio padrão médio de 60 dias Pontuação z (5d MA - 60d MA) / SD 60d.


O Z Score do rolling significa realmente revela a natureza reversa média da proporção!


Passo 5: Seleção do modelo.


Vamos começar com um modelo realmente simples. Olhando para o gráfico de pontuação z, podemos ver que sempre que o recurso de pontuação z fica muito alto, ou muito baixo, ele tende a reverter. Vamos usar + 1 / -1 como nossos limiares por muito alto e muito baixo, então podemos usar o seguinte modelo para gerar um sinal comercial:


Ratio é comprar (1) sempre que o z-score é inferior a -1,0, porque esperamos que o score z volte para 0, portanto, o índice para aumentar Ratio é vendido (-1) quando o z-score está acima de 1,0 porque esperamos z pontuação para voltar para 0, portanto, proporção para diminuir.


Passo 6: treinar, validar e otimizar.


Finalmente, vamos ver como nosso modelo realmente faz em dados reais? Vamos ver como é esse sinal nas relações reais.


O sinal parece razoável, parece que vendemos a proporção (pontos vermelhos) quando ele é alto ou aumentado e recomprá-lo quando baixo (pontos verdes) e diminuindo. O que isso significa para ações reais que estamos negociando? Vamos dar uma olhada.


Observe como às vezes ganhamos dinheiro na perna curta e às vezes na perna longa, e às vezes ambas.


Estamos satisfeitos com o nosso sinal nos dados de treinamento. Vamos ver que tipo de lucros esse sinal pode gerar. Nós podemos fazer um backtester simples que compra 1 ratio (comprar 1 estoque ADBE e taxa de venda x estoque MSFT) quando a proporção é baixa, vender 1 proporção (vender 1 estoque ADBE e comprar taxa x estoque MSFT) quando é alto e calcular PnL destes comércios.


Então essa estratégia parece rentável! Agora podemos otimizar ainda mais alterando nossas janelas médias móveis, mudando os limiares para comprar / vender e sair de posições etc. e verificar melhorias de desempenho em dados de validação.


Nós também poderíamos tentar modelos mais sofisticados, como Logisitic Regression, SVM etc, para fazer nossas previsões 1 / -1.


Por enquanto, digamos que decidimos avançar com esse modelo, o que nos traz.


Passo 7: Backtest em dados de teste.


Backtesting é simples, podemos usar nossa função de cima para ver PnL em dados de teste.


O modelo faz muito bem! Isso torna nosso primeiro modelo de negociação de pares simples.


Evite a superposição.


Antes de terminar a discussão, gostaríamos de dar uma menção especial à superposição. A superposição é a armadilha mais perigosa de uma estratégia comercial. Um algoritmo de superposição pode realizar maravilhosamente em um backtest, mas falha miseravelmente em novos dados invisíveis - isso significa que não descobriu nenhuma tendência de dados e nenhum poder de previsão real. Vamos dar um exemplo simples.


Em nosso modelo, usamos estimativas de parâmetros de rolagem e talvez desejemos otimizar o comprimento da janela. Podemos decidir simplesmente iterar sobre todo o comprimento de janela possível e razoável e escolher o comprimento com base em qual nosso modelo executa o melhor. Abaixo, escrevemos um loop simples para marcar comprimentos de janela com base em dados de treinamento e encontrar o melhor.


Agora, verificamos o desempenho do nosso modelo em dados de teste e achamos que esse comprimento de janela está longe de ser ótimo! Isso ocorre porque nossa escolha original foi claramente superada para os dados da amostra.


Caber claramente aos nossos dados de amostra nem sempre dar bons resultados no futuro. Apenas por diversão, deixe plotar os comprimentos de comprimento calculados a partir dos dois conjuntos de dados.


Podemos ver que qualquer coisa entre 20-50 seria uma boa escolha para a janela.


Para evitar a superposição, podemos usar o raciocínio econômico ou a natureza do nosso algoritmo para escolher o tamanho da janela. Nós também podemos usar filtros de Kalman, que não exigem que especifiquemos um comprimento; Este método será abordado em outro caderno mais tarde.


Próximos passos.


Nesta publicação, apresentamos algumas abordagens introdutórias simples para demonstrar o processo de desenvolvimento de uma estratégia de negociação de pares. In practice one should use more sophisticated statistics, some of which are listed here.


Hurst exponent Half-life of mean reversion inferred from an Ornstein–Uhlenbeck process Kalman filters.


Ao bater palmas mais ou menos, você pode nos indicar quais são as histórias que realmente se destacam.


Equipe Auquan.


A Auquan pretende envolver pessoas de diversas origens para aplicar as habilidades de seus respectivos campos para desenvolver estratégias de negociação de alta qualidade. Acreditamos que pessoas extremamente talentosas equipadas com conhecimento e atitude adequados podem projetar algoritmos de negociação bem-sucedidos.


Pairs trading: A copula approach.


Rong Qi Liew Yuan Wu.


Pairs trading is a technique that is widely practiced in the financial industry. Its relevance has been constantly tested with updated samples, and its profitability is acknowledged among practitioners and academics. Yet in pairs trading, the notion of correlation is central, and the use of correlation or cointegration as a measure of dependency is ultimately its Achilles’ heel. To overcome this limitation, this article employs the use of copulas, which is much more realistic and robust, to develop trading rules for pairs trading. Copulas are useful extensions and generalizations of approaches for modeling joint distributions and dependence between financial assets. A trading strategy that involves the use of copulas has been compared against two most commonly applied conventional strategies. The empirical results suggest that the proposed strategy is a potentially powerful analytical alternative to the traditional pairs trading techniques.


INTRODUÇÃO.


Pairs trading is a well-acknowledged speculative investment strategy in the financial markets that is popularized back in the 1980s. Today, pairs trading is commonly applied by hedge funds and institutional investors as a long/short equity investment strategy. ( Vidyamurthy, 2004 ) Recent researchers ( Gatev et al, 2006 ; Do and Faff, 2018 ) have extended the initial analysis of pairs trading to more updated samples, and documented economically and statistically significant profits using simple pairs trading rule.


Generally perceived as a form of technical analysis, the objective of pairs trading is to identify the relative overvalued and undervalued positions between two stocks that are closely related, with a long-run relationship. Such relative mispricing occurs if the spread between the two stocks deviates from its equilibrium, and excess returns will be generated if the pair is mean-reverting (that is, any deviations are temporary, and will return to its equilibrium after a period of adjustment). In this situation, the stategy will simultaneously short the relatively overvalued stock and long the relatively undervalued. The formation of pairs ensues from a cointegration analysis or maximum correlation criteria of the historical prices. Thereafter, pairs trading strategy is implemented to identify the trading signals.


However, a significant shortcoming in the technique is the fundamental assumption of linear association and its use of correlation coefficient or cointegration as a measure of dependency. These basic assumptions may be convenient and useful in application, but they can cause the simple pairs trading signals to be inaccurate. If the data is normally distributed, then linear correlation completely describes dependency. But it is widely acknowledged that financial data are rarely normally distributed in reality, therefore correlation cannot completely describe the dependency. In fact, negative skewness and/or excess kurtosis are frequently observed in most financial assets ( Kat, 2003 ; Crook and Moreira, 2018 ), resulting in upper and lower tail dependence of different extent. As such, correlation and cointegration are not sufficient in describing the association between financial assets and predicting their future movements.


The objective of this article is to link the use of copula with pairs trading to develop a trading strategy. Because copulas separate marginal distributions from dependence structures, the appropriate copula for a particular application is one that best captures dependence features of the data. ( Trivedi and Zimmer, 2007 ) Hence, the use of copula is able to capture the co-movement between stocks accurately enough to identify trading signals, which standard linear correlation analysis is not robust enough to accomplish ( Ferreira, 2008 ). Therefore, it is hypothesized that a trading strategy involving the use of copula will bring about more trading opportunities, and potentially more profit than conventional strategies. The proposed strategy will be explored, and compared against conventional strategies.


The rest of the article will be organized as follow. The next section will provide a brief overview of pairs trading. The section ‘Trading strategies’ will describe the trading strategies studied in this article, and the empirical results will be demonstrated in the section ‘Empirical results’. The section ‘Conclusion’ will conclude the article and provide directions for future studies.


FOUNDATIONS OF PAIRS TRADING STRATEGIES.


The general idea for investing in the marketplace from a valuation point of view is to sell overvalued securities and buy the undervalued. As the true values of the securities in absolute terms are rarely known, pairs trading techniques attempt to resolve this by looking at stock pairs with similar characteristics. Its objective is to identify the relative positions whenever an inefficient market results in the mispricing of securities. This mutual mispricing between two securities is theoretically captured by the notion of spread ( Vidyamurthy, 2004 ).


Currently, there are several different pairs trading techniques applied in the modern financial industry. The two most commonly established techniques are the distance strategy ( Gatev et al, 2006 ; Perlin, 2009 ; Do and Faff, 2018 ) and cointegration strategy ( Vidyamurthy, 2004 ; Lin et al, 2006 ; Galenko et al, 2018 ).


Generally, pairs are selected based on a cointegration analysis or minimum distance (equivalently, maximum correlation) criteria. When a suitable pair is identified, the traditional technique will engage in a simultaneous purchase of relatively undervalued stock and sale of relatively overvalued stock in an attempt to create a market-neutral trading system. This is to take advantage of the price divergence in terms of the spread that is expected to revert eventually, known as the mean-reverting behavior ( Bock and Mestel, 2008 ). Hence, pairs trading is also known as a form of long/short equity investment as the market-neutral strategy holds two stocks of different positions with equal market risk exposure at all times.


It is important to note that all the conventional techniques are essentially found on the assumption of linear association and its use of correlation coefficient or cointegration as a measure of dependency. In addition, the use of correlation and cointegration in pairs trading assumes a symmetric distribution of spread around the mean value of 0. Therefore, pairs trading has its limitations, and these may result in issues where the traditional pairs trading approach produces wrong trading signals or fail to identify profit opportunities ( Bock and Mestel, 2008 ).


On the other hand, copulas provide a powerful framework for modeling dependence structure without rigid assumptions ( Ferreira, 2008 ). It can potentially resolve the concerns mentioned earlier as it separates the estimation of individual marginal behavior and dependence structure into two different procedures. This separation of procedure is extremely valuable and useful in many different aspects. From an economic perspective, it gives analyst the opportunity to use different marginal distributions to account for the diversity in financial risks (or assets) ( Ane and Kharoubi, 2003 ). Hence, copula can be applied regardless of the form of marginal distributions, providing much greater flexibility for practical application. From a modeling position, the lower the dimensionality of a model or the cardinality of its parameters, the higher the reliability of the estimates. Hence, applying the best-fitting marginal distribution before estimating its joint distribution ensures that all information regarding the dependence structure between random variables are accurately captured without rigid assumptions.


Unlike the conventional approaches, employing a copula-based approach results in a far richer set of information, such as the shape and nature of the dependency between the stock pairs ( Ferreira, 2008 ). This advantage is resulted because of the variety of copula choices that measures upper and lower tail dependencies of different extent, in an environment that considers both linear and non-linear relationship. For example, Gumbel copula produces more correlation at the two extremes of the correlated distribution but has its highest correlation in the maxima tails, whereas Clayton copula produces a tight correlation at the low end of each variable. In addition, copulas possess an attractive property of being invariant under strictly monotone transformations of random variables. In other words, the same copula will be obtained regardless of whether the analyst or researcher is using price series or log price series ( Hu, 2003 ).


As a whole, copula is unique as it allows modeling dependence structure to be split into two separate procedures. First, the choice of best-fitting marginal distribution is provided to describe the variables. Subsequently, a suitable copula is applied to establish the dependence structure. This two-step approach provides more alternatives in model specification, and an explicit dependence function obtained will provide more delicate description of dependence ( Hu, 2003 ). These functionalities of copula ensure high accuracy and reliability of estimations, both of which are essential for financial analysis and application. Hence, the concept of copula will be explored as an alternative in this article where non-linear environment can be considered. For more details about copula, please refer Appendix A .


TRADING STRATEGIES.


In this section, the trading rules customized for three approaches, namely, copula, distance and cointegration, will be elaborated. In all three approaches, there are two different time periods, the formation period and trading (or backtesting) period. Historical data during formation period are used to observe price behavior and estimate the distribution and relevant parameters required for each approach. Using the estimated distributions and parameters from formation period, strategies are implemented during the trading period to test for profitability. There is no fixed guideline to the length of each time period, hence this article will use a 2-year and a subsequent 1-year phase as the formation and trading period, respectively.


Ultimately, all three approaches aim to identify the relative positions of the stock pairs and simultaneously long the undervalued stocks and short the overvalued, in attempt to establish a market-neutral trading system. The use of same formation period, trading period and stock pairs are maintained throughout the three approaches in this article due to the intention to make a comparison between the three.


Copula approach.


The objective of the pairs trading technique using copula approach is to apply the optimal copula between two stock returns, and identify the relative positions between stock pairs. In general, application of the strategy for copula approach will require the marginal distributions, the relevant copula function and the conditional probability distribution functions, which can be functions of copula.


Using data of the stocks during formation period, marginal distribution functions and the respective parameters are estimated based on the value of its cumulative log-returns. This can be done using any standard statistical analysis software that estimates the best-fitting marginal distribution. After applying the marginal distributions and relevant estimated parameters for each stock returns, the cumulative distribution function values obtained of each stock, u and v , provides the information for a relevant copula function to be selected.


As a general guideline, stocks are identified as being relatively undervalued if the conditional probability is less than 0.5 and relatively overvalued if the conditional probability is greater than 0.5. In addition, the values of the conditional probabilities are also an indication of its certainty or confidence regarding the position of stocks ( Ferreira, 2008 ). Therefore, the execution of trade should be done when one of the conditional probabilities is close to 1. Hence, the use of conditional probability functions is essential for the strategy. For more information on the formulas of conditional probability functions, please refer Appendix B (Table B1).


For demonstration purposes, this article selects the upper bound of 0.95 and lower bound of 0.05 for the threshold of conditional probabilities as trading triggers in this approach. A position is opened during the trading period when one of the conditional probability values is above the upper bound, whereas the other is below the lower bound. Subsequently, exit position is assumed once the positions revert (that is, when the conditional probabilities cross the boundary of 0.5).


Distance approach.


In this article, we implemented the same trading strategy framework as described in Gatev et al (2006) for the distance approach. Upon finding two stocks that move together, long/short positions are taken when the stocks diverge abnormally. This divergence is determined by the difference between standardized price gap of the two securities, often known as spread. It acts as a signal to the open and close positions of the pairwise stocks. During the trading period, position is opened when the spread widens by more than two historical standard deviations, as estimated during the formation period. Thereafter, the positions are closed when spread of the stocks reverts. If reversion does not occur before the end of the trading period, profits or losses are calculated at the end of the last trading day of the trading period.


Cointegration approach.


Similar to the previous trading strategy, the main concern of this aproach is the movement of spread. However, instead of emphasizing on the distance between the standardized prices of stock pairs, the spread considered is based on the notion of error correction. The idea of error correction is based on the long-run equilibrium in a cointegrated system; that is, the long-run mean of the linear combination of two time series ( Vidyamurthy, 2004 ). If there is a deviation from the long-run mean, then it is expected for one or both the time series to adjust in order for the long-run equilibrium to be restored.


Using cointegration as a theoretical basis, the general framework of cointegration approach in pairs trading consist of two parts. First is to generate the spread based on the actual cointegration error term of long-run relationship. This is estimated using regression analysis based on log-price series data from the formation period. Using the standard deviation of spread during formation period, a threshold of two standard deviation is set up for the trading strategy. Once the spread deviates from its long-term equilibrium and exceeds the threshold during the trading period, long/short positions are taken. Thereafter, positions are closed after the spread converges to its long-run equilibrium value of 0. For more details of the strategy framework conducted in this article, please refer Vidyamurthy (2004) .


EMPIRICAL RESULTS.


This section will provide details of the actual implementation by demonstrating the three strategies using the pairs that have been applied. For reasons of space, only one example of Brookdale Senior Living Inc. and Emeritus Corporation ( BKD-ESC ) will be illustrated in detail. The stock pair is verified as one that is highly correlated and cointegrated. It is also one of the stock pairs listed on pairslog in the healthcare sector, specifically in long-term care facilities.


This article investigates the time period from 1 December 2009 to 30 November 2018. Data from the first 24 months are used to find the relevant parameters, and information obtained is applied on the trading period, which is the subsequent 12 months. The trading strategies of different approaches are studied and demonstrated, without the procedure of pairs selection. Hence, only stock pairs that are widely discussed online or speculated in several literatures have been considered. Each stock pair has the same Schwarz Information Criterion (SIC) code to ensure industrial neutrality, or at least to reduce the industrial risk as well.


Distance approach.


A detailed figure for the conventional distance strategy is featured below to illustrate the standardized prices and spread of the values.


Distance trading strategy.


Cointegration approach.


Cointegration trading strategy.


Figure 2(a) shows a plot of the log-price series of the stock pair BKD-ESC during formation period and Figure 2(b) displays the spread during the same time period. The same applies for Figure 2(c) and Figure 2(d) , respectively, but the values plotted are data from trading period.


Note that the spread of concern in this approach is obtained from the actual cointegration error term of the long-run relationship between the two log-price series, estimated using regression. Hence, the spread itself is a linear combination of the two log-price series. As the stock pair is verified to be cointegrated, it implies that the spread should thereotically be a stationary time series that is randomly distributed about the long-term mean value of 0. However, this is not illustrated in Figures 2(b) and (d) . In fact, the spread behavior from the two time periods are distintively different, with an asymmetric distribution. Hence, linear association and its use of cointegration as a measure of dependence in this approach is insufficient in capturing the association between the financial assets. This results in an inconsistency of spread values obtained during the two time periods. Note that the possibility of a structural change cannot be dismissed, but the limitatons of the approach itself seems more reasonable. The limitations of this conventional trading strategy could in turn result in an inaccurate perspective of the association between the assets concerned, possibly causing the lack of trading opportunities and therefore a lower profit in the trading strategy.


Copula approach.


As mentioned in the section ‘Distance approach’, this approach will first require the marginal distributions of each variable; in this case, the cumulative log returns of BKD and ESC from the historical data. Using standard statistical analysis software, the marginal distributions fitted to the cumulative log returns of BKD and ESC are Error and Generalized Logistic distributions, respectively. Using the distribution functions and parameters estimated, the values of u and v are computed.


SIC, AIC and HQIC test values of copulas using formation period data.


As shown in Table 1 , the dependence structure of Gumbel copula fits the formation period data best as it has the lowest SIC, AIC and HQIC test values among the tested.


Plots of u and v values of formation period data and copulas fitted.


Note that extreme tail dependencies of different extent can be captured by copulas as seen from the different options provided by the copulas displayed in Figure 3 . On the other hand, these crucial characteristics cannot be captured by correlation and cointegration as both indicators only measure the linear association and assumes that observations follow a symmetrical pattern. Hence, copula will be able to make estimations and predictions that are closer to the reality.


SIC, AIC and HQIC test values of copulas using trading period data.


Results of the trading strategies.


Correlation coefficient of log-price series during formation period.


Correlation coefficient of log-price series during trading period.


Kendall's τ of log-price series during formation period.


Kendall's τ of log-price series during trading period.


Spearman ρ of log-price series during trading period.


Spearman ρ of log-price series during trading period.


Panel A: Trading strategy based on thresholds designated in the section ‘Empirical results’


Profit (Capital: 10 000)


Number of transactions.


Returns of trading period.


Panel B: Trading strategy in Panel A with 1-day waiting period.


Profit (Capital: 10 000)


Number of transactions.


Returns of trading period.


Plots of u and v values of trading period data and copulas fitted.


Summary results of the trading strategies based on thresholds designated in the section ‘Empirical results’


Panel A: Trading strategies executed on BKD-ESC.


Panel B: Trading strategies executed on APA-DVN.


Panel C: Trading strategies executed on BOH-CYN.


Transactions costs.


In real-world applications, it is certain that transaction costs have to be taken into consideration. Hence, this article will address the issues regarding bid-ask spreads and short sales lost.


According to Gatev et al (2006) , the use of same prices for the start of trading and returns may be biased upward because of the fact that transactions executed in the study are implicitly buying at bid quotes (losers) and selling at ask quotes (winners). Hence, to address this concern, this article has done the same as Gatev et al (2006) for the example on stock pair BKD-ESC , and initiated positions on the day following the divergence and liquidates on the day following the convergence. The values of profits, number of transactions and returns are computed and illustrated in Panel B of Table 3 . However, the authors understand that it is meaningless to carry out such precaution on a few stock pairs. In order for the precaution to be effective in addressing the issue of bid-ask spread, it is essential for the research to be extended to an entire market. Yet this is currently out of the scope of this article, thus it can be one of the aspects that the authors are considering for future studies.


On the other hand, the concerns regarding cost of short-selling is dismissed in this article as it has been verified by Gatev et al (2006) that pairs trading profits are robust to short-selling costs. Hence, it is presumed that the impact of short-selling costs is mitigated by the use of liquid stocks that trade every day over a period of 1 year and it is therefore viewed as insiginificant.


CONCLUSÃO.


Pairs trading is a technique that is commonly applied in the financial industry. In this article, the concept of copulas in pairs trading is explored to overcome the limitations of traditional pairs trading strategies. The use of copulas in constructing joint distributions separates the estimation of individual marginal distributions from the dependence structure. This brings about much greater flexibility in the framework when specifying joint distributions, while providing richer information regarding the dependency between financial assets. Hence, copulas will bring about estimations that are more realistic and of better precision.


The empirical results demonstrate that the copula approach for pairs trading is superior to the conventional. It is observed that the use of copula in pairs trading provides more trading opportunities in practical application, and with greater confidence, as it does not require any rigid assumptions. The use of correlation or cointegration as a measure of dependency is also disregarded, thus the proposed strategy offers a potentially powerful analytical alternative to the traditional pairs trading techniques.


Despite the overall superiority of results obtained from copulas, this is only a preliminary study, and it is certainly imperfect. Copulas provide flexibility, and the strategy based on copula is considered relatively easy to implement for such a sophisticated approach. However, it is still a new approach in the trading area after all. There is much more discovery and further improvements to be done to overcome the limitations of the current work. Furthermore, the use of copulas may also be explored in the selection of stock pairs. Pairs selection is the first and most essential step to pairs trading, thus improving the conventional selection process will be a new leap forward in this area.


Appendix A.


Copula and Sklar's Theorem.


In the statistics literature, the idea of a copula arose as early as the nineteenth century in the context of discussions regarding non-normality in multivariate cases ( Hu 2003 ). Currently, copulas are known as tools used in probability theory and statistics for modeling dependence between random variables.


Under this construction, C is a distribution function of two random variables with uniform unit values. Such a function is formally defined as a copula. In general sense, copulas are known as functions that combine individual one-dimensional marginal distributions to form a multivariate distribution function that describes both the linear and non-linear relationship between variables. It ensures that the dependency between variables are accurately captured and described in terms of a function.


The word ‘copula’ was first employed in a statistical sense by Sklar (1959) , in the theorem that now bears his name. His idea was to separate a joint distribution function into one part that describes the dependence structure (the copula) and the other that describes marginal behavior.


If F ( x ) and G ( y ) are continuous then C is unique; otherwise C is uniquely determined on Ran( F ) × Ran( G ), where Ran denotes range. Conversely, if C is a copula, and F ( x ) and G ( y ) are distribution functions then the function H ( x , y ) defined by the above equation is a joint distribution function with margins F ( x ) and G ( y ). Certainly, the notion of copula can be extended to higher dimensions: n - dimensional copulas are joint distribution functions of n random variables with unit uniform marginal. Formal proofs can be found in Nelsen (2006) .


In words, the Sklar's theorem translates that every copula is a joint distribution function with margins that are uniform in the domain of the copula. An essential implication is that a copula can be constructed from any joint distribution function with continuous marginal distributions. This is ultimately Sklar's idea of the concept of copula where the best-fitting marginal distributions are estimated before a joint distribution function that describes the dependence structure (a copula) is estimated and then applied.


Appendix B.


Conditional probability formulas of commonly applied copulas.


Appendix C.


GRAPHS OF STOCK PAIR APA-DVN.


Distance trading strategy.


Cointegration trading strategy.


Conditional probabilities of copula trading strategy.


Appendix D.


GRAPHS OF STOCK PAIR BOH-CYN.


Distance trading strategy.


Cointegration trading strategy.


Conditional probabilities of copula trading strategy.


Referências.


Informações sobre direitos autorais.


Autores e afiliações.


Rong Qi Liew 1 Yuan Wu 1. Nanyang Technological University (NTU) Singapore.


Sobre este artigo.


Recomendações personalizadas.


Cite o artigo.


.RIS Papers Reference Manager RefWorks Zotero.


.BIB BibTeX JabRef Mendeley.


Compartilhe o artigo.


Cite o artigo.


.RIS Papers Reference Manager RefWorks Zotero.


.BIB BibTeX JabRef Mendeley.


Compartilhe o artigo.


Índice.


Mais de 10 milhões de documentos científicos ao seu alcance.


Switch Edition.


&cópia de; 2017 Springer International Publishing AG. Parte de Springer Nature.

Comments