image 19

El doctor Ernest P. Chan, es fundador de PredictNow.ai Inc. La carrera de Ernie desde 1994 se ha centrado en el desarrollo de modelos estadísticos y algoritmos informáticos avanzados. Ha aplicado su experiencia en aprendizaje automático en IBM T.J. El grupo de tecnologías del lenguaje humano del Centro de Investigación Watson, en el Grupo de Minería de Datos e Inteligencia Artificial de Morgan Stanley y en el Grupo de Trading Horizon de Credit Suisse. También es el fundador y miembro gerente de una empresa de gestión de inversiones cuantitativas, QTS Capital Management, LLC. Ernie ha sido mencionado por el Wall Street Journal, el New York Times, Forbes y la revista CIO, y entrevistado en el programa Closing Bell de CNBC, y la revista Technical Analysis of Stocks and Commodities.
QTS Capital Management, LLC.

 

Todo operador sabe que hay regímenes de mercado que son favorables a sus estrategias, y otros regímenes que no lo son. Algunos regímenes son obvios, como los mercados alcistas contra los bajistas, los mercados tranquilos frente a los agitados, etc. Estos regímenes afectan a muchas estrategias y carteras (a menos que sean carteras neutrales en cuanto al mercado o neutrales en cuanto a la volatilidad) y son fácilmente observables e identificables (pero tal vez no predecibles). Otros regímenes son más sutiles y solo pueden afectar a su estrategia específica. Los regímenes pueden cambiar todos los días, y pueden no ser observables. A menudo no es tan simple como decir que el mercado tiene dos regímenes, y actualmente estamos en el régimen 2 en lugar de 1. Por ejemplo, con respecto a la rentabilidad de su estrategia específica, el mercado puede tener 5 regímenes diferentes. Pero no es fácil especificar exactamente cuáles son esos 5 regímenes, y en cuál de los 5 estamos hoy, por no hablar de predecir en qué régimen estaremos mañana. ¡Ni siquiera sabremos que hay exactamente 5!

Los cambios de régimen a veces requieren un cambio completo de estrategia de trading (por ejemplo, operar con una estrategia de reversión media en lugar de impulso). Otras veces, los operadores solo necesitan cambiar los parámetros de su estrategia de trading para adaptarse a un régimen diferente. Mis colegas y yo en PredictNow.ai hemos ideado una forma novedosa de adaptar los parámetros de una estrategia de trading, una técnica que llamamos «Optimización condicional de parámetros» (CPO). Este invento pendiente de patente permite a los traders adaptar nuevos parámetros con la frecuencia que deseen, tal vez para cada día de negociación o incluso para cada operación individual.

CPO utiliza el aprendizaje automático para realizar operaciones de manera óptima en función de las cambiantes condiciones (régimenes) del mercado en cualquier mercado. Los operadores en estos mercados normalmente ya poseen una estrategia de trading básica que decide el momento, el precio, el tipo y/o el tamaño de dichas órdenes. Esta estrategia de trading generalmente tendrá un pequeño número de parámetros ajustables. Normalmente, a menudo se optimizan en función de un conjunto de datos históricos fijo («conjunto de trenes»). Alternativamente, se pueden volver a optimizar periódicamente utilizando un conjunto de trenes en expansión o rodantes. (Este último a menudo se llama «Walk Forward Optimization».) Con un conjunto de bloques fijos, los parámetros claramente no pueden adaptarse a los regímenes cambiantes. Con un conjunto de bloques en expansión, los parámetros de trading aún no pueden responder a las condiciones del mercado que cambian rápidamente porque los datos adicionales son solo una pequeña fracción del conjunto de bloques existente. Incluso con un conjunto de bloques rodantes, no hay evidencia de que los parámetros optimizados en el período histórico más reciente den un mejor rendimiento fuera de la muestra. Un conjunto de bloques rodantes demasiado pequeños también dará resultados predictivos inestables y poco fiables dada la falta de significación estadística. Todos estos procedimientos de optimización convencionales pueden llamarse optimización incondicional de parámetros, ya que los parámetros no responden de forma inteligente a las condiciones del mercado que cambian rápidamente. Idealmente, nos gustaría tener parámetros que sean mucho más sensibles a las condiciones del mercado y, sin embargo, estén capacitados en una cantidad lo suficientemente grande de datos.

Para abordar este problema de adaptabilidad, aplicamos un algoritmo de aprendizaje automático supervisado (específicamente, bosque aleatorio con refuerzo) para aprender de un gran conjunto de predictores («característica») que captura varios aspectos de las condiciones de mercado prevalecientes, junto con valores específicos de los parámetros, para predecir el resultado de la estrategia de trading. (Un resultado de ejemplo es el futuro retorno de un día de la estrategia). Una vez que dicho modelo de aprendizaje automático está entrenado para predecir el resultado, podemos aplicarlo al mercado real introduciendo las características que representan las últimas condiciones del mercado, así como varias combinaciones de los parámetros. El conjunto de parámetros que resulten en el resultado óptimo previsto (por ejemplo, el rendimiento futuro más alto de un día) se seleccionará como óptimo, y se adoptará para la estrategia de trading para el siguiente período. El operador puede hacer tales predicciones y ajustar la estrategia de trading con la frecuencia que sea necesario para responder a las condiciones del mercado que cambian rápidamente.

En el ejemplo que puede descargar aquí, ilustro cómo aplicamos CPO utilizando la API de aprendizaje automático financiero de PredictNow.ai para adaptar los parámetros de una estrategia de reversión media basada en la banda de Bollinger en GLD (el ETF de oro) y obtener resultados superiores que destaco aquí:

 

 

Optimización incondicional Optimización condicional
Rebtabilidad anual 17,29% 19,77%
Ratio de Sharpe 1,947 2.325
Ratio calmar 0,984 1.454

La técnica de CPO también es útil en las verticales de la industria que no sean las finanzas; después de todo, la optimización en condiciones variables de tiempo y estocástico es un problema muy general. Por ejemplo, los tiempos de espera en la sala de emergencias de un hospital se pueden minimizar optimizando varios parámetros, como el nivel de personal, la preparación de equipos y suministros, la tasa de alta, etc. Los métodos actuales de última generación generalmente encuentran los parámetros óptimos mirando lo que funcionó mejor en promedio en el pasado. Tampoco hay una función matemática que determine exactamente el tiempo de espera en función de estos parámetros. La técnica CPO emplea otras variables como la hora del día, el día de la semana, la temporada, el clima, si hay eventos masivos recientes, etc., para predecir el tiempo de espera bajo varias combinaciones de parámetros y, por lo tanto, encontrar la combinación óptima en las condiciones actuales con el fin de lograr el tiempo de espera más corto.