Captura de pantalla 2024 11 20 a las 11.10.20

Jaume Antolí Plaza es trader algorítmico (Posgrado Sistemas y Modelos Cuantitativos de Trading Algorítmico, UPM) y científico de datos (Máster Ciencia de Datos, UOC) especializado en Data Mining aplicado al trading, enfoque con el que obtuvo el 2º puesto en Robotrader en 2023. Publicado en medios como Traders’ Magazine, Hispatrading y X-Trader. Colaborador en Quantified Models, Quantdemy y Komalogic.
Jaume Antolí / científico de datos

 

Un solo cambio en la fuente puede convertir una estrategia ganadora en un fracaso.

Cuando desarrollé mi primera estrategia de trading con CFDs en Forex, me estrellé contra una realidad que nadie me había advertido: en los mercados OTC no existe un precio «oficial». Cada proveedor presentaba su propia versión de la realidad, con diferencias que transformaban una estrategia ganadora en perdedora con solo cambiar la fuente de los datos.

fig1
 Fig. 1: Comparación de los resultados de una estrategia con diferentes datos.

Este problema no es exclusivamente mío, afecta a todos los que operamos con CFDs. Déjame compartirte mi viaje hacia la búsqueda de datos fiables y los obstáculos que encontré en cada etapa.

La escasez de los datos del broker

Comencé con lo que parecía más lógico: utilizar los datos de mi propio broker. Al fin y al cabo, reflejan las condiciones reales contra las que ejecutaría mis órdenes. La decepción llegó rápido: el histórico disponible apenas cubría unos pocos años.

fig2
Fig. 2: Limitación de la longitud del histórico.

Esta limitación resultó crítica. ¿Cómo podía probar mi estrategia en diferentes ciclos de mercado con datos que apenas cubrían unos años? 

La trampa de MetaQuotes

Ante la escasez de datos históricos, MetaTrader ofrece la posibilidad de descargar más datos. Sin embargo, esta opción muestra una advertencia reveladora:

fig3
Fig. 3: Descarga de MetaQuotes

Ignoré la advertencia inicialmente y utilicé los datos de MetaQuotes que ofrece MetaQuotes, hasta que empecé a notar patrones extraños en mis backtests. Descubrí gaps inexplicables y desajustes horarios (especialmente evidentes durante los cambios estacionales) que distorsionaban completamente los resultados. Lo que parecía una solución conveniente resultó ser una puerta abierta a la imprecisión.

Las alternativas gratuitas

Decidí explorar YFinance, una biblioteca gratuita que parecía prometedora. Sin embargo, tras varios backtests fallidos, analicé los datos con detalle y encontré errores alarmantes: numerosas velas donde Open=Close (alterando gravemente el cálculo de indicadores técnicos) y ocasionalmente contradicciones donde High < Low.

fig4
Fig. 4: Errores en los datos de YFinance 

No me rendí y probé con Dukascopy a través de QuantDataManager. La calidad parecía mejor, pero el proceso resultó exasperante: necesitaba configurar manualmente los ajustes horarios y descargar activo por activo, con una lentitud que convertía cada actualización en una tarea de horas.

fig5
 Fig. 5: Descarga de Dukascopy con QuantDataManager

En busca de soluciones

Tras los intentos fallidos, comprendí que estaba enfocando el problema incorrectamente. En lugar de datos gratuitos, lo que necesitaba eran datos fiables, consistentes y fáciles de mantener actualizados. Comencé a evaluar diferentes proveedores especializados, poniendo especial atención en:

  • Profundidad histórica (¿desde cuándo están disponibles los datos?) 
  • Calidad (¿presentan gaps o anomalías?) 
  • Precisión (¿incluyen información realista sobre spreads?) 
  • Usabilidad (¿cómo de complejo es mantenerlos actualizados?) 

Mi elección personal: calidad y practicidad

Tras evaluar múltiples alternativas, encontré en Quantdle una solución que, para mis necesidades específicas, equilibra calidad y facilidad de uso. El coste mensual, aunque menor, es un handicap respecto a otras opciones gratuitas, pero el tiempo ahorrado en configuraciones y descargas y la fiabilidad de los datos lo justifican.

Lo que realmente me convenció fue la capacidad de actualizar todos los históricos en MT5 mediante un simple EA, eliminando el tedioso proceso manual que había experimentado con otras opciones.

fig6
 Fig. 6: Facilidad de uso de Quantdle

Los datos están disponibles desde 2004, lo que me permite probar mis estrategias a través de diferentes ciclos económicos, incluyendo la crisis de 2008 y la volatilidad de la pandemia.

El aspecto de los spreads reales ha sido particularmente valioso para mis simulaciones, aunque reconozco que para estrategias que no dependan tanto de la precisión de los spreads, esta característica puede ser menos crítica.

No es una solución perfecta para todos – traders con presupuestos muy limitados pueden preferir invertir tiempo en configurar manualmente opciones como la de Dukascopy a través de QuantDataManager – pero para mi flujo de trabajo actual, la relación tiempo-calidad-coste es óptima.

fig7
Fig. 7: Tabla comparativa de proveedores de datos

La lección aprendida

Mi experiencia me ha enseñado que la elección de datos no es un detalle técnico sino una decisión estratégica fundamental. El tiempo perdido desarrollando sistemas sobre datos deficientes, las decisiones equivocadas basadas en backtests engañosos y las estrategias mal calibradas tienen un coste real que supera con creces la inversión en una fuente fiable.

Para quienes nos tomamos el trading en serio, los datos son la materia prima esencial. Como en cualquier construcción, si los cimientos no son sólidos, todo lo que construyamos encima estará en riesgo, independientemente de lo sofisticado que sea nuestro sistema.

Recomendaciones prácticas

Si estás comenzando tu camino en el trading algorítmico, te sugiero considerar estos factores antes de elegir una fuente de datos:

Consistencia temporal

Verifica que no existan saltos temporales inexplicables o periodos sin datos. Estos vacíos pueden distorsionar completamente los indicadores que dependan de series temporales continuas, como medias móviles o cálculos de volatilidad histórica.

Coherencia de precios

Examina manualmente algunas secciones de los datos para identificar anomalías como velas donde el precio más alto sea inferior al más bajo, o situaciones donde todos los precios de apertura y cierre coincidan artificialmente durante periodos prolongados.

Ajustes horarios

Los cambios de horario estacionales pueden crear duplicaciones o vacíos en tus datos. Un buen proveedor debería manejar estos cambios sin crear artefactos que puedan disparar señales falsas en tu sistema.

Realismo en los spreads

Para simulaciones verdaderamente representativas, necesitas datos que reflejen los spreads reales en diferentes condiciones de mercado, especialmente durante periodos de alta volatilidad cuando los spreads suelen ampliarse significativamente.

La calidad de los datos determina la calidad de tus decisiones. En un entorno donde cada pip cuenta, partir de información imprecisa es comenzar la carrera con una desventaja que ninguna optimización posterior podrá compensar completamente.