Un Mundo de Servicios En Linea

Recursos

Gráficos

Artículos

Alertas Técnicas Rsidat

Rankings RSIDAT

 

 


Estudio : Calidad en bases de datos históricas del mercado continuo. Caso real.

Autor : Antonio Carcelen, www.rsidat.com
Fecha : 10/10/02.

Resumen : Estudio donde se analizan cuatro bases de datos de diferentes empresas, donde se explica los tipos de errores mas usuales que se dan en las bases de datos, tambien se explica como el inversor puede detectar si dispone de una base de datos de calidad o no. Una de las conclusiones es : Base de datos RSIDAT 0 errores, Base de datos A 4500 errores , Base de B 5610 errores y Base de datos C 2386 errores.En el estudio solo se ha cogido 3 años y medio de de datos históricos.


En el presente artículo, pretendo demostrar la calidad de las bases de datos que circulan por internet, frente a la calidad de nuestra propia base de datos para el mercado continuo.

Se explicará como el usuario puede chequear sus propias bases de datos, errores típicos que se dan en las bases de datos y que no se pueden consentir, explicaré el procedimiento técnico seguido para hacer este estudio.

Hemos partido de cuatro bases de datos: Una base de datos de zona de Cataluña (Base A), Una base de datos de la zona centro (Base B), otra base de datos de la zona centro (Base C), y nuestra propia base de datos. En estas bases de datos sólo están incluidos los valores del mercado continuo.

Nuestra base de datos está libre de errores, errores que son de bulto como podrá ver mas abajo, todo este estudio está documentado, es decir, que le podríamos decir, si lo desea que el valor x de la base de datos A, B o C tiene los errores correspondientes dándole las fechas determinadas.

Quienes nos conocen saben como trabajamos: intentamos hacer las cosas bien y con cierta seriedad, esta misma actitud la intentamos llevar a este estudio.

Tenemos otras bases de datos, pero hemos visto que dada la cantidad de errores que reportaban los programas de chequeo de datos, hemos preferido dejar el estudio en estas cuatro bases de datos. Le podemos decir que bases de datos que venden por mas de 180 Euros ( 30.000 Ptas.) tienen más errores que otras bases de datos que circulan por Internet.

El procedimiento que hemos seguido ha sido el siguiente: Hemos recopilado estas bases de datos de diferentes fuentes: páginas web de las propias empresas, envío de dicha base de datos por parte de algún usuario nuestro. Después hemos limpiado estas bases de datos, dejando solo los valores del mercado continuo.

A priori, sin entrar a analizar la información en si:

  • Hemos visto que en dichas bases de datos no existe el mantenimiento de valores: siguen apareciendo valores que ya han desaparecido del mercado continuo hace mucho tiempo (en algún caso desde hace casi dos años).
  • No hacen un seguimiento de los valores que han cambiado de símbolo (produciendo una pérdida de datos históricos para ese valor), en algún caso se ha dado que no utilizan los símbolos estándar del mercado continuo (Sociedad de Bolsas), y en un caso sólo utilizan el símbolo del mercado continuo tanto para el nombre como para el símbolo con la consiguiente molestia que ello conlleva.


Tipos de errores:

En una base de datos existen diferentes tipos de errores:

  • Errores lógicos de información (siempre se debe guardar un orden lógico en cuanto a la estructura interna de la información de un valor, por ejemplo en ningún caso el precio de cierre puede ser superior al precio máximo o el precio de cierre inferior al precio mínimo del día o que el precio de apertura este fuera del rango máximo-mínimo del día, etc.). En el mercado se puede dar esta circunstancia, pero el trabajo del difusor de datos es evitar estas situaciones con procedimientos ampliamente aceptados para que esta base de datos sea útil para hacer el análisis técnico. Muchos indicadores darán resultados erróneos, pues se encontrarán relaciones inusuales que harán que los cálculos matemáticos arrojen errores, imagínese que en una operación de un indicador aparece la operación máximo-cierre, siempre esta operación debe de dar un valor positivo... pero ¿Qué ocurrirá en aquellos valores donde el máximo sea inferior al cierre?.

    Este tipo de errores se pueden detectar fácilmente con el programa Metastock.

  • Errores por un mal ajuste de la base de datos: Nuestra base de datos está ajustada por todo lo ajustable que hay en el mercado, cualquier ajuste que realice Sociedad de Bolsas lo hacemos nosotros. Estas empresas dicen que también hacen esos ajustes, lo dicen ahora, pues hace unos años, ni siquiera se lo planteaban es más, decían que no había que hacerlos, el tiempo nos ha dado la razón a los que pensamos que las bases de datos se deben ajustar, siempre que lo haga el mercado (esta opinión es compartida por muchos profesionales del sector).

    Aparentemente estas bases de datos están ajustadas, según dicen, pero si se estudian con detenimiento estos gráficos, vemos como a partir de una fecha determinada hacia atrás estos ajustes no existen. Y hoy en día, cuando tenemos que tener referencias históricas de mucho tiempo atrás (por desgracia), es importantísimo que las bases de datos estén realmente ajustadas.

    Otra idea a tener en cuenta es que una cosa es el dato sobre el dividendo que se publica en prensa o el valor teórico del derecho de una ampliación de capital y otra muy distinta el ajuste real que hay que realizar en la base de datos.

  • Errores por no saber como tratar determinadas situaciones de mercado: Hemos observado también que en determinados valores la extensión de la base de datos varía: por ejemplo el valor xxx tiene un histórico de 80 sesiones y otro valor yyy tiene un histórico de 75 sesiones, ambos valores tiene en el mismo rango de fechas, es decir, que hay valores en los que faltan días... ¿Cómo es posible hacer un estudio de betas, o un estudio de correlación, si no contamos con la misma serie de datos históricos?.
  • Errores debidos a información errónea: Hemos detectado como en valores en los que no se han hecho ningún ajuste, en una fecha determinada (solo así podemos ver la calidad del dato virgen) existen errores de información de bulto. O ciertos campos de informacion con valor igual a cero.


Ud. dirá todo está muy bien, pero ¿Cómo sé que es verdad?, Ud. puede comprobar la calidad de su base de datos, utilizando el programa metastock, dentro de su gestor de bases de datos (el programa Downloader), existe una opción dentro del menú tools, la opción test.

Esta opción esta implementada en este programa desde hace muchos años (se ve la importancia que le dan los americanos a la calidad de los datos, pues pusieron a disposición de los usuarios de este programa esta potente herramienta hace mucho tiempo, hace mas de 10 años en las primeras versiones de msdos, ya habia una utilidad para chequear la calidad de los datos). Con esta opción Ud. puede chequear su base de datos.

Antes que comience a hacerlo, debemos hacerle algunas puntualizaciones, este programa puede chequear 141 tipos diferentes de errores, dentro de estos errores existen errores de tipo técnico (chequeo de estructura interna de los archivos tipo metastock, etc.), ese tipo de errores a nivel de este estudio no nos preocupa, queremos ver los errores realmente graves que puedan afectar a nuestros indicadores. También existe un error para el programa que es "large change in close" es decir, si el detecta que existe una diferencia superior al 20% entre el cierre de un día y el siguiente día, lo reporta como error, para nuestro estudio tampoco hemos tenido en cuenta este error, pues hay multitud de ocasiones (por uno u otro motivo) donde se da esta circunstancia.

Los usuarios de RSIDAT, deben tener en cuenta que sólo deben pasar el test a los valores del mercado continuo, pues por ejemplo, entre las estadísticas avanzadas que difundimos están el número de máximos y número de mínimos (el test le dirá que existe un error en multitud de días y el error consiste en que el cierre es igual a cero, en este caso es obvio que si un día ningún valor marca máximos en sus ultimas 200 sesiones, el cierre debe ser cero).

Por eso digo que sólo se debe hacer el estudio a los valores del mercado continuo, gracias a ello podemos comparar la calidad de unas bases de datos a otras.

Otro pequeño problema que se va a encontrar al hacer un test, es que el programa sólo admite 2000 errores, es una cifra, me imagino, que los creadores del programa jamás pensaron que se podría alcanzar en una base de datos, por ello cuando se llega a este número de errores, el programa deja de chequear más valores. Ud. mismo podrá comprobar como enseguida, en muchas de estas bases de datos que circulan por internet, se alcanza este número de errores.

La solución que Ud. tiene es ir seleccionando de 10 en 10 valores por ejemplo, así con la tecla ctrl. del teclado pulsada, puede ir seleccionando valor a valor con el ratón y cuando tenga unos pocos valores le da a la opción test y podrá ir viendo el resultado por tandas, puede ir apuntando el resultado en una hoja de papel y luego sume los errores. No le aconsejo que imprima los errores pues le saldrán muchas, muchas hojas, piense que en cada hoja como mucho tendrá un report de 55 errores, vea mas abajo la cantidad de errores obtenidos en cada base de datos y se podrá hacer una idea de la cantidad de papel que necesitaría para tener todos los errores impresos.

Le anticipo desde ya, que nuestra base de datos desde el año 1986 no tiene ningún error, le digo esto pues para poder hacer un estudio homogéneo, hemos dejado las cuatro bases de datos entre dos fechas determinadas estas fechas han sido desde el 04/01/99 al 30/05/02, hemos escogido estas dos fechas con el fin de poder hacer el estudio de forma homogénea en el tiempo, así las cuatro bases de datos tendrán las mismas sesiones.

Le digo esto, pues una vez que haya visto el resultado del estudio, debería hacer una extrapolación, y preguntarse si en tres años y medio que abarca este estudio la base de datos A, por ejemplo tiene x errores; ¿Cuantos errores tendría esa misma base de datos si hubiésemos hecho el estudio desde el año 1990 o desde el año 1986?.


¿ Cómo hemos hecho nosotros este estudio?

Hemos hecho lo siguiente: Hemos cogido las cuatro bases de datos (entre estas dos fechas), solo con los valores del mercado continuo y lo que hemos hecho ha sido convertir las cuatro bases de datos en formato ascii (formato texto), así tendremos un formato universal para cualquier gestor de bases de datos.

Después hemos ido creando una base de datos en formato dbf, utilizando el programa foxpro. Así conseguimos que desde un programa preparado por nosotros puede rastrear valor por valor de cada base de datos, así podríamos tener en un informe todos los errores: por tipo de error, por valor y por fechas.

Los tipos de errores que hemos rastreado son:

  • Valores en los que el mínimo es superior al cierre.
  • Valores en los que máximo es inferior al cierre.
  • Valores en los que la apertura es superior al máximo.
  • Valores en los que la apertura es inferior al mínimo.
  • Valores en los que la apertura es igual cero

Como ve son errores que no se pueden o no se deberian de dar en una base de datos.

El resultado de este chequeo es el siguiente:

Base de Datos

Maximo<

Cierre

Minimo>

Cierre

Apertura=0

Apertura>

Maximo

Apertura<

Minimo

Total

Errores

RSIDAT 0 0 0 0 0 0
Base datos A 1319 1133 335 636 1077 4500
Base datos B 2840 1211 1442 47 70 5610
Base datos C 871 720 393 4 398 2386

Recuerde que en el estudio solo hemos cogido los datos comprendidos entre las fechas: 04/01/99 y 30/05/02. Piense que hubiese pasado si hubiésemos cogido los datos comprendidos entre el año 1990 y el año 2002 por ejemplo.

Le aseguramos que nuestra base de datos del mercado continuo tiene cero errores desde el año 1986. Esto se lo podemos demostrar en cualquier momento que pase por nuestras oficinas y delante de Ud. le hacemos un chequeo a dicha base de datos.

Si yo, fuese Ud. y viese estos resultados, sinceramente le diría al autor del estudio que no me lo creo...... es normal, que tenga esa actitud, ¿ Cómo va un inversor a utilizar estas bases de datos con semejantes errores ? , es algo ilógico, pues créame que existen inversores particulares que utilizan estas bases de datos y la pena es que tal vez Ud. sea uno de ellos y ni siquiera lo sepa.

Como he comentado mas arriba, todos estos errores están documentados para cada valor, aparece la fecha, los datos de ese día y el tipo de error que tiene esa fecha. Si en algún momento pasa por nuestras oficinas se lo podemos mostrar. O si desea que le enviemos por email con cinco o diez errores elegidos al azar de la base de datos de errores que hemos generado despues de hacer este estudio, diganoslo y se los enviamos por email.

También hemos detectado que en dos de estas bases de datos faltan 2 días de cotización y en la otra base de datos falta 1 día de cotización, (como es obvio no facilitamos estas fechas), pero estas bases de datos están incompletas también en cuanto a días de cotización.

¿ Cómo puede hacer alguien estudios serios con semejantes bases de datos ?, ¿ Cómo puede alguien hacer sistemas de trading con estas bases de datos ? , No, no piense que los sistemas de trading sólo se aplican a datos en tiempo real tenemos usuarios que tienen sistemas de trading con gráficos semanales, lo que importa es la capacidad de hacer dinero de un sistema y si un sistema en gráficos semanales me da dinero, seria de "tontos" no utilizarlo.

Aparte de estos errores, existen otros errores relacionados con el tema de los ajustes realizados en la base de datos, y esos errores si que son graves a nivel económico, pues el usuario se fija soportes y resistencias, por ejemplo, ficticios y eso si le cuesta dinero. Por favor vea el artículo titulado el ! Banco Popular en Máximos históricos ¡ en nuestra sección recursos, apartado artículos, ahí tendrá otro ejemplo real de la calidad de una base de datos.


De este estudio se pueden sacar muchas conclusiones, para nosotros la principal es que todo usuario debe exigir una calidad mínima en las bases de datos que utiliza, pues puede pensar que sus datos son correctos y estar muy alejado de la realidad.

Al inicio de esta página


Aviso Legal Condiciones de Uso Privacidad de Datos Contactar MapaWeb