![]() ![]() |
Recursos
|
Autor : Antonio
Carcelen, www.rsidat.com Resumen : Estudio donde se analizan cuatro bases de datos de diferentes empresas, donde se explica los tipos de errores mas usuales que se dan en las bases de datos, tambien se explica como el inversor puede detectar si dispone de una base de datos de calidad o no. Una de las conclusiones es : Base de datos RSIDAT 0 errores, Base de datos A 4500 errores , Base de B 5610 errores y Base de datos C 2386 errores.En el estudio solo se ha cogido 3 años y medio de de datos históricos.
Se explicará como el usuario puede chequear sus propias bases de datos, errores típicos que se dan en las bases de datos y que no se pueden consentir, explicaré el procedimiento técnico seguido para hacer este estudio. Hemos partido de cuatro bases de datos: Una base de datos de zona de Cataluña (Base A), Una base de datos de la zona centro (Base B), otra base de datos de la zona centro (Base C), y nuestra propia base de datos. En estas bases de datos sólo están incluidos los valores del mercado continuo. Nuestra base de datos está libre de errores, errores que son de bulto como podrá ver mas abajo, todo este estudio está documentado, es decir, que le podríamos decir, si lo desea que el valor x de la base de datos A, B o C tiene los errores correspondientes dándole las fechas determinadas. Quienes nos conocen saben como trabajamos: intentamos hacer las cosas bien y con cierta seriedad, esta misma actitud la intentamos llevar a este estudio. Tenemos otras bases de datos, pero hemos visto que dada la cantidad de errores que reportaban los programas de chequeo de datos, hemos preferido dejar el estudio en estas cuatro bases de datos. Le podemos decir que bases de datos que venden por mas de 180 Euros ( 30.000 Ptas.) tienen más errores que otras bases de datos que circulan por Internet. El procedimiento que hemos seguido ha sido el siguiente: Hemos recopilado estas bases de datos de diferentes fuentes: páginas web de las propias empresas, envío de dicha base de datos por parte de algún usuario nuestro. Después hemos limpiado estas bases de datos, dejando solo los valores del mercado continuo. A priori, sin entrar a analizar la información en si:
En una base de datos existen diferentes tipos de errores:
Esta opción esta implementada en este programa desde hace muchos años (se ve la importancia que le dan los americanos a la calidad de los datos, pues pusieron a disposición de los usuarios de este programa esta potente herramienta hace mucho tiempo, hace mas de 10 años en las primeras versiones de msdos, ya habia una utilidad para chequear la calidad de los datos). Con esta opción Ud. puede chequear su base de datos. Antes que comience a hacerlo, debemos hacerle algunas puntualizaciones, este programa puede chequear 141 tipos diferentes de errores, dentro de estos errores existen errores de tipo técnico (chequeo de estructura interna de los archivos tipo metastock, etc.), ese tipo de errores a nivel de este estudio no nos preocupa, queremos ver los errores realmente graves que puedan afectar a nuestros indicadores. También existe un error para el programa que es "large change in close" es decir, si el detecta que existe una diferencia superior al 20% entre el cierre de un día y el siguiente día, lo reporta como error, para nuestro estudio tampoco hemos tenido en cuenta este error, pues hay multitud de ocasiones (por uno u otro motivo) donde se da esta circunstancia. Los usuarios de RSIDAT, deben tener en cuenta que sólo deben pasar el test a los valores del mercado continuo, pues por ejemplo, entre las estadísticas avanzadas que difundimos están el número de máximos y número de mínimos (el test le dirá que existe un error en multitud de días y el error consiste en que el cierre es igual a cero, en este caso es obvio que si un día ningún valor marca máximos en sus ultimas 200 sesiones, el cierre debe ser cero). Por eso digo que sólo se debe hacer el estudio a los valores del mercado continuo, gracias a ello podemos comparar la calidad de unas bases de datos a otras. Otro pequeño problema que se va a encontrar al hacer un test, es que el programa sólo admite 2000 errores, es una cifra, me imagino, que los creadores del programa jamás pensaron que se podría alcanzar en una base de datos, por ello cuando se llega a este número de errores, el programa deja de chequear más valores. Ud. mismo podrá comprobar como enseguida, en muchas de estas bases de datos que circulan por internet, se alcanza este número de errores. La solución que Ud. tiene es ir seleccionando de 10 en 10 valores por ejemplo, así con la tecla ctrl. del teclado pulsada, puede ir seleccionando valor a valor con el ratón y cuando tenga unos pocos valores le da a la opción test y podrá ir viendo el resultado por tandas, puede ir apuntando el resultado en una hoja de papel y luego sume los errores. No le aconsejo que imprima los errores pues le saldrán muchas, muchas hojas, piense que en cada hoja como mucho tendrá un report de 55 errores, vea mas abajo la cantidad de errores obtenidos en cada base de datos y se podrá hacer una idea de la cantidad de papel que necesitaría para tener todos los errores impresos. Le anticipo desde ya, que nuestra base de datos desde el año 1986 no tiene ningún error, le digo esto pues para poder hacer un estudio homogéneo, hemos dejado las cuatro bases de datos entre dos fechas determinadas estas fechas han sido desde el 04/01/99 al 30/05/02, hemos escogido estas dos fechas con el fin de poder hacer el estudio de forma homogénea en el tiempo, así las cuatro bases de datos tendrán las mismas sesiones. Le digo esto, pues una vez que haya visto el resultado del estudio, debería hacer una extrapolación, y preguntarse si en tres años y medio que abarca este estudio la base de datos A, por ejemplo tiene x errores; ¿Cuantos errores tendría esa misma base de datos si hubiésemos hecho el estudio desde el año 1990 o desde el año 1986?.
Hemos hecho lo siguiente: Hemos cogido las cuatro bases de datos (entre estas dos fechas), solo con los valores del mercado continuo y lo que hemos hecho ha sido convertir las cuatro bases de datos en formato ascii (formato texto), así tendremos un formato universal para cualquier gestor de bases de datos. Después hemos
ido creando una base de datos en formato dbf, utilizando el programa
foxpro. Así conseguimos que desde un programa preparado por nosotros
puede rastrear valor por valor de cada base de datos, así podríamos
tener en un informe todos los errores: por tipo de error, por valor y
por fechas.
Como ve son errores que no se pueden o no se deberian de dar en una base de datos. El resultado de este chequeo es el siguiente:
Recuerde que en el estudio solo hemos cogido los datos comprendidos entre las fechas: 04/01/99 y 30/05/02. Piense que hubiese pasado si hubiésemos cogido los datos comprendidos entre el año 1990 y el año 2002 por ejemplo. Le aseguramos que nuestra base de datos del mercado continuo tiene cero errores desde el año 1986. Esto se lo podemos demostrar en cualquier momento que pase por nuestras oficinas y delante de Ud. le hacemos un chequeo a dicha base de datos. Si yo, fuese Ud. y viese estos resultados, sinceramente le diría al autor del estudio que no me lo creo...... es normal, que tenga esa actitud, ¿ Cómo va un inversor a utilizar estas bases de datos con semejantes errores ? , es algo ilógico, pues créame que existen inversores particulares que utilizan estas bases de datos y la pena es que tal vez Ud. sea uno de ellos y ni siquiera lo sepa. Como he comentado mas arriba, todos estos errores están documentados para cada valor, aparece la fecha, los datos de ese día y el tipo de error que tiene esa fecha. Si en algún momento pasa por nuestras oficinas se lo podemos mostrar. O si desea que le enviemos por email con cinco o diez errores elegidos al azar de la base de datos de errores que hemos generado despues de hacer este estudio, diganoslo y se los enviamos por email. También hemos detectado que en dos de estas bases de datos faltan 2 días de cotización y en la otra base de datos falta 1 día de cotización, (como es obvio no facilitamos estas fechas), pero estas bases de datos están incompletas también en cuanto a días de cotización. ¿ Cómo puede hacer alguien estudios serios con semejantes bases de datos ?, ¿ Cómo puede alguien hacer sistemas de trading con estas bases de datos ? , No, no piense que los sistemas de trading sólo se aplican a datos en tiempo real tenemos usuarios que tienen sistemas de trading con gráficos semanales, lo que importa es la capacidad de hacer dinero de un sistema y si un sistema en gráficos semanales me da dinero, seria de "tontos" no utilizarlo. Aparte de estos errores, existen otros errores relacionados con el tema de los ajustes realizados en la base de datos, y esos errores si que son graves a nivel económico, pues el usuario se fija soportes y resistencias, por ejemplo, ficticios y eso si le cuesta dinero. Por favor vea el artículo titulado el ! Banco Popular en Máximos históricos ¡ en nuestra sección recursos, apartado artículos, ahí tendrá otro ejemplo real de la calidad de una base de datos.
|
|||||||||||||||||||||||||||||||||||