El problema de la contrastación de los resultados

Siempre que trabajamos sobre el modelo de datos y desarrollamos el script de carga llega un momento en que debemos contrastar los resultados con los datos tal y como se encuentran en las fuentes de datos originales. Habitualmente este proceso es manual pero en este post intentamos revisar el proceso con el fin de automatizarlo y descubrir cuanto antes inexactitudes.

Así, cada juego de pruebas debe cubrir dos áreas:

  • Datos individuales. Contrastar con las pantallas de entrada de datos del software que utilice el cliente, procurando en contrar dos tipos de casos:
    • Normales.
    • Extraordinarios.
  • Grandes números. Cuando se trata de agrupar los datos en función de los criterios seleccionados, tratremos de contrastar con los reportes que las aplicaciones ofrecen.
    • Contrastar selecciones de diferentes dimensiones.

Datos individuales

Los datos individuales pueden contrastarse en función de su naturaleza:

  • Normales, los más sencillos de revisar. Buscaremos en el software del cliente las pantallas con los datos individuales y comprobaremos que casan con las selecciones en el cuadro de mando.
  • Extraordinarios. En este caso son menos evidentes y necesitaremos consultar al cliente para que nos informe cuáles son aquellos casos especiales, bien por estar condicionados a datos externos a la herramienta (hojas Excel, etc) bien por utilizar funcionalidades especiales en la aplicación. En gran parte podemos identificar estos casos antes de pasar las pruebas, pero éstas han de considerarlos.

La búsqueda de datos que no se ajustan a los patrones normales se resolverán de varias formas en el script:

  • Ajustando la casuística incluyendo un tratamiento especial para dichos datos en el script.
  • Eliminando los casos especiales.
  • Enlazando con otras tablas que eliminen la ambigüedad de los datos mal categorizados.

En todos los casos se deberá documentarlo para que quede claro cuáles son las decisiones tomadas a la hora de valorar los datos para hacer fácil futuras revisiones del script.

Grandes números

En el caso de los grandes números se contrastarán con los reportes de las aplicaciones (ERP, CRM etc.) de las que se alimentan los datos. Buscando la segmentación con las diferentes dimensiones que ha seleccionado el cliente para el cuadro de mando.
En este caso podemos hablar de dos tipos de errores:

  • Errores de agrupación.
  • Errores de tratamiento de datos individuales.

En cualquier caso debemos volver al examen de los datos individuales para implantar las soluciones adecuadas.

Esquema general

Este proceso vendría a ser:

Proceso de verificación

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

w

Conectando a %s

Anuncios
A %d blogueros les gusta esto: