Prompt para Realizar una Auditoría de Calidad de Datos

Evalúa la precisión, consistencia y completitud de tus datos para asegurar decisiones confiables y reportes precisos.

Este prompt permite realizar una auditoría profesional de calidad de datos, detectando problemas críticos y proponiendo soluciones prácticas. La versión extendida incluye matriz de validación, scorecard de calidad y plan de remediación, ideales para equipos de Business Intelligence, analítica o gobernanza de datos.

Actúa como auditor de datos. Evalúa la calidad de la información disponible en un sistema o base de datos. # INFORMACIÓN DEL USUARIO - Área o fuente de datos: [FUENTE_DATOS] - Tipo de información contenida: [TIPO_DATOS] - Problemas conocidos o sospechados: [PROBLEMAS] Devuelve: 1) Principales hallazgos de calidad de datos. 2) Indicadores básicos (porcentaje de completitud, duplicados, errores de formato). 3) Acciones iniciales para mejorar la confiabilidad de los datos.
# CONTEXTO Eres consultor senior en gobernanza y calidad de datos. Tu tarea es auditar la calidad de un conjunto de datos empresariales para garantizar precisión, consistencia y confiabilidad en los reportes y decisiones. # ROL Actúas como experto en Data Quality Management. Utilizas metodologías estándar (ISO 8000, DAMA-DMBOK) y frameworks de BI para evaluar, medir y corregir problemas de calidad. # INFORMACIÓN DEL USUARIO - Fuente principal de datos: [FUENTE_DATOS] - Volumen aproximado de registros: [VOLUMEN_REGISTROS] - Herramientas o entornos disponibles: [HERRAMIENTAS] - Frecuencia de actualización: [FRECUENCIA_ACTUALIZACION] - Problemas recurrentes o sospechados: [PROBLEMAS] - Áreas impactadas por la baja calidad de datos: [AREAS_AFECTADAS] # BLOQUES DE RESPUESTA 1. **Diagnóstico de Calidad de Datos** Tabla Markdown con dimensiones evaluadas (Exactitud, Completitud, Consistencia, Unicidad, Actualidad) y hallazgos específicos. 2. **Matriz de Validación y Reglas de Control** Reglas de validación propuestas (campo, tipo de chequeo, umbral aceptable, impacto esperado). 3. **Scorecard de Calidad Global** Cálculo de indicadores agregados (porcentaje de registros válidos, errores detectados, severidad). Incluir representación tipo semáforo: Verde / Amarillo / Rojo. 4. **Plan de Remediación y Gobernanza** Acciones priorizadas con responsables, herramientas y plazos. Incluir tabla: Acción | Responsable | Prioridad | Tiempo estimado | Herramienta sugerida. 5. **Recomendaciones Estratégicas** Estrategias para institucionalizar revisiones periódicas, control automático de calidad y alertas preventivas. # CRITERIOS DE CALIDAD - Debe generar salidas tabulares claras y útiles para reportes ejecutivos. - Los indicadores deben ser medibles y aplicables a cualquier dataset. - El tono debe ser consultivo, con enfoque de mejora continua. - Las recomendaciones deben ser viables en entornos empresariales reales.
Este prompt pertenece a la categoría de Business Intelligence

¿Qué hace el prompt?

Versión Básica

  • Identifica los principales problemas de calidad de datos (faltantes, duplicados, inconsistencias).
  • Propone métricas básicas para evaluar la integridad y exactitud de los datos.
  • Entrega una lista inicial de acciones correctivas prioritarias.

Versión Extendida

  • Identifica los principales problemas de calidad de datos (faltantes, duplicados, inconsistencias).
  • Propone métricas básicas para evaluar la integridad y exactitud de los datos.
  • Entrega una lista inicial de acciones correctivas prioritarias.
  • Desarrolla una metodología de auditoría completa basada en dimensiones de calidad (exactitud, completitud, unicidad, consistencia, actualidad).
  • Construye una matriz de validación con métricas, umbrales y fórmulas de medición.
  • Crea un scorecard de calidad global con semáforo visual y promedio ponderado.
  • Propone un plan de remediación priorizado con responsables, herramientas y tiempos de corrección.

¿Cómo usar este prompt?

Versión Básica

  • Completa las variables antes de ejecutar el prompt:
  • [FUENTE_DATOS] Ejemplo: 'Base de clientes en CRM Salesforce'.
  • [TIPO_DATOS] Ejemplo: 'contactos, ventas y regiones'.
  • [PROBLEMAS] Ejemplo: 'duplicados frecuentes y campos incompletos'.

Versión Extendida

  • Completa: [FUENTE_DATOS], [VOLUMEN_REGISTROS], [HERRAMIENTAS], [FRECUENCIA_ACTUALIZACION], [PROBLEMAS], [AREAS_AFECTADAS].
  • Ejemplo: [FUENTE_DATOS] = 'ERP financiero'; [VOLUMEN_REGISTROS] = '250k registros'; [HERRAMIENTAS] = 'SQL + Power BI'; [FRECUENCIA_ACTUALIZACION] = 'diaria'; [PROBLEMAS] = 'errores de duplicado'; [AREAS_AFECTADAS] = 'reportes financieros mensuales'.

Tips

Versión Básica

  • Especifica el tipo de datos o área (ventas, clientes, operaciones).
  • Incluye el formato o fuente principal (base SQL, hoja de cálculo, CRM).
  • Solicita ejemplos concretos de reglas de validación o campos críticos.

Versión Extendida

  • Proporciona volúmenes estimados de datos para definir el muestreo adecuado.
  • Indica las herramientas disponibles (SQL, Power BI, Excel, Python).
  • Puedes solicitar que la salida incluya tablas Markdown para el reporte ejecutivo.