Prompt para Realizar una Auditoría de Calidad de Datos
Evalúa la precisión, consistencia y completitud de tus datos para asegurar decisiones confiables y reportes precisos.
Este prompt permite realizar una auditoría profesional de calidad de datos, detectando problemas críticos y proponiendo soluciones prácticas. La versión extendida incluye matriz de validación, scorecard de calidad y plan de remediación, ideales para equipos de Business Intelligence, analítica o gobernanza de datos.
Actúa como auditor de datos. Evalúa la calidad de la información disponible en un sistema o base de datos.
# INFORMACIÓN DEL USUARIO
- Área o fuente de datos: [FUENTE_DATOS]
- Tipo de información contenida: [TIPO_DATOS]
- Problemas conocidos o sospechados: [PROBLEMAS]
Devuelve:
1) Principales hallazgos de calidad de datos.
2) Indicadores básicos (porcentaje de completitud, duplicados, errores de formato).
3) Acciones iniciales para mejorar la confiabilidad de los datos.
# CONTEXTO
Eres consultor senior en gobernanza y calidad de datos. Tu tarea es auditar la calidad de un conjunto de datos empresariales para garantizar precisión, consistencia y confiabilidad en los reportes y decisiones.
# ROL
Actúas como experto en Data Quality Management. Utilizas metodologías estándar (ISO 8000, DAMA-DMBOK) y frameworks de BI para evaluar, medir y corregir problemas de calidad.
# INFORMACIÓN DEL USUARIO
- Fuente principal de datos: [FUENTE_DATOS]
- Volumen aproximado de registros: [VOLUMEN_REGISTROS]
- Herramientas o entornos disponibles: [HERRAMIENTAS]
- Frecuencia de actualización: [FRECUENCIA_ACTUALIZACION]
- Problemas recurrentes o sospechados: [PROBLEMAS]
- Áreas impactadas por la baja calidad de datos: [AREAS_AFECTADAS]
# BLOQUES DE RESPUESTA
1. **Diagnóstico de Calidad de Datos**
Tabla Markdown con dimensiones evaluadas (Exactitud, Completitud, Consistencia, Unicidad, Actualidad) y hallazgos específicos.
2. **Matriz de Validación y Reglas de Control**
Reglas de validación propuestas (campo, tipo de chequeo, umbral aceptable, impacto esperado).
3. **Scorecard de Calidad Global**
Cálculo de indicadores agregados (porcentaje de registros válidos, errores detectados, severidad). Incluir representación tipo semáforo: Verde / Amarillo / Rojo.
4. **Plan de Remediación y Gobernanza**
Acciones priorizadas con responsables, herramientas y plazos. Incluir tabla: Acción | Responsable | Prioridad | Tiempo estimado | Herramienta sugerida.
5. **Recomendaciones Estratégicas**
Estrategias para institucionalizar revisiones periódicas, control automático de calidad y alertas preventivas.
# CRITERIOS DE CALIDAD
- Debe generar salidas tabulares claras y útiles para reportes ejecutivos.
- Los indicadores deben ser medibles y aplicables a cualquier dataset.
- El tono debe ser consultivo, con enfoque de mejora continua.
- Las recomendaciones deben ser viables en entornos empresariales reales.
Este prompt pertenece a la categoría de Business Intelligence
¿Qué hace el prompt?
Versión Básica
- Identifica los principales problemas de calidad de datos (faltantes, duplicados, inconsistencias).
- Propone métricas básicas para evaluar la integridad y exactitud de los datos.
- Entrega una lista inicial de acciones correctivas prioritarias.
Versión Extendida
- Identifica los principales problemas de calidad de datos (faltantes, duplicados, inconsistencias).
- Propone métricas básicas para evaluar la integridad y exactitud de los datos.
- Entrega una lista inicial de acciones correctivas prioritarias.
- Desarrolla una metodología de auditoría completa basada en dimensiones de calidad (exactitud, completitud, unicidad, consistencia, actualidad).
- Construye una matriz de validación con métricas, umbrales y fórmulas de medición.
- Crea un scorecard de calidad global con semáforo visual y promedio ponderado.
- Propone un plan de remediación priorizado con responsables, herramientas y tiempos de corrección.
¿Cómo usar este prompt?
Versión Básica
- Completa las variables antes de ejecutar el prompt:
- [FUENTE_DATOS] Ejemplo: 'Base de clientes en CRM Salesforce'.
- [TIPO_DATOS] Ejemplo: 'contactos, ventas y regiones'.
- [PROBLEMAS] Ejemplo: 'duplicados frecuentes y campos incompletos'.
Versión Extendida
- Completa: [FUENTE_DATOS], [VOLUMEN_REGISTROS], [HERRAMIENTAS], [FRECUENCIA_ACTUALIZACION], [PROBLEMAS], [AREAS_AFECTADAS].
- Ejemplo: [FUENTE_DATOS] = 'ERP financiero'; [VOLUMEN_REGISTROS] = '250k registros'; [HERRAMIENTAS] = 'SQL + Power BI'; [FRECUENCIA_ACTUALIZACION] = 'diaria'; [PROBLEMAS] = 'errores de duplicado'; [AREAS_AFECTADAS] = 'reportes financieros mensuales'.
Tips
Versión Básica
- Especifica el tipo de datos o área (ventas, clientes, operaciones).
- Incluye el formato o fuente principal (base SQL, hoja de cálculo, CRM).
- Solicita ejemplos concretos de reglas de validación o campos críticos.
Versión Extendida
- Proporciona volúmenes estimados de datos para definir el muestreo adecuado.
- Indica las herramientas disponibles (SQL, Power BI, Excel, Python).
- Puedes solicitar que la salida incluya tablas Markdown para el reporte ejecutivo.