Prompt: Realizar una Auditoría de Calidad de Datos

Evalúa la precisión, consistencia y completitud de tus datos para asegurar decisiones confiables y reportes precisos.

Este prompt permite realizar una auditoría profesional de calidad de datos, detectando problemas críticos y proponiendo soluciones prácticas. La versión extendida incluye matriz de validación, scorecard de calidad y plan de remediación, ideales para equipos de Business Intelligence, analítica o gobernanza de datos.

Actúa como auditor de datos. Evalúa la calidad de la información disponible en un sistema o base de datos. # INFORMACIÓN DEL USUARIO - Área o fuente de datos: [FUENTE_DATOS] - Tipo de información contenida: [TIPO_DATOS] - Problemas conocidos o sospechados: [PROBLEMAS] Devuelve: 1) Principales hallazgos de calidad de datos. 2) Indicadores básicos (porcentaje de completitud, duplicados, errores de formato). 3) Acciones iniciales para mejorar la confiabilidad de los datos.
# CONTEXTO Eres consultor senior en gobernanza y calidad de datos. Tu tarea es auditar la calidad de un conjunto de datos empresariales para garantizar precisión, consistencia y confiabilidad en los reportes y decisiones. # ROL Actúas como experto en Data Quality Management. Utilizas metodologías estándar (ISO 8000, DAMA-DMBOK) y frameworks de BI para evaluar, medir y corregir problemas de calidad. # INFORMACIÓN DEL USUARIO - Fuente principal de datos: [FUENTE_DATOS] - Volumen aproximado de registros: [VOLUMEN_REGISTROS] - Herramientas o entornos disponibles: [HERRAMIENTAS] - Frecuencia de actualización: [FRECUENCIA_ACTUALIZACION] - Problemas recurrentes o sospechados: [PROBLEMAS] - Áreas impactadas por la baja calidad de datos: [AREAS_AFECTADAS] # BLOQUES DE RESPUESTA 1. **Diagnóstico de Calidad de Datos** Tabla Markdown con dimensiones evaluadas (Exactitud, Completitud, Consistencia, Unicidad, Actualidad) y hallazgos específicos. 2. **Matriz de Validación y Reglas de Control** Reglas de validación propuestas (campo, tipo de chequeo, umbral aceptable, impacto esperado). 3. **Scorecard de Calidad Global** Cálculo de indicadores agregados (porcentaje de registros válidos, errores detectados, severidad). Incluir representación tipo semáforo: Verde / Amarillo / Rojo. 4. **Plan de Remediación y Gobernanza** Acciones priorizadas con responsables, herramientas y plazos. Incluir tabla: Acción | Responsable | Prioridad | Tiempo estimado | Herramienta sugerida. 5. **Recomendaciones Estratégicas** Estrategias para institucionalizar revisiones periódicas, control automático de calidad y alertas preventivas. # CRITERIOS DE CALIDAD - Debe generar salidas tabulares claras y útiles para reportes ejecutivos. - Los indicadores deben ser medibles y aplicables a cualquier dataset. - El tono debe ser consultivo, con enfoque de mejora continua. - Las recomendaciones deben ser viables en entornos empresariales reales.
# CONTEXTO Eres consultor en gobernanza y calidad de datos. # ROL Eres en Data Quality Management. Utilizas metodologías estándar (ISO 8000, DAMA-DMBOK) y frameworks de BI para evaluar, medir y corregir problemas de calidad. # INFORMACIÓN DEL USUARIO - Fuente principal de datos: [FUENTE_DATOS] - Volumen aproximado de registros: [VOLUMEN_REGISTROS] - Herramientas o entornos disponibles: [HERRAMIENTAS] - Frecuencia de actualización: [FRECUENCIA_ACTUALIZACION] - Problemas recurrentes o sospechados: [PROBLEMAS] - Áreas impactadas por la baja calidad de datos: [AREAS_AFECTADAS] # BLOQUES DE RESPUESTA 1. **Diagnóstico de Calidad de Datos** 2. **Matriz de Validación y Reglas de Control** 3. **Scorecard de Calidad Global** 4. **Plan de Remediación y Gobernanza** 5. **Recomendaciones Estratégicas** # CRITERIOS DE CALIDAD - Debe generar salidas tabulares claras y útiles para reportes ejecutivos. - Los indicadores deben ser medibles y aplicables a cualquier dataset.
Este prompt pertenece a la categoría de Business Intelligence

¿Qué hace el prompt?

Versión Básica

  • Identifica los principales problemas de calidad de datos (faltantes, duplicados, inconsistencias).
  • Propone métricas básicas para evaluar la integridad y exactitud de los datos.
  • Entrega una lista inicial de acciones correctivas prioritarias.

Versión Extendida

  • Identifica los principales problemas de calidad de datos (faltantes, duplicados, inconsistencias).
  • Propone métricas básicas para evaluar la integridad y exactitud de los datos.
  • Entrega una lista inicial de acciones correctivas prioritarias.
  • Desarrolla una metodología de auditoría completa basada en dimensiones de calidad (exactitud, completitud, unicidad, consistencia, actualidad).
  • Construye una matriz de validación con métricas, umbrales y fórmulas de medición.
  • Crea un scorecard de calidad global con semáforo visual y promedio ponderado.
  • Propone un plan de remediación priorizado con responsables, herramientas y tiempos de corrección.

Versión Eficiente

  • Desarrolla una metodología de auditoría completa basada en dimensiones de calidad (exactitud, completitud, unicidad, consistencia, actualidad)
  • Construye una matriz de validación con métricas, umbrales y fórmulas de medición
  • Crea un scorecard de calidad global con semáforo visual y promedio ponderado

¿Cómo usar este prompt?

Versión Básica

  • Completa las variables antes de ejecutar el prompt:
  • [FUENTE_DATOS] Ejemplo: 'Base de clientes en CRM Salesforce'.
  • [TIPO_DATOS] Ejemplo: 'contactos, ventas y regiones'.
  • [PROBLEMAS] Ejemplo: 'duplicados frecuentes y campos incompletos'.

Versión Extendida

  • Completa: [FUENTE_DATOS], [VOLUMEN_REGISTROS], [HERRAMIENTAS], [FRECUENCIA_ACTUALIZACION], [PROBLEMAS], [AREAS_AFECTADAS].
  • Ejemplo: [FUENTE_DATOS] = 'ERP financiero'; [VOLUMEN_REGISTROS] = '250k registros'; [HERRAMIENTAS] = 'SQL + Power BI'; [FRECUENCIA_ACTUALIZACION] = 'diaria'; [PROBLEMAS] = 'errores de duplicado'; [AREAS_AFECTADAS] = 'reportes financieros mensuales'.

Versión Eficiente

  • Completa: [FUENTE_DATOS], [VOLUMEN_REGISTROS], [HERRAMIENTAS], [FRECUENCIA_ACTUALIZACION], [PROBLEMAS], [AREAS_AFECTADAS]
  • Ejemplo: [FUENTE_DATOS] = 'ERP financiero'; [VOLUMEN_REGISTROS] = '250k registros'; [HERRAMIENTAS] = 'SQL + Power BI'; [FRECUENCIA_ACTUALIZACION] = 'diaria'; [PROBLEMAS] = 'errores de duplicado'; [AREAS_AFECTADAS] = 'reportes financieros mensuales'

Tips

Versión Básica

  • Especifica el tipo de datos o área (ventas, clientes, operaciones).
  • Incluye el formato o fuente principal (base SQL, hoja de cálculo, CRM).
  • Solicita ejemplos concretos de reglas de validación o campos críticos.

Versión Extendida

  • Proporciona volúmenes estimados de datos para definir el muestreo adecuado.
  • Indica las herramientas disponibles (SQL, Power BI, Excel, Python).
  • Puedes solicitar que la salida incluya tablas Markdown para el reporte ejecutivo.

Versión Eficiente

  • Proporciona volúmenes estimados de datos para definir el muestreo adecuado
  • Indica las herramientas disponibles (SQL, Power BI, Excel, Python)
  • Puedes solicitar que la salida incluya tablas Markdown para el reporte ejecutivo

¿Para quién es?

Es ideal para analistas de datos, líderes de BI, administradores de bases de datos y cualquier profesional que necesite garantizar que la información usada para reportes o modelos sea confiable. También es útil para equipos de gobernanza que buscan estandarizar procesos de validación en áreas como ventas, clientes u operaciones.

¿Qué problema resuelve?

Ayuda a detectar datos incompletos, duplicados o inconsistentes que suelen filtrarse en sistemas como CRMs o hojas de cálculo. Sin una auditoría clara, estos errores generan reportes engañosos, decisiones mal fundamentadas y pérdida de tiempo en correcciones. Este enfoque entrega métricas concretas y acciones prioritarias para limpiar la información de raíz.

Casos de uso prácticos

  • Auditar una base de clientes en Salesforce para identificar contactos duplicados y campos vacíos como teléfono o industria.
  • Revisar la consistencia de datos de ventas entre un CRM y un data warehouse, detectando diferencias en montos o fechas.
  • Evaluar la integridad de registros operativos en hojas de cálculo, señalando filas incompletas o valores fuera de rango.
  • Establecer reglas de validación para un proceso ETL que cargue datos de regiones y productos desde múltiples fuentes.

Consejos para mejores resultados

  • Especifica el tipo de datos (ventas, clientes, operaciones) y la fuente principal (base SQL, hoja de cálculo, CRM) para obtener un análisis más preciso.
  • Incluye ejemplos concretos de reglas de validación o campos críticos, como "el campo email no debe estar vacío" o "el monto debe ser mayor a cero".
  • Define los problemas más recurrentes (duplicados, faltantes, inconsistencias) para que el prompt priorice las acciones correctivas adecuadas.