Prompt: Realizar una Auditoría de Calidad de Datos
Este prompt permite realizar una auditoría profesional de calidad de datos, detectando problemas críticos y proponiendo soluciones prácticas. La versión extendida incluye matriz de validación, scorecard de calidad y plan de remediación, ideales para equipos de Business Intelligence, analítica o gobernanza de datos.
¿Qué hace el prompt?
Versión Básica
- Identifica los principales problemas de calidad de datos (faltantes, duplicados, inconsistencias).
- Propone métricas básicas para evaluar la integridad y exactitud de los datos.
- Entrega una lista inicial de acciones correctivas prioritarias.
Versión Extendida
- Identifica los principales problemas de calidad de datos (faltantes, duplicados, inconsistencias).
- Propone métricas básicas para evaluar la integridad y exactitud de los datos.
- Entrega una lista inicial de acciones correctivas prioritarias.
- Desarrolla una metodología de auditoría completa basada en dimensiones de calidad (exactitud, completitud, unicidad, consistencia, actualidad).
- Construye una matriz de validación con métricas, umbrales y fórmulas de medición.
- Crea un scorecard de calidad global con semáforo visual y promedio ponderado.
- Propone un plan de remediación priorizado con responsables, herramientas y tiempos de corrección.
Versión Eficiente
- Desarrolla una metodología de auditoría completa basada en dimensiones de calidad (exactitud, completitud, unicidad, consistencia, actualidad)
- Construye una matriz de validación con métricas, umbrales y fórmulas de medición
- Crea un scorecard de calidad global con semáforo visual y promedio ponderado
¿Cómo usar este prompt?
Versión Básica
- Completa las variables antes de ejecutar el prompt:
- [FUENTE_DATOS] Ejemplo: 'Base de clientes en CRM Salesforce'.
- [TIPO_DATOS] Ejemplo: 'contactos, ventas y regiones'.
- [PROBLEMAS] Ejemplo: 'duplicados frecuentes y campos incompletos'.
Versión Extendida
- Completa: [FUENTE_DATOS], [VOLUMEN_REGISTROS], [HERRAMIENTAS], [FRECUENCIA_ACTUALIZACION], [PROBLEMAS], [AREAS_AFECTADAS].
- Ejemplo: [FUENTE_DATOS] = 'ERP financiero'; [VOLUMEN_REGISTROS] = '250k registros'; [HERRAMIENTAS] = 'SQL + Power BI'; [FRECUENCIA_ACTUALIZACION] = 'diaria'; [PROBLEMAS] = 'errores de duplicado'; [AREAS_AFECTADAS] = 'reportes financieros mensuales'.
Versión Eficiente
- Completa: [FUENTE_DATOS], [VOLUMEN_REGISTROS], [HERRAMIENTAS], [FRECUENCIA_ACTUALIZACION], [PROBLEMAS], [AREAS_AFECTADAS]
- Ejemplo: [FUENTE_DATOS] = 'ERP financiero'; [VOLUMEN_REGISTROS] = '250k registros'; [HERRAMIENTAS] = 'SQL + Power BI'; [FRECUENCIA_ACTUALIZACION] = 'diaria'; [PROBLEMAS] = 'errores de duplicado'; [AREAS_AFECTADAS] = 'reportes financieros mensuales'
Tips
Versión Básica
- Especifica el tipo de datos o área (ventas, clientes, operaciones).
- Incluye el formato o fuente principal (base SQL, hoja de cálculo, CRM).
- Solicita ejemplos concretos de reglas de validación o campos críticos.
Versión Extendida
- Proporciona volúmenes estimados de datos para definir el muestreo adecuado.
- Indica las herramientas disponibles (SQL, Power BI, Excel, Python).
- Puedes solicitar que la salida incluya tablas Markdown para el reporte ejecutivo.
Versión Eficiente
- Proporciona volúmenes estimados de datos para definir el muestreo adecuado
- Indica las herramientas disponibles (SQL, Power BI, Excel, Python)
- Puedes solicitar que la salida incluya tablas Markdown para el reporte ejecutivo
¿Para quién es?
Es ideal para analistas de datos, líderes de BI, administradores de bases de datos y cualquier profesional que necesite garantizar que la información usada para reportes o modelos sea confiable. También es útil para equipos de gobernanza que buscan estandarizar procesos de validación en áreas como ventas, clientes u operaciones.
¿Qué problema resuelve?
Ayuda a detectar datos incompletos, duplicados o inconsistentes que suelen filtrarse en sistemas como CRMs o hojas de cálculo. Sin una auditoría clara, estos errores generan reportes engañosos, decisiones mal fundamentadas y pérdida de tiempo en correcciones. Este enfoque entrega métricas concretas y acciones prioritarias para limpiar la información de raíz.
Casos de uso prácticos
- Auditar una base de clientes en Salesforce para identificar contactos duplicados y campos vacíos como teléfono o industria.
- Revisar la consistencia de datos de ventas entre un CRM y un data warehouse, detectando diferencias en montos o fechas.
- Evaluar la integridad de registros operativos en hojas de cálculo, señalando filas incompletas o valores fuera de rango.
- Establecer reglas de validación para un proceso ETL que cargue datos de regiones y productos desde múltiples fuentes.
Consejos para mejores resultados
- Especifica el tipo de datos (ventas, clientes, operaciones) y la fuente principal (base SQL, hoja de cálculo, CRM) para obtener un análisis más preciso.
- Incluye ejemplos concretos de reglas de validación o campos críticos, como "el campo email no debe estar vacío" o "el monto debe ser mayor a cero".
- Define los problemas más recurrentes (duplicados, faltantes, inconsistencias) para que el prompt priorice las acciones correctivas adecuadas.