Prompt para Limpiar y Normalizar Datos en Hojas de Cálculo
Estandariza y depura datos en Excel o Google Sheets con pasos claros para eliminar duplicados, corregir formatos y asegurar calidad antes del análisis.
Actúa como especialista en limpieza de datos. Define un plan simple para estandarizar y depurar mi hoja de cálculo.
#INFORMACIÓN DEL USUARIO:
- Descripción del dataset: [DESCRIPCION]
- Columnas y tipos esperados: [COLUMNAS_TIPOS]
- Problemas frecuentes detectados: [PROBLEMAS]
- Herramienta (Excel o Sheets): [HERRAMIENTA]
Devuelve: 1) Pasos de limpieza en orden. 2) Fórmulas o funciones básicas sugeridas. 3) Reglas de validación. 4) Checklist final.
Eres consultor en calidad de datos para negocios. Diseña un proceso avanzado de limpieza y normalización con validaciones robustas y trazabilidad.
#INFORMACIÓN DEL USUARIO:
- Descripción del dataset: [DESCRIPCION]
- Columnas y tipos esperados: [COLUMNAS_TIPOS]
- Reglas de negocio y estándares: [REGLAS_NEGOCIO]
- Herramienta (Excel o Sheets): [HERRAMIENTA]
- Volumen y frecuencia de actualización: [VOLUMEN_FRECUENCIA]
Devuelve: 1) Arquitectura de hojas (RAW/LIMPIO/ERRORES/DICCIONARIOS). 2) Reglas avanzadas (con regex donde aplique). 3) Fórmulas/consultas (FILTRAR/QUERY, TEXTSPLIT, etc.). 4) Bitácora y métricas de calidad. 5) Guía de operación repetible.
Este prompt pertenece a la categoría de Excel y Hojas de Cálculo
¿Qué hace el prompt?
Versión Básica
- Propone un flujo básico de limpieza: trim, mayúsculas/minúsculas, fechas y duplicados.
- Sugiere validaciones simples y reglas de formato consistente.
- Entrega una lista de control para verificar la calidad final.
Versión Extendida
- Propone un flujo básico de limpieza: trim, mayúsculas/minúsculas, fechas y duplicados.
- Sugiere validaciones simples y reglas de formato consistente.
- Entrega una lista de control para verificar la calidad final.
- Construye un pipeline de limpieza con pasos reproducibles y documentados.
- Usa funciones avanzadas y regex para validaciones complejas (patrones de email, códigos, teléfonos).
- Crea diccionarios de estandarización (mapeo de categorías/estados).
- Genera hoja de bitácora (errores detectados, fila/columna, acción sugerida) y métricas de calidad.
¿Cómo usar este prompt?
Versión Básica
- Copia y pega el prompt en tu modelo de IA favorito.
- Completa todas las variables con tu caso real:
- [DESCRIPCION] Ej.: 'listado de clientes con emails y fechas de alta'.
- [COLUMNAS_TIPOS] Ej.: 'nombre(texto), email(texto), alta(fecha)'.
- [PROBLEMAS] Ej.: 'espacios extra, emails inválidos, fechas inconsistentes'.
- [HERRAMIENTA] Ej.: 'Google Sheets'.
Versión Extendida
- Copia y pega el prompt en tu modelo de IA favorito.
- Rellena todas las variables con tu caso real:
- [DESCRIPCION] Ej.: 'transacciones de e-commerce con SKU, precio, cliente, país'.
- [COLUMNAS_TIPOS] Ej.: 'sku(texto), precio(número), cliente(texto), pais(texto)'.
- [REGLAS_NEGOCIO] Ej.: 'precio > 0, país ISO-2, email válido'.
- [HERRAMIENTA] Ej.: 'Excel'.
- [VOLUMEN_FRECUENCIA] Ej.: '50k filas mensuales; actualización semanal'.
Tips
Versión Básica
- Trabaja sobre una copia de los datos originales.
- Establece encabezados claros y tipos de dato por columna.
- Aplica validación de datos para evitar nuevos errores.
Versión Extendida
- Separa hojas: RAW, LIMPIO, ERRORES y DICCIONARIOS.
- Usa tablas estructuradas/rangos con nombre para mantener trazabilidad.
- Incluye pruebas con datos límite y actualiza métricas de calidad cada carga.