Skip to main content
home

/ VALIDA TUS DATOS

VALIDA TUS DATOS

La información que encontrarás aquí te ayudará a validar o mejorar la estructura de tus datos, lo cual tiene los siguientes beneficios:

  1. Podrás cruzar tu información con otra información del Repositorio Ciudadano de Datos Abiertos.
  2. Podrás generar gráficas y mapas interactivos de tu conjunto de datos con la herramienta de visualización.
  3. Tus datos podrán aprovecharse de manera más efectiva por otras personas que utilicen o colaboren en la plataforma.

A continuación encontrarás una guía que te ayudarán a mejorar y validar que la estructura de tus datos sea la adecuada.

Guías y plantillas para mejorar tus datos
  • 1
    Plantilla general

    Descarga la plantilla con recomendaciones de la estructura general de una base de datos.

    Consultarflecha
  • next

  • 2
    Catálogos de referencia

    Si tus datos tienen algún componente espacial valida que se ajuste a los catálogos.

    Consultarflecha
  • next

  • 3
    Mejora tus fechas

    Si tus datos tienen fechas o un componente temporal valida el formato.

    Consultarflecha
  • Valida y publica tus datos
  • 4
    Validador de datos

    Valida tus datos con nuestra herramienta para asegurarte de que se pueden cruzar.

    Consultarflecha
PLANTILLA GENERAL

Para que tus datos sean más fáciles de interpretar, procesar y utilizar es importante seguir una serie de recomendaciones en cuanto a su estructura y el contenido de sus columnas.

A continuación podrás descargar una plantilla general que te servirá como guía para subir tus datos.

archivo-descarga

Plantilla general de datos

Consulta también las siguientes recomendaciones generales para tus bases de datos:

Contenido de las columnas
  1. Para columnas de texto:
    1. En la medida de lo posible, recomendamos que tus columnas de texto tengan un catálogo reducido de posibles valores. Revisa con detenimiento si existen faltas de ortografía o errores de escritura.
    2. Las base de datos debe estar codificada en UTF-8 para evitar errores de interpretación de caracteres especiales (alternativamente puedes cargar tu info sin acentos).
  2. Para columnas numéricas:
    1. Los valores nulos de las variables numéricas deberán estar marcados como "NaN".
  3. Para columnas de georeferenciación:
    1. La georeferenciación debe estar en dos columnas separadas llamadas "latitud" y "longitud".
    2. Las columnas de georeferencia de latitud y longitud deben ser de formato numérico; aquellas que especifiquen nombres de alcaldías, colonias, localidades o AGEBs deben ser en formato de texto.
Estructura de la base
  1. Nombre de las columnas:
    1. En minúsculas, sin espacios ni acentos (sustituir los espacios por guiones bajos).
    2. No pueden repetirse los nombres de las columnas.
  2. Estructura de categorías:
    1. Es recomendable que tus datos esten en formato largo (long) que ancho (wide).

Para más detalles sobre la estructura correcta de las bases puedes descargar la guía completa de validación de datos.

CATÁLOGOS DE REFERENCIA

Los catálogos de referencia son es un documentos que contienen información sobre las opciones de los valores que puede tomar cada campo o atributo en una base de datos.

A continuación podrás descargar la plantilla de datos geográficos:

archivo-descarga

Plantilla de datos geográficos

Desagregaciones geográficas de la Ciudad de México

La Ciudad de México puede dividirse en distintas regiones geográficas dependiendo del uso y origen de los datos. Ajustar tus datos a los catálogos que se presentan a continuación te permitirá hacer tu información comparable con la información disponible en el Portal de Datos Abiertos.

Descarga los siguientes catálogos de referencia para ajustar tu información.

archivo-descarga

Catálogo de Alcaldías de la Ciudad de México

archivo-descarga

Catálogo de Colonias de la Ciudad de México

archivo-descarga

Catálogo de Localidades de la Ciudad de México

archivo-descarga

Catálogo de AGEB's de la Ciudad de México

Para más detalles sobre los catálogos de referencia puedes descargar la guía completa de validación de datos.

MEJORA TUS FECHAS

Como un estándar para el repositorio, es importante que las columnas de fecha en tus datos tengan el formato año-mes-día (aaaa-mm-dd), esto permitirá generar gráficas de lineas de tendencia (si así se desea) y cruzar tu base con otros datos del Repositorio Ciudadano de Datos Abiertos que también tengan un componente temporal.

Consulta el siguiente video para más detalles.

 

Si tus datos no están desagregados de manera diaria sino por otra frecuencia temporal (semana, mensual, etc.) te recomendamos incluir una columna con la fecha de cierre de periodo en formato aaaa-mm-dd como referecnia para el visualizador.

Para más detalles sobre los formatos de fechas puedes descargar la guía completa con ejemplos.

VALIDADOR DE DATOS

Aqui podrás utilizar nuestra herramienta de validación para obtener un diagnóstico de qué tan bien estructurado se encuentra tu archivo.

En caso de que tus datos no se ajusten completamente a los estándares descritos en esta guía, es posible que tus datos no se visualicen correctamente y no puedas cruzarlos con la información del Repositorio Ciudadano de Datos Abiertos.

En caso de que el resultado de la validación no sea favorable, es altamente recomendable hacer las modificaciones necesarias de acuerdo con esta guía y validar de nuevo tu archivo.