Task: NLP
Release Date: 6/4/2026
Format: CSV
Size: 16.54 GB
Share
El dataset comprende la totalidad de los buscadores temáticos de la Plataforma Nacional de Transparencia (PNT) de México, extraídos sistemáticamente por el equipo Amnesia durante 2025 ante el riesgo de pérdida ocasionado por la extinción del Instituto Nacional de Transparencia, Acceso a la Información Pública y Protección de Datos Personales (INAI). El archivo contiene 130.4 millones de registros distribuidos en 10 categorías temáticas —Sueldos, Padrón de beneficiarios, Directorio, Contratos, Ejercicio presupuestos, Servicios, Trámites, Presupuesto anual, Servidores sancionados y Resoluciones— y cubre las 32 entidades federativas más la Federación. Los datos abarcan el periodo 2002–2024, con la mayor concentración en los años 2018–2023, cuando el sistema de transparencia alcanzó su madurez digital. La PNT fue el sistema central del modelo de transparencia proactiva establecido por la Ley General de Transparencia de 2016. Sus buscadores temáticos permitían consultar de forma simultánea la información declarada por cientos de sujetos obligados sin necesidad de dirigirse institución por institución. Este dataset preserva ese acervo en su momento de mayor riesgo institucional.
Restrictions/Special Constraints
Ninguna. La información es de carácter público en su origen
Forbidden Usage
No usar para identificar o contactar a personas específicas fuera del contexto de rendición de cuentas
Los campos varían por buscador temático. Campos comunes a la mayoría:
| Campo | Descripción |
|---|---|
| entidadfederativa | Estado o nivel de gobierno (32 entidades + Federación) |
| institucion | Nombre del sujeto obligado que publicó la información |
| anio | Año al que corresponde el registro |
| folder | Categoría temática (Sueldos, Contratos, Directorio, etc.) |
| [campos propios] | Cada temático incluye campos específicos de su obligación |
130.4 millones de registros totales
10 categorías temáticas cubiertas
33 entidades (32 estados + Federación); Jalisco lidera con 37.1 M de registros
75.9% del dataset corresponde a Sueldos (98.9 M de registros)
Pico histórico: 2023 con 35.1 millones de registros; 2019–2023 concentran el 90% del total
16.45 GB de datos estructurados en abierto