Méthodologie
Comment nous collectons, traitons et présentons les données sur DatiItalia.
Introduction
DatiItalia collecte des données auprès de sources officielles italiennes et européennes. Cette page explique nos sources, nos processus de traitement et nos choix méthodologiques.
Sources des données
- ISTAT — Institut national italien de statistique (istat.it). Jeux de données : POSAS (population résidente par âge et sexe, via l'API SDMX, mise à jour annuelle, dernière année 2026), la série censitaire historique 8milaCensus 1951-2011 et le bilan démographique (naissances, décès, solde). Couvre la population résidente, la structure par âge, le solde migratoire et la répartition par sexe de toutes les communes.
- MEF — Ministère de l'Économie et des Finances, Département des Finances (finanze.gov.it). Jeu de données : déclarations de revenus des personnes physiques par commune (open data annuel, dernière année fiscale 2023). Revenu moyen et médian, répartition par tranches de revenus, nombre de contribuables.
- ISPRA — Institut supérieur pour la protection et la recherche environnementale (isprambiente.gov.it). Jeu de données : Rapport sur la consommation des sols (édition 2024, mise à jour annuelle). Surface consommée en hectares et pourcentage de consommation par commune.
- EEA — Agence européenne pour l'environnement (eea.europa.eu). Jeu de données : qualité de l'air interpolée sur grille (dernière année disponible 2022, mise à jour annuelle). Concentrations moyennes annuelles de PM2.5, PM10, NO2 et ozone pour les communes couvertes par le suivi.
Couverture
DatiItalia couvre les 7 904 communes italiennes. Pour chacune, nous publions les données disponibles dans les sources officielles : population et indicateurs démographiques pour la totalité des communes, revenus pour les communes avec des déclarations enregistrées au MEF, données environnementales pour les communes couvertes par le suivi ISPRA/EEA. La page de chaque commune indique l'année de référence de chaque donnée.
Fréquence de mise à jour
Le pipeline de données s'exécute automatiquement chaque semaine et intègre les nouvelles publications des sources : l'ISTAT publie la population annuellement (plus des bilans démographiques mensuels provisoires), le MEF les revenus une fois par an, l'ISPRA la consommation des sols une fois par an, l'EEA la qualité de l'air une fois par an. La date de dernière mise à jour de chaque jeu de données figure en bas de chaque page de commune.
Traitement des données
Les données brutes sont automatiquement téléchargées depuis les sources officielles, normalisées et stockées dans une base de données PostgreSQL. Le processus de mise à jour s'exécute chaque semaine via des scripts automatisés, et chaque jeu de données conserve sa provenance (source, URL et date d'acquisition), également exposée via l'API publique.
Indice de qualité de vie
L'indice de qualité de vie est un indice composite calculé comme moyenne pondérée de cinq dimensions : Revenus (30 %), Environnement (25 %), Services (20 %), Démographie (15 %), Sécurité (10 %). Chaque dimension est normalisée sur une échelle de 0 à 100.
Limites
Les données présentent certaines limites : toutes les communes ne disposent pas de données complètes pour chaque indicateur ; les données environnementales ne sont disponibles que pour les villes surveillées ; les mises à jour ont des fréquences différentes selon la source.