Zum Hauptinhalt springen

Methodik

Wie wir Daten auf DatiItalia sammeln, verarbeiten und präsentieren.

Einleitung

DatiItalia sammelt Daten aus offiziellen italienischen und europäischen Quellen. Diese Seite erläutert unsere Quellen, Verarbeitungsprozesse und methodischen Entscheidungen.

Datenquellen

  • ISTAT — Italienisches Nationales Statistikinstitut (istat.it). Datensätze: POSAS (Wohnbevölkerung nach Alter und Geschlecht, über die SDMX-API, jährliche Aktualisierung, letztes Jahr 2026), die historische Zensusreihe 8milaCensus 1951-2011 und die demografische Bilanz (Geburten, Sterbefälle, Saldo). Deckt Wohnbevölkerung, Altersstruktur, Wanderungssaldo und Geschlechterverteilung aller Gemeinden ab.
  • MEF — Ministerium für Wirtschaft und Finanzen, Finanzabteilung (finanze.gov.it). Datensatz: Einkommensteuererklärungen pro Gemeinde (jährliche Open Data, letztes Steuerjahr 2023). Durchschnittliches und medianes Einkommen, Verteilung nach Einkommensklassen, Anzahl der Steuerpflichtigen.
  • ISPRA — Institut für Umweltschutz und Forschung (isprambiente.gov.it). Datensatz: Bodenverbrauchsbericht (Ausgabe 2024, jährliche Aktualisierung). Verbrauchte Fläche in Hektar und Verbrauchsanteil pro Gemeinde.
  • EEA — Europäische Umweltagentur (eea.europa.eu). Datensatz: rasterinterpolierte Luftqualität (letztes verfügbares Jahr 2022, jährliche Aktualisierung). Jahresmittelwerte von PM2.5, PM10, NO2 und Ozon für die vom Monitoring abgedeckten Gemeinden.

Abdeckung

DatiItalia deckt alle 7.904 italienischen Gemeinden ab. Für jede Gemeinde veröffentlichen wir die in den offiziellen Quellen verfügbaren Daten: Bevölkerung und demografische Indikatoren für sämtliche Gemeinden, Einkommen für Gemeinden mit beim MEF registrierten Erklärungen, Umweltdaten für die vom ISPRA/EEA-Monitoring abgedeckten Gemeinden. Jede Gemeindeseite nennt das Bezugsjahr jeder Angabe.

Aktualisierungsfrequenz

Die Datenpipeline läuft automatisch jede Woche und übernimmt neue Veröffentlichungen der Quellen: ISTAT publiziert die Bevölkerung jährlich (plus vorläufige monatliche demografische Bilanzen), das MEF die Einkommen einmal jährlich, ISPRA den Bodenverbrauch einmal jährlich, die EEA die Luftqualität einmal jährlich. Das Datum der letzten Aktualisierung jedes Datensatzes steht am Ende jeder Gemeindeseite.

Datenverarbeitung

Die Rohdaten werden automatisch von offiziellen Quellen heruntergeladen, normalisiert und in einer PostgreSQL-Datenbank gespeichert. Der Aktualisierungsprozess erfolgt wöchentlich über automatisierte Skripte, und jeder Datensatz behält seine Herkunft (Quelle, URL und Erfassungsdatum), die auch über die öffentliche API einsehbar ist.

Lebensqualitätsindex

Der Lebensqualitätsindex ist ein zusammengesetzter Index, berechnet als gewichteter Durchschnitt von fünf Dimensionen: Einkommen (30 %), Umwelt (25 %), Dienstleistungen (20 %), Demografie (15 %), Sicherheit (10 %). Jede Dimension wird auf einer Skala von 0–100 normalisiert.

Einschränkungen

Die Daten weisen einige Einschränkungen auf: Nicht alle Gemeinden haben vollständige Daten für jeden Indikator; Umweltdaten sind nur für überwachte Städte verfügbar; die Aktualisierungen haben je nach Quelle unterschiedliche Intervalle.