IDEA (Image Database for Earthquake Damage Annotation) è un dataset sviluppato da Eucentre che raccoglie oltre 5.400 immagini reali di danni strutturali e non strutturali, annotate da ingegneri strutturali. Le immagini sono state acquisite durante ispezioni post-sisma (L’Aquila 2009, Emilia 2012, Italia Centrale 2016–2017) e indagini periodiche su edifici e infrastrutture, utilizzando fotocamere digitali tradizionali e sistemi UAV (Unmanned Aerial Vehicles).
L’obiettivo principale del dataset è colmare la carenza di dati annotati necessari per l’addestramento e la validazione di algoritmi basati su deep learning per il rilevamento e la classificazione automatica dei danni strutturali. A differenza di molti altri dataset, IDEA è basato su immagini realmente annotate (e non semplicemente classificate), raccolte in contesti reali e rappresentative delle tipologie costruttive diffuse nell’Europa meridionale.
Ogni immagine è accompagnata da un file XML di annotazione in formato Pascal VOC, che contiene informazioni dettagliate su:
- presenza o assenza di danno (damagePresence);
- tipologia strutturale (es. edifici residenziali, chiese, ponti);
- elemento interessato (es. colonna in c.a., trave, parete in muratura);
- tipo e categoria del danno (fessure, spalling, corrosione, collasso, ecc.);
- tipo di annotazione (rettangolare o poligonale);
- coordinate della zona danneggiata.
Il dataset è suddiviso in due insiemi principali: “damage”, con immagini contenenti danni strutturali, e “no_damage”, con immagini prive di danni visibili. Questa distinzione è fondamentale per ridurre i falsi positivi nei modelli di riconoscimento automatico.
Uno dei punti di forza di IDEA è la presenza di una ontologia strutturale dettagliata, definita dagli autori, che copre un’ampia gamma di elementi e meccanismi di danno. Questo sistema consente non solo di standardizzare le annotazioni, ma anche di espandere il dataset o crearne di nuovi secondo uno standard condiviso nell’ambito dell’ingegneria strutturale.
IDEA è concepito come un “living lab”, pensato per essere aggiornato nel tempo con nuovi dati, e rappresenta una risorsa di riferimento per:
- lo sviluppo e la validazione di reti neurali convoluzionali profonde (DCNN);
- il monitoraggio strutturale e infrastrutturale;
- l’ispezione post-evento e la gestione delle emergenze;
- il supporto alla consapevolezza situazionale per operatori e soccorritori.
Il dataset è ad accesso aperto e disponibile su Zenodo (DOI: 10.5281/zenodo.15120522).