Stedelijke overstromingen voorspellen met machine learning

Kunnen we stedelijke overstromingen betrouwbaar voorspellen en managen met een machine learning model? Die vraag werd gesteld bij Deltares, het kennisinstituut voor water en ondergrond. De eerste onderzoeken waren veelbelovend. VORtech maakte graag gebruik van de mogelijkheid om dit een stap verder te brengen in samenwerking met Deltares en de Technische Universiteit Delft. Dat was voor VORtech een mooie manier om haar expertise in machine learning voor modellen met een fysische achtergrond verder uit te bouwen.

Waarom snelle voorspellingen van stedelijke overstromingen belangrijk zijn

Stedelijke overstromingen zullen naar verwachting de komende jaren ernstiger worden door klimaatverandering. Tegelijkertijd neemt de economische waarde van steden toe doordat steeds meer mensen naar stedelijke gebieden trekken, de economische activiteit groeit en de waarde van onroerend goed stijgt. Stedelijke overstromingen zullen dus niet alleen vaker voorkomen, maar ook een grotere economische impact hebben. Goede tools voor het voorspellen en aanpakken van stedelijke overstromingen zijn daarom van onschatbare waarde. Daarmee kan tijdig worden gewaarschuwd en kunnen de overstromingen zo goed mogelijk beheerst worden.

Deltares heeft hiervoor het DHYDRO-1D2D-model ontwikkeld. Dat model is gebaseerd op bekende fysica en is betrouwbaar maar het rekent te langzaam voor real-time gebruik in crisissituaties. Daar moeten waterbeheerders immers binnen enkele minuten tot uren belangrijke beslissingen nemen. Deltares onderzoekt daarom of de op fysica gebaseerde modellen kunnen worden nagebootst met surrogaatmodellen op basis van machine learning.

Machine learning voor modellen van fysische processen

Het is niet eenvoudig om met machine learning een ​​model te ontwikkelen dat voldoende betrouwbaar is voor gebruik in crisissituaties.

Een belangrijk probleem is dat de hoeveelheid trainingsdata vrijwel altijd in het niet valt bij de datasets die worden gebruikt om bijvoorbeeld grote taalmodellen te trainen. Overstromingen zijn zeldzame gebeurtenissen. Dat maakt het moeilijk om voldoende cases te verzamelen om een ​​model op te trainen. Bovendien bevatten observatiegegevens ruis, bias en regelrechte fouten. De observatiegegevens kunnen weliswaar worden aangevuld met resultaten van simulaties maar ook die zijn vaak beperkt omdat simulatiemodellen voor dit soort toepassingen meestal veel rekenkracht kosten.

Om het gebrek aan trainingsdata uit observaties te compenseren, kan gebruik gemaakt worden van kennis die we hebben over de onderliggende structuur en fysica van datgene wat gemodelleerd moet worden. Voor een model van stedelijke overstromingen levert bijvoorbeeld de kennis van de structuur van het rioolstelsel veel extra informatie op voor een machine learning model.

VORtech is actief bezig met het opbouwen van haar competentie in het soort machine learning dat naast observaties ook wetenschappelijke kennis en informatie over de structuur van het gemodelleerde gebruikt.

Veel van onze klanten werken aan modellen die fysische processen simuleren. Daarom denken we dat onze klanten enorm veel profijt kunnen hebben van deze vorm van machine learning. Met deze technieken kunnen ze, zoals in dit voorbeeld, extreem snelle modellen maken. Dat maakt real-time gebruik mogelijk, maar ook het doorrekenen van een groot aantal scenario’s en het in kaart brengen van onzekerheden. Daarnaast kunnen onze klanten machine learning ook gebruiken om met hun observatiedata hun modellen te verbeteren of te corrigeren.

Om onze ervaring met dit soort machine learning verder uit te bouwen, waren we blij met de mogelijkheid om samen te werken met experts van Deltares en de Technische Universiteit Delft die deze technieken al hadden onderzocht voor het voorspellen van stedelijke overstromingen. Deze samenwerking kreeg de vorm van het gezamenlijk begeleiden van stagiair Max Verton. Dat bleek een geweldige manier om samen te leren.

De structuur van het rioolnetwerk gebruiken bij machine learning

Zoals gezegd: het ligt voor de hand om de structuur van het rioolnetwerk te gebruiken bij het ontwikkelen van een machine learning model. Daarvoor is het concept van graph neural networks een logische benadering. Dat is een neuraal netwerk waarvan de architectuur de structuur weerspiegelt van een onderliggende graaf, in dit geval die van het rioolnetwerk.

Aan de Technische Universiteit Delft was al een graph neural network voor rioolsystemen ontwikkeld. Deltares was bezig dit model verder toe te passen en uit te breiden naar toepassingen voor overstromingen. De stageopdracht die we aan Max Verton gaven, was om het uit te proberen voor een praktijksituatie in een wijk in Eindhoven.

Daarbij kwamen de gebruikelijke stappen aan bod die horen bij het trainen van een machine learning model: de data in de juiste vorm krijgen, bepalen of aanpassingen aan de architectuur nuttig zijn, de beste hyperparameters vinden en de resultaten grondig testen. Gelukkig bleek Max een snelle leerling en leverde hij in slechts drie maanden fantastisch werk, daarbij actief ondersteund door alle betrokken partijen.

Hij trainde het graph neural network voor een klein deel van het rioolnetwerk van Eindhoven op basis van gesimuleerde resultaten van DHYDRO-1D2D. Daarmee werd impliciet ook informatie over de fysica in het model verwerkt. Zulke simulaties zijn vervolgens ook gebruikt voor validatie, waarbij de resultaten van het machine learning model buiten het tijdsbestek waarop het was getraind werden vergeleken met resultaten van DHYDRO-1D2D.

Het model dat Max heeft ontwikkeld, werkt verrassend goed. Kijkend naar de voorspelde waterstanden, slaagt het graph neural network erin om tot op ongeveer tien centimeter van de werkelijke waterstanden te komen. Voor het detecteren van overstromingen bereikte het een critical success index van ongeveer 85%. Dat geeft aan dat het verreweg de meeste overstromingen correct voorspelt. Omdat het model was getraind op een klein deel van het rioolstelsel van Eindhoven dat niet over alle kenmerken en elementen van het volledige rioolstelsel beschikte, werd niet verwacht dat het goed zou werken voor heel Eindhoven. Een klein experiment bevestigde dit.

Nu verder

Het einde van de stage betekent hopelijk niet het einde van de samenwerking tussen Deltares, de Technische Universiteit Delft en VORtech. Er is nog veel werk te verzetten om het huidige prototype om te vormen tot een robuuste en betrouwbare applicatie.

VORtech staat overigens open voor bredere mogelijkheden om onze vaardigheden in machine learning toe te passen en te ontwikkelen voor toepassingen met een natuurwetenschappelijke achtergrond. Neem contact met ons op als u denkt dat deze technieken u kunnen helpen om snellere en/of betrouwbaardere modellen te maken of om uw data optimaal te benutten.