Hoe kunnen we files beter voorspellen en verkeersstromen proactief beheersen? Deze vraag stond centraal in een innovatief project van de NDW Data Science Society, uitgevoerd in opdracht van NDW en Rijkswaterstaat. Een consortium van d-fine, Arane en TU Delft onderzocht de mogelijkheden van kunstmatige intelligentie, machine learning, voor voorspellend verkeersmanagement rond de Ketheltunnel.
Aan de basis van onze aanpak voor voorspellend verkeersmanagement rond de Ketheltunnel staat een wetenschappelijk model uit in 2021, het Multistep Traffic Forecasting-model.1Zie Multistep traffic forecasting by dynamic graph convolution: Interpretations of real-time spatial correlations van Guopeng Li, Victor Knoop en Hans van Lint, gepubliceerd in Transportation Research Part C: Emerging Technologies 128 (2021). Zie ook Grenzen aan de voorspelbaarheid van verkeer in NM Magazine 2023 #1. Dit model, ontwikkeld aan de TU Delft, maakt gebruik van zowel historische als real-time data en kan verkeerssituaties tot 60 minuten vooruit voorspellen.
Het innovatieve van dit model zit ‘m vooral in de Dynamic Graph Convolution-module. Deze module leert automatisch de ruimtelijke verbanden tussen verschillende delen van het wegennetwerk, rekening houdend met ‘schokgolfsnelheden’. Die snelheden representeren de maximale snelheid waarmee informatie zich door het verkeerssysteem kan verspreiden. Dit is essentieel voor het voorspellen van filevorming.
De Dynamic Graph Convolution-module leert automatisch de ruimtelijke verbanden tussen verschillende delen van het wegennetwerk.
Een ander kenmerk van het model is de encoder/decoder-structuur, specifiek ontworpen voor het verwerken van tijdreeksen. De encoder analyseert historische verkeersdata en codeert deze in een compacte representatie: een beschrijving van de verkeerssituatie in ruimtelijke en temporele patronen. Na steeds één of twee minuten wordt de representatie aangepast met de meest recente data. De decoder gebruikt deze gecodeerde informatie om voorspellingen te maken, uitgaande van dezelfde tijdstappen.
Netwerk
Ons model richt zich op de A4 en A13, het traject tussen knooppunt Ypenburg en knooppunt Benelux. Dit netwerk is vanuit verkeerskundig oogpunt bijzonder interessant door de vele interacties tussen kiemen en knooppunten. Een extra uitdaging hier vormt het fileverplaatsingssysteem van de Ketheltunnel. Wanneer files richting de Ketheltunnel terugslaan, sluit dit systeem de tunnel volledig af.2Stilstaand verkeer in de tunnel vormt een veiligheidsrisico: bij een eventueel incident kan het verkeer dan nergens heen. Een belangrijk deel van het tunnelmanagement is daarom gericht op het voorkomen van files ín de tunnel. Het gevolg is een serie filegolven stroomopwaarts van de Ketheltunnel.
Het netwerk is ook interessant omdat bij activatie van het fileverplaatsingssysteem de route via de A13 al snel een beter alternatief is.
Selectie en verwerking gegevens
Wat input betreft voeden we het model uitsluitend snelheids- en intensiteitsgegevens van lusdetectoren. De dekking van de lusdata in het netwerk is namelijk voldoende. Ook zijn lusdata eenvoudiger te verwerken en homogeniseren dan bijvoorbeeld floating car data, FCD. Voor de training hebben we data uit de periode januari tot en met augustus 2024 gebruikt.
Kleine hiaten in de gegevens zijn gedicht met lineaire interpolatie. De door het model benodigde netwerkgegevens zijn gemaakt in de vorm van verbindingsmatrices voor het stroomopwaartse en -afwaartse verkeer. Er is geen adaptieve smoothing toegepast, om abrupte veranderingen in de gegevens te behouden. Die zijn in onze modeltoepassing juist essentieel.
De verkeersgegevens zijn voor de modeltraining omgezet naar tijdreeksen met een vaste lengte. Een dergelijke tijdreeks bestaat uit een observatiehorizon, vastgesteld op 20 tijdstappen, en een voorspellingshorizon van maximaal 60 tijdstappen. Het getrainde model maakt voorspellingen voor de voorspellingshorizon op basis van de gegevens in de observatiehorizon. Daarbij wordt de voorspelling voor elke tijdstap verwerkt in de voorspellingen voor de volgende tijdstappen. De kwaliteit van deze ‘recursieve aanpak’ bleek namelijk beter dan die van een niet-recursieve aanpak.
De voorspelling voor elke tijdstap wordt verwerkt in de voorspellingen voor de volgende tijdstappen. De kwaliteit van deze ‘recursieve aanpak’ bleek beter dan die van een niet-recursieve aanpak.
Naar de MLOps-omgeving
Om het model in te kunnen zetten voor ons project hebben we het opgenomen in de MLOps-omgeving van NDW.3MLOps staat voor Machine Learning Operations. Zo’n omgeving is bedoeld om machine learning-toepassingen te ontwikkelen, testen en implementeren. De implementatie in een operationele omgeving blijkt altijd weer een uitdaging. In ons geval was vooral het verwerken van de ruwe data en het waarborgen van de modelstabiliteit een opgave. Uiteindelijk bleek de keuze om niet met een tijdstap van twee minuten, de oorspronkelijke TU Delft-keuze, maar van één minuut te werken, cruciaal. We konden hiermee de toepasbaarheid garanderen én voorkomen dat de modeluitkomsten te veel worden ‘platgesmeerd’.
Zo’n korte tijdstap kan trouwens problematisch uitpakken als de propagatie van kinematische golven de volgende meetlus niet binnen de tijdstap bereikt. Dit hebben we opgelost door de schokgolfsnelheid wat te verhogen. Ondanks deze ‘tweak’ was de encoder/decoder-structuur verrassend goed in staat om met de hogere temporele resolutie om te gaan: de voorspellingen waren met de één-minuuttijdstap plus tweak significant beter.
Voorspelling verkeerspatronen
Figuur 1 toont het potentieel van het model bij het voorspellen van filepropagatie. In het linkerdeel zien we de werkelijke verkeerssituatie. Rechts daarvan de voorspelling voor de komende 20 minuten, vanaf de stippellijn. De kleuren in het diagram representeren de snelheden, waarbij rood duidt op lage snelheden (file) en blauw op hoge snelheden (vrije doorstroming).

Merk op dat het model accuraat voorspelt hoe de congestie zich als een schokgolf door het netwerk verplaatst. De figuur links laat zien dat vanaf 15:30 uur diverse verstoringen ontstaan rond de Beneluxtunnel. In het weefvak bijvoorbeeld ontwikkelt zich een verstoring die gestaag groeit. Als deze om 15:50 uur dreigt terug te slaan tot aan de Ketheltunnel, sluit het fileverplaatsingssysteem de tunnel af: het witte vlak in de figuur duidt op de afwezigheid van verkeer in de tunnel. De dan ontstane filegolf verspreidt zich stroomopwaarts richting Delft. Vergelijken we dat met de voorspelde data rechts, dan zien we dat het model de filegroei, de activering van het fileverplaatsingssysteem en de voortplanting van de file alle accuraat simuleert.
Het model voorspelt accuraat hoe de congestie zich als een schokgolf door het netwerk verplaatst.
Maar figuur 1 betreft een reguliere verkeerssituatie. Figuur 2 laat zien dat het model nog géén raad weet met de verkeersafwikkeling onder bijzondere omstandigheden, zoals in dit geval weekendwegwerkzaamheden op de A13. Waar in werkelijkheid de files de hele dag aanhielden vanwege de verminderde wegcapaciteit, voorspelt het model dat de congestie snel zal oplossen (rechts van de stippellijn op de rechterfiguur). Dit illustreert dat het model moeite heeft met het voorspellen van verkeerspatronen bij niet-reguliere situaties. Gek is dat niet: het model is getraind op reguliere verkeerspatronen en heeft geen expliciete kennis van de capaciteitsvermindering door bijvoorbeeld werkzaamheden of incidenten.

Mogelijke toepassingen
Hoe zouden we de voorspellingen van het model, gelet op de krachten en zwakten, kunnen inzetten voor verkeersmanagement? Voor de Ketheltunnel hebben we vier specifieke toepassingen onderzocht. De eerste is dat het model de tunneloperator informeert over verwachte congestie. Hoewel de voorspellingen normaliter accuraat zijn, blijkt in de praktijk dat tunneloperators vooral focussen op incidentmanagement. Incidenten zijn nu net niet de kracht van het model, dus is deze toepassing minder waardevol dan eerst gedacht.
De tweede toepassing betreft de service Beperken instroom naar de tunnel. Deze service heeft als doel te voorkomen, dat files voorbij de tunnel terugslaan tot in de tunnel.4Zou dat gebeuren, dan zou vanzelf het eerder genoemde fileverplaatsingssysteem in werking treden: de tunnel wordt dan afgesloten. De service Beperken instroom is er dus op gericht die (drastischer) maatregel te voorkomen of uit te stellen. Door z’n accurate voorspellingen kan het model proactief aangeven wanneer instroombeperking noodzakelijk wordt. Simulaties tonen aan dat het exact timen van deze maatregel cruciaal is voor de effectiviteit. Te vroeg ingrijpen leidt tot onnodige vertragingen, te laat ingrijpen kan niet meer voorkomen dat files terugslaan tot in de tunnel.
Een derde toepassing richt zich op het managen van verkeer vanaf de A20 richting de Beneluxtunnel, ook met het doel files in de Ketheltunnel te voorkomen. Het model kan namelijk voorspellen wanneer files bij de Beneluxtunnel terugslaan naar de Ketheltunnel. Met die inzichten kan ook hier proactief worden ingegrepen, in dit geval door de instroom vanaf de A20 richting Beneluxtunnel te beperken.
De vierde toepassing zijn routeadviezen voor verkeer tussen Den Haag en Rotterdam: kunnen die het beste de A4 of de A13 nemen? Met name wanneer het fileverplaatsingssysteem actief is, groeit de file op de A4 snel. Kunnen we wegebruikers hier tijdig over informeren?
Er liggen enorme kansen om met behulp van voorspellingen (en het proactieve ingrijpen) de doorstroming en betrouwbaarheid te verbeteren.
In het onderzoek hebben we de kansen van voorspellingen voor de toepassingen in kaart gebracht. Hierbij hebben we rekening gehouden met de nauwkeurigheid en betrouwbaarheid van de voorspellingen, welke situaties goed en minder goed worden voorspeld en de voorspelhorizon waarvoor de betrouwbaarheid nog voldoende is. De analyse leert ons dat de kwaliteit van de voorspellingen beter kan en dat daar ook potentie voor is. Maar bovenal blijkt dat er inderdaad enorme kansen liggen om met behulp van voorspellingen (en het proactieve ingrijpen) de doorstroming en betrouwbaarheid te verbeteren.
Toets
Om dit te toetsen voor specifiek de reistijdvoorspelling – toepassing vier – hebben we een speciale methode voor anticiperend verkeersmanagement toegepast.5Deze methode is eerder door Arane ontwikkeld. Zie Data-gedreven ontwerp en iteratieve inzet van anticiperende verkeersmanagementmaatregelen, E. Smits et al., Nationaal Verkeerskunde Congres 2023. De crux van deze methode is om vóóraf te bepalen hoe goed er voorspeld wordt, nog voordat de maatregel is geïmplementeerd. Dit van tevoren toetsen doen we met behulp van historische data en een zogenaamde verwarringsmatrix.
Deze matrix maakt onderscheid tussen verschillende soorten voorspellingen:
- True positives: Situaties waarbij het model correct voorspelt dat de alternatieve route (A13) sneller is.
- False positives: Gevallen waarin het model onterecht aangeeft dat omrijden voordeliger is.
- True negatives: Correcte voorspellingen dat de hoofdroute (A4) de beste keuze is.
- False negatives: Gemiste kansen waarbij een mogelijke tijdwinst niet wordt gesignaleerd.
Uit de analyse blijkt dat de voorspellingen significant betrouwbaarder zijn dan instantane metingen. Het model geeft in bijna 95% van de gevallen een correct advies (accuracy), en wanneer het een alternatieve route adviseert, is dit in 98,5% van de gevallen terecht (precision).
Om de nauwkeurigheid verder te verbeteren is een lineaire correctie toegepast op zowel de instantane als voorspelde reistijden. Deze correctie compenseert voor systematische afwijkingen die ontstaan bij het schatten van reistijden. Door historische data te analyseren, is een regressieformule ontwikkeld die de schattingen beter laat aansluiten bij de werkelijk gereden reistijden. Deze correctie bleek vooral waardevol tijdens drukke periodes, waar de originele schattingen de reistijd vaak onderschatten. Na toepassing van de correctie valt meer dan 51% van de voorspelde reistijden binnen één minuut van de werkelijke reistijd, tegenover 36% bij de ongecorrigeerde instantane metingen. Dit maakt het systeem in de praktijk betrouwbaarder voor verkeersmanagers én weggebruikers.
Uitdagingen en vervolgstappen
Ons onderzoek heeft belangrijke inzichten opgeleverd in zowel de mogelijkheden als beperkingen van kunstmatige intelligentie voor verkeersvoorspellingen. Het model excelleert in het voorspellen van reguliere filepatronen en de voortplanting van congestie door het netwerk. Het heeft juist moeite met het voorspellen van files bij wegwerkzaamheden of incidenten. Ook het exact voorspellen van het ontstaan van files bij bottlenecks blijft een uitdaging. Deze beperkingen zijn inherent aan de gebruikte trainingsdata, die vooral reguliere verkeerspatronen bevat.
Onze aanbeveling voor vervolg is dan ook om het model uit te breiden met specifieke modules voor niet-reguliere situaties. Dit kan door expliciete informatie over werkzaamheden en capaciteitsvermindering toe te voegen. Een andere mogelijkheid is om een zogeheten Physics Induced Neural Network toe te passen, waarbij het model wordt geleerd zich te houden aan wetten uit de verkeersstroomtheorie.
De integratie van rijstrookspecifieke voorspellingen is een andere kansrijke verbetering, vooral bij weefvakken en aansluitingen. Verschillen in snelheid en intensiteit tussen rijstroken kunnen vroege indicatoren zijn voor de eerste filevorming: de breakdown van het verkeer.
Een puur praktische uitbreiding van het model is de integratie van nieuwe gegevensbronnen. FCD zijn bijvoorbeeld nuttig voor netwerken waar de dekking met lusdetectoren lager is. Contextuele gegevensbronnen als rijstrookafsluitingen, wegwerkzaamheden, omleidingen, weer enzovoort leiden tot een beter begrip van niet-reguliere situaties.
Tot slot
De praktische waarde van het model ligt vooral in de ondersteuning van proactief verkeersmanagement. Door files vroegtijdig te voorspellen kunnen maatregelen tijdig worden ingezet. Het model biedt daarmee een wetenschappelijk onderbouwde basis voor geautomatiseerd verkeersmanagement.
De ervaring die we met het project hebben opgedaan, is goed toepasbaar in vergelijkbare projecten elders in het land. Met de groeiende beschikbaarheid van verkeersdata en de voortschrijdende ontwikkeling van AI-technieken liggen er volop kansen voor verdere innovatie in voorspellend verkeersmanagement.
____
De auteurs
Dr. Erik-Sander Smits en prof. dr. ir. Serge Hoogendoorn zijn respectievelijk partner en strategisch adviseur bij Arane Adviseurs. Dr. Max Lewandowski en dr. Sebastian Schwinn zijn experts op het gebied van mobiliteit bij d-fine.
Aan het artikel werkten verder mee: Hans van Lint (TU Delft), Bob van der Meer (NDW) en Marco Schreuder (Rijkswaterstaat).