Van slim tellen naar slimme verkeersschattingen

Op 3 februari 2020 verdedigde Paul van Erp succesvol – en cum laude – zijn PhD-thesis aan de TU Delft. Zijn onderwerp intrigeert: hoe kunnen we de sensordata van slimme voertuigen gebruiken om de verkeerstoestand te schatten? In dit artikel licht Van Erp c.s. de belangrijkste lessen van zijn proefschrift toe.




De meest gebruikte verkeersdata van dit moment zijn lusdata en zogenaamde probe data. Die laatste kennen we beter als floating car data, FCD.

De lussen meten voertuigpassages: het passagetijdstip, de snelheid en de voertuiglengte worden vastgelegd. Deze metingen krijgen we normaliter in geaggregeerde vorm aangeboden, bijvoorbeeld als strookspecifieke gemiddelde snelheden en intensiteiten per minuut.
De FCD geven ons een beeld van de bewegingen van de probes, de gevolgde voertuigen. Ook deze data worden meestal geaggregeerd en betreffen gemiddelde snelheden of reistijden voor wegsegmenten en/of routes gedurende een bepaalde periode.

Met de lusdata en FCD kunnen we het verkeer bestuderen, modellen voeden, verkeersmaatregelen inzetten en weggebruikers van de juiste informatie voorzien. Maar ideaal zijn ze niet: er kleven een aantal nadelen aan de data zelf en aan hoe ze beschikbaar worden gesteld.

Beperkingen huidige data
Lussen observeren vaste locaties. De verkeerstoestand op die enkele locaties is echter niet altijd representatief voor het wegsegment waaraan de meting wordt toegewezen. Lusdata geven dan ook geen accurate informatie over verkeersvariabelen met een ruimtelijke component, zoals reistijden of het aantal voertuigen op een wegsegment (de voertuigaccumulatie).

Om een beter zicht te krijgen op reistijden en snelheden tússen locaties, kunnen we FCD gebruiken. In ruwe vorm bevatten die informatie over de locatie, tijd en snelheid van de gevolgde voertuigen. Maar het nadeel van FCD is weer dat niet alle verkeer gemeten wordt, maar slechts een relatief klein deel: de vloot van de betreffende dataprovider. We kunnen daardoor al snel last krijgen van bias. Het is bijvoorbeeld goed mogelijk dat de vloot relatief veel snelle automobilisten bevat of dat het aandeel vrachtwagens of taxi’s groter is. De gemeten variabelen zijn daarmee niet meer 100% representatief.
Ook het aggregeren van de ruwe data kent z’n uitdagingen. In dat proces wegen factoren als privacy en beschikbaarheid vaak zwaarder dan verkeerskundige ‘correctheid’. Op zich logisch, maar dat gaat (soms onnodig) ten koste van de nauwkeurigheid van de schattingen.
Een laatste probleem met FCD is dat variabelen gerelateerd aan de verkeersstroom als geheel, zoals dichtheden en intensiteiten, niet accuraat te schatten zijn met die FCD alleen – het percentage van voertuigen/weggebruikers dat FCD deelt, varieert daarvoor te veel over ruimte en tijd.

Een deel van de nadelen kunnen we opvangen door lusdata en FCD te combineren. Als we bijvoorbeeld intensiteiten gemeten met lussen relateren aan reistijden van FCD, kunnen we de totale reistijd en/of voertuigverliesuren afleiden. Maar het is dan wel essentieel een goed beeld te hebben van hoeveel voertuigen we aan een bepaalde reistijd moeten koppelen. Doordat we verschillende bronnen gebruiken en deze pas laat (geaggregeerd) combineren, gaan we op dit punt al snel de mist in.

Kansen
Tot zover wat er zoal misgaat of mis kan gaan. Belangrijker is natuurlijk de vraag: Hoe kunnen we deze nadelen (grotendeels) overwinnen? In dit artikel bespreken we drie punten: (1) werken met een andere beschrijving van de verkeerstoestand, namelijk de verandering van de cumulatieve flow over ruimte en tijd, (2) nieuwe vormen van data verzamelen met automatische voertuigen (of andere voertuigen met de benodigde sensoren en communicatiesystemen) en (3) data in een vroeg stadium, namelijk in ruwe vorm, fuseren.

Veranderingen in de cumulatieve flow
Op dit moment ligt de focus bij het inwinnen van verkeersgegevens (en dus vanzelf ook bij het analyseren van het verkeer) nog op snelheden, intensiteiten en reistijden voor wegsegmenten/locaties binnen bepaalde perioden. Dit zijn interessante variabelen, maar als we ze los schatten, gaan we voorbij aan het feit dat deze variabelen samenhangen. We kunnen dus beter een overkoepelende macroscopische variabele schatten die de juiste relaties tussen variabelen al in zich heeft. Dat is het geval met de zogenaamde cumulatieve flow.

De wetenschappelijke notatie van deze variabele is N(x, t) en ze wordt gedefinieerd als het cumulatief aantal voertuigen dat locatie x is gepasseerd op tijd t, waarbij we op elke locatie naar dezelfde groep voertuigen kijken.
Op basis van de verandering in deze variabele over ruimte en tijd kunnen we belangrijke verkeersvariabelen afleiden. De reistijd is bijvoorbeeld te herleiden uit de cumulatieve flow op basis van de horizontale afstand tussen de cumulatieve flow-curves voor twee locaties (x1 en x2), te weten N(x1, t) en N(x2, t). Het aantal voertuigen op een wegsegment bepalen we aan de hand van de verticale afstand van diezelfde curves. Daarnaast kunnen we uit de twee functies belangrijke variabelen destilleren die iets zeggen over de prestatie van het verkeersnetwerk, zoals totale voertuigreistijd (voertuiguren), voertuigverliesuren en de totale afgelegde afstand (voertuigkilometers). Zie verder figuur 1.

Figuur 1: Directe afgeleiden van cumulatieve flow-curves voor twee locaties.



De cumulatieve flow-variabele heeft ook een directe relatie met de macroscopische variabelen gemiddelde snelheid u, intensiteit q en dichtheid k. Voor gebieden in ruimte-tijd (bijvoorbeeld een wegsegment gedurende een periode) kunnen deze drie variabelen perfect worden bepaald met Edie’s generalized definitions of traffic flow op basis van de cumulatieve verandering over de grenzen van het gebied. Daarnaast is het mogelijk de variabelen af te leiden van de afgevlakte (smoothed) cumulatieve flow, oftewel:

∂N(x,t) ⁄ ∂t = q(x,t)
∂N(x,t) ⁄ ∂x = -k(x,t)

u(x,t) = q(x,t) ⁄ k(x,t)

Al met al verwachten we dat als we deze variabele kunnen schatten, het makkelijker is om reistijden of het ontstaan van files te voorspellen. Ook het bepalen van de verkeerstoestand voor locaties die niet direct zijn geobserveerd, zou beter moeten verlopen, net als het afleiden van belangrijke statistieken als voertuigverliesuren.

Maar we zeggen niet voor niets: dat verwachten we. De reden is dat het schatten van de cumulatieve flow wat extra inspanningen vereist én een nieuw type data.

Nieuwe data verzamelen met automatische voertuigen
Met lussen of andere wegkantsystemen (camera’s, radars) kunnen we voertuigpassages observeren – en daarmee de cumulatieve flow over de tijd voor een vaste locatie. We kunnen verder de verandering in cumulatieve flow tussen verschillende (lus)locaties bepalen met probe- (floating car) trajectoriedata of met ‘voertuigheridentificatiedata’ (vehicle re-identification data). Deze data beschrijven de momenten dat een zeker voertuig de verschillende luslocaties passeert. Dat is waardevolle informatie, maar het nadeel is dat ze geen informatie bevatten over het netto aantal voertuigen dat het probe-voertuig heeft ingehaald. Met dat aantal zouden we namelijk de verandering in de cumulatieve flow over de probe-trajectorie beschrijven.

Om die leemte (grotendeels) in te vullen kunnen we data van automatische voertuigen gebruiken. Het gaat er hierbij niet zozeer om dat de auto’s automatisch rijden, als wel dat ze zijn uitgerust met camera’s en sensoren om andere weggebruikers waar te nemen. Daarmee kunnen ze in principe de verandering in cumulatieve flow ten opzichte van hun positie over tijd observeren: ze zijn immers in staat te zien of ze worden ingehaald door een andere weggebruiker (+1) of dat ze zelf een andere weggebruiker inhalen (-1). Deze nieuwe afgeleide data hebben we in het proefschrift relative flow data genoemd. Ten opzichte van probe-trajectoriedata en/of voertuigheridentificatiedata heeft het verzamelen van relative flow data met bewegende waarnemers (de automatische voertuigen) een aantal voordelen. De bewegende waarnemers die onderdeel van de geobserveerde verkeersstroom zijn, geven accuratere informatie over de verandering in cumulatieve flow tussen locaties waar stationaire waarnemers (bijvoorbeeld lussen) zijn gepositioneerd. Daarnaast is het wellicht mogelijk (afhankelijk van de infrastructuur en aanwezige sensoren) om de verkeersstroom in tegengestelde richting te observeren.

Data fuseren in ruwe vorm
Om de cumulatieve flow te schatten over ruimte en tijd moeten we de data van verschillende waarnemers fuseren. Idealiter fuseren we die data in ruwe vorm, in plaats van eerst aggregeren en dan fuseren. Het basisprincipe zou dan zijn dat we data van verschillende waarnemers combineren op het moment en de locatie dat de waarnemers elkaar kruisen. Op dit punt in ruimte en tijd moet de cumulatieve flow-waarde voor beide waarnemers namelijk gelijk zijn. Uitgaande van deze ‘waarheid’ kunnen we de verandering in cumulatieve flow bepalen tussen elke combinatie van punten in ruimte en tijd die zijn geobserveerd door de twee waarnemers.

Dit principe geldt uiteraard niet alleen voor een combinatie van twee waarnemers – we kunnen het gebruiken om het verschil in cumulatieve flow te bepalen tussen elke combinatie van punten in ruimte en tijd die verbonden zijn met geobserveerde paden.

Om dit te illustreren gebruiken we de situatie in figuur 2. De figuur toont een wegsegment met twee stroken met daarop drie voertuigen. Daarnaast zien we een tijd-ruimtediagram met voertuigtrajectoriën (groene streepjes). Als we op twee locaties (x1 en x2) stationaire waarnemers hebben en een voertuig fungeert als bewegende waarnemer (zwarte schuine lijn), kunnen we de verandering in cumulatieve flow tussen de punten A en B bepalen door te tellen. In dit geval resulteert dat in drie voertuigen.

Figuur 2: Simpel tellen stelt ons in staat om de verandering in cumulatieve flow tussen punten in tijd en ruimte te ‘observeren’.



In feite doen we dus niets anders dan simpel tellen: dat stelt ons in staat om de verandering in cumulatieve flow tussen twee punten in ruimte en tijd te ‘observeren’. Echter, data bevatten vaak meetfouten. In onze situatie kan het zijn dat een waarnemer passages mist en/of passages ‘observeert’ die niet hebben plaatsgevonden. Dit is een belangrijke uitdaging die het in de praktijk lastig maakt om alleen op basis van stationaire waarnemers (bijvoorbeeld lussen) de cumulatieve flow te schatten. Dit staat bekend als het ‘cumulatieve fouten probleem’. Indien er genoeg interacties zijn tussen waarnemers (= als ze elkaar vaak kruisen in ruimte en tijd) kunnen we dit probleem binnen de perken houden, en ontstane fouten corrigeren.

Afsluitende opmerkingen
Samengevat: zodra we in staat zijn om met bewegende waarnemers relative flow data te verzamelen, ontstaan er heel interessante kansen. De waarde van deze data ligt in de combinatie van de geobserveerde variabele (verandering in de cumulatieve flow) en de tijdruimtelijke karakteristieken (toegang tot waarnemers die met verschillende snelheden reizen waardoor ze elkaar kunnen passeren). In ons onderzoek hebben we meerdere principes en methodologieën ontwikkeld waarbij we data van verschillende waarnemers fuseren en de gewenste verkeersinformatie blootleggen (bijvoorbeeld intensiteiten, dichtheden en/of macroscopische verkeersmodellen). Dit biedt verdere mogelijkheden voor wetenschap en praktijk.

Een van de belangrijkste vervolgstappen is om de theoretische kaders empirisch te toetsen. Daarvoor moet het verzamelen van deze data verder wordt onderzocht door autobedrijven en partijen die deze data mogelijk willen gebruiken.

Voor de korte termijn heeft het verrichte onderzoek hoe dan ook praktische waarde. Zo kunnen we lusdata en probe trajectoriedata gebruiken om de cumulatieve flow voor luslocaties over de tijd te schatten en daaruit verkeersinformatie als reistijden af te leiden. Het is wel zo dat deze combinatie minder geschikt is (vanuit het perspectief van nauwkeurigheid en mogelijk ook van kosten) dan data die we met bewegende waarnemers hebben verzameld. Na verloop van tijd zou door integratie van voertuigdata een groot deel van de huidige data overbodig kunnen worden.

Meer lezen? Het proefschrift Relative Flow Data: New Opportunities for Traffic State Estimation van Paul B.C. van Erp is beschikbaar op de Repository-website van TU Delft.

____

De auteurs
Dr. ir. Paul van Erp is adviseur bij Arane Adviseurs in verkeer en vervoer en zelfstandig ondernemer.
Dr. Victor L. Knoop is universitair hoofddocent Verkeersdynamica op de TU Delft.
Prof. dr. ir. Serge Hoogendoorn is hoogleraar Smart Urban Mobility op de TU Delft.