De potentie van voertuigdata: een beter zicht op ongevallen en weersomstandigheden

Moderne (vracht)auto’s produceren tijdens een gemiddeld ritje met gemak gigabytes aan data. Veel van die data blijft in de auto of wordt hooguit uitgewisseld met de fabrikanten. Maar verkeersveiligheidsgerelateerde voertuigdata worden in principe beschikbaar gesteld – met dank aan Europese regelgeving. Wat kunnen we met die (ruwe) gegevens? In deze bijdrage beschrijven de auteurs twee casus: ongevallendata en slechtweermeldingen.




Steeds meer auto’s zijn uitgerust met advanced driver assistance systems, ADAS. De sensoren van deze ondersteunende systemen fungeren als ogen en oren: ze zamelen continu informatie in over de toestand van de auto en over de omstandigheden ‘buiten’. De gegevens zijn voor het voertuig zelf – bijvoorbeeld om te bepalen of de ruitenwissers, mistlampen of traction control aan moeten – maar gaan deels ook naar de fabrikanten.

In principe blijven die data dan ook bij de fabrikanten. Dankzij een EU-richtlijn uit 2013 zijn die echter verplicht om voertuigdata over verkeersveiligheid vrijelijk beschikbaar te stellen. Het gaat om acht categorieën: tijdelijk glad wegdek, obstakels (dieren, mensen, puin op de weg), onbeveiligde ongevalslocatie, kortstondige werkzaamheden, verminderde zichtbaarheid, spookrijder, onbeheerde wegblokkade en uitzonderlijke weersomstandigheden. De EU hoopt met de wetgeving de ontwikkeling van real-time verkeersveiligheids- (informatie-) toepassingen te stimuleren.

Maar tussen ruwe voertuigdata en een slimme toepassing liggen nog wel wat stappen. In heel Europa zijn overheden, kennisinstellingen en bedrijven druk doende om de veiligheidsgerelateerde voertuigdata eerst eens te ontsluiten. In Nederland nemen we hier als Nationaal Dataportaal Wegverkeer (NDW) het voortouw in, in opdracht van het ministerie van Infrastructuur en Waterstaat. Samen met het Duitse data analytics bureau D-fine werken we onder meer aan de normalisering van alle verschillende databronnen. In dit artikel gaan we kort op deze stap in, maar we bespreken ook twee casus, als illustratie van het gebruikerspotentieel van de voertuigdata.

Normaliseren
NDW ontvangt real-time voertuigdata van verschillende grote fabrikanten, zoals BMW, Daimler en Volvo. Deze datastreams verschillen wel qua formaat. We hebben daarom een datamodel ontwikkeld, waar we deze formaten naar omzetten: het type meldingen, de locatiereferenties en de tijdsaanduidingen worden zo gestandaardiseerd. We zetten de gegevens meteen in een database, zodat we ze met behulp van big-datatechnieken kunnen raadplegen en analyseren.

Met deze normalisatieslag hebben we echter nog geen ‘ideale data’. In hoeverre een type melding daadwerkelijk wordt geregistreerd, varieert bijvoorbeeld tussen de fabrikanten. Ook de toedeling van een melding aan een van de acht categorieën wil nog weleens verschillen. Bijvoorbeeld: de ene fabrikant interpreteert het aanschakelen van een mistlamp als ‘verminderde zichtbaarheid’, de andere als ‘uitzonderlijke weeromstandigheden’.
Omdat nog niet alle voertuigen met hun fabrikanten verbonden zijn, is de dekkingsgraad ook niet zo hoog (en ook niet zo constant) als van floating car data. En dan is er nog het punt dat we gegevens na twee maanden moeten wissen vanwege de privacywetgeving. Het is daardoor best een uitdaging tijdsreeksanalyses te maken.

Er zijn dus nog wel wat problemen te overwinnen, maar dat laat onverlet dat ook in de huidige vorm de voertuigdata interessante kansen bieden. We noemen twee voorbeelden.

Ongevallenregistratie
De eerste casus is ongevallenregistratie. Voor wegbeheerders is het zaak om zo snel mogelijk informatie over de aard en locatie van ongevallen te krijgen. Niets zou natuurlijk sneller en nauwkeuriger zijn dan een melding van het voertuig zelf, mocht dat bij een ongeval betrokken raken. Maar werkt het ook zo in de praktijk?

Om dat te bepalen hebben we ongevalsmeldingen vanuit de voertuigen vergeleken met ongevallen zoals gemeld in de situatieberichten (SB) die NDW binnenkrijgt. Voor iedere melding uit een voertuig hebben we binnen een bepaalde straal en binnen een bepaald tijdsverschil naar SB-meldingen gezocht die ‘kandidaat-matches’ zijn. Figuur 1 vat het percentage gevonden matches samen voor verschillende zoekstralen en tijdsverschillen. Op basis van deze analyse concluderen we dat de meeste matches te vinden zijn binnen 0,5 kilometer en maximaal een uur tijdsverschil.

Figuur 1: Het percentage matches tussen ongevalsmeldingen uit de voertuigen zelf en uit situatieberichten. Links de percentages als we variëren met de tijdsmarges. De lijnen staan voor een zekere (constante) zoekstraal. Rechts de percentages als we variëren met de zoekstraal, waarbij de lijnen staan voor een constante tijdmarge. (Klik op de afbeelding voor een grotere weergave.)


Figuur 2: De gemiddelde tijdsbesparing van voertuigberichten ten opzichte van SB-meldingen is ongeveer 10 minuten (boven). De SB-meldingen vormen een cluster rond de positie van de voertuigen in het centrum van de cirkel (onder). (Klik op de afbeelding voor een grotere weergave.)
In de door onze geanalyseerde periode van twee keer twee maanden in 2020 kregen we via onze voertuigdatastream 174 ongevallen¬meldingen binnen. Dat betrof 21 ongevallen op snelwegen en 153 op niet-snelwegen. Van die 174 konden we er 40 relateren aan een SB-ongevallenmelding. Als we dat ook opsplitsen naar type weg, komen we op 18 matches op snelwegen (matchingpercentage: 86 procent) en 22 op niet-snelwegen (matchingspercentage: een kleine 15 procent).
Aangezien de SB-meldingen voornamelijk op de snelwegen gerapporteerd worden, is dit verschil goed te verklaren. Maar deze casus maakt meteen ook duidelijk dat voertuigdata een heel interessante aanvullende bron zijn voor ongevallen op niet-snelwegen: het gebrek aan matches met de SB-meldingen betekent vooral dat SB veel ongevallen mist.

Dan de vraag of meldingen uit het voertuig inderdaad sneller en nauwkeuriger zijn. In onze vergelijking met SB zagen we dat ongevallenmeldingen uit voertuigen gemiddeld 10 minuten eerder worden geregistreerd. Ook is de locatie van het ongeval vermoedelijk nauwkeuriger dan bij de SB-meldingen – zie hiervoor figuur 2.

Weersgerelateerde meldingen
Dan de tweede casus. Het weer heeft een significante invloed op de verkeersveiligheid. Gladde wegen als gevolg van sneeuw- of regenval en slecht zicht door mist verhogen immers het risico op ongevallen. Voor deze casus hebben we de nauwkeurigheid van die weersgerelateerde meldingen vanuit voertuigen proberen te bepalen. Dat doen we door de meldingen van specifiek regenval te vergelijken met meetgegevens van het KNMI. De periode is opnieuw 8 juli tot 7 september 2020.

Figuur 3: Een voorbeeld van de meldingen van aquaplaning tijdens regen (blauw) en de locatie
van KNMI-weerstations in Nederland (oranje).
Net als in de vorige casus koppelen we de KNMI-metingen aan data uit voertuigen op basis van overeenkomst in plaats en tijd. Figuur 3 toont de 52 KNMI-weerstations en een voorbeeld van meldingen uit het voertuig over aquaplaning.
Voor iedere regengerelateerde melding uit een voertuig hebben we het dichtstbijzijnde weerstation binnen een straal van 50 km gezocht. We nemen dan de neerslaggegevens van het weerstation met de kortste hemelsbrede afstand en koppelen de neerslag van het overeenkomende uur aan de melding uit het voertuig.

In de periode van 8 juli tot 7 september ontvingen we zo’n 195.000 meldingen van regenval uit voertuigen. Het lukte ons om alle meldingen aan een KNMI-weerstation te koppelen: de gemiddelde afstand tussen een melding en een weerstation is 27 km.

We hebben opnieuw de matchingpercentages bepaald, maar dit keer met het onderscheid ‘overdag’ en ‘nacht’. We hebben hiervoor gekozen, omdat de verkeersdrukte overdag significant verschilt van de nacht. De hoeveelheid data uit voertuigen zal overdag ook groter zijn – en dat moet, statistisch gezien, de invloed van toevallige uitschieters verminderen.
We zien dat overdag 64 procent van de regenmeldingen uit voertuigen te staven is met neerslagwaarnemingen van het meest nabije KNMI-weerstation. Tijdens de nacht is dat 57 procent. Dit zegt maar deels iets over de kwaliteit van de voertuigdata. Aangezien regen zeer lokaal kan optreden, is het natuurlijk goed mogelijk dat een weerstation – zoals gezegd: op gemiddeld 27 kilometer afstand – geen regen meldt terwijl er op de locatie van het voertuig wel degelijk neerslag viel.

Figuur 4 laat een tijdsreeks zien van de hoeveelheid regenmeldingen uit voertuigen en de hoeveelheid neerslag per uur over heel Nederland. De verdeling van de pieken loopt redelijk synchroon.

Om de correlatie van de hoeveelheid regenmeldingen uit voertuigen en de hoeveelheid neerslag per uur te bepalen, hebben we deze tijdsreeksen genormaliseerd door van iedere waarde het gemiddelde af te trekken en te delen door de standaardafwijking. We passen ook nog een weegfactor toe op de hoeveelheid regenmeldingen uit voertuigen, om rekening te houden met de variërende verkeersdrukte over de dag. Figuur 6 toont van deze exercitie het resultaat.
Hoewel de correlatie niet heel sterk lijkt, zien we wel de positieve richting van de curve. Oftewel: hoe meer regen er valt, hoe meer regenmeldingen we uit voertuigen krijgen. Dat is een indicatie dat de weersgerelateerde meldingen uit voertuigen voldoende nauwkeurig zijn om te gebruiken in verkeersveiligheidsanalyses.

Figuur 4: Het aantal aquaplaning-meldingen per uur van de voertuigdata vertoont vergelijkbare pieken als de gemiddelde neerslaggegevens per uur van KMNI-weerstations.


Figuur 5: Er is een zwakke correlatie tussen de genormaliseerde neerslag per weerstation en de hoeveelheid neerslaggerelateerde meldingen uit voertuigen.


_____

Conclusie
Met deze studie hebben we de waarde van data uit voertuigen geanalyseerd. We hebben laten zien dat ongevallenmeldingen uit voertuigen sneller en nauwkeuriger kunnen worden geregistreerd en dat data uit voertuigen een nuttige aanvullende bron over ongevallen zijn, zeker wat het onderliggend wegennet betreft.
De combinatie van voertuigdata met KNMI-weersgegevens liet zien dat de weersgerelateerde meldingen nauwkeurig genoeg zijn om de relatie tussen weer en verkeersveiligheid nader te onderzoeken.

NDW zal daarom doorgaan met het ontsluiten en testen van voertuigdata, samen met wegbeheerders. De eerste stappen in de richting van slimme veiligheidsinformatietoepassingen die de EU voor ogen had, zijn gezet!

_____

De auteurs
Ir. Bas Turpijn is verkeerskundig adviseur bij het Nationaal Dataportaal Wegverkeer (NDW).
Max Margalith, MSc, is consultant bij D-fine GmbH.