De (on)mogelijkheden van bluetooth- en GSM-data

Is het mogelijk om met behulp van bluetooth-meetsystemen en mobiele-telefoondata goed inzicht te krijgen in de herkomsten en bestemmingen van het verkeer, gesplitst naar de modaliteiten personenauto’s, vrachtverkeer en openbaar vervoer? Het Havenbedrijf Rotterdam besloot dit te onderzoeken, in de hoop zo (nog) beter grip te krijgen op de verkeersontwikkelingen in het havengebied. In deze bijdrage doen de auteurs verslag van het eerste deel van hun datastudie.

 
Haven van Rotterdam
 
Het Havenbedrijf Rotterdam heeft de ambitie om van de Rotterdamse haven een logistiek knooppunt van wereldniveau te maken. Dan moet álles kloppen, ook de bereikbaarheid over de weg. Het Havenbedrijf houdt de verkeersstromen op zijn wegennet daarom nauwlettend in de gaten, onder meer met inductielussen en bluetooth-meetapparatuur. Deze bronnen geven echter onvoldoende zicht op de verdeling personenauto’s, vrachtverkeer en (vooral) openbaar vervoer in relatie tot hun herkomsten en bestemmingen. Op zich zijn de modal split en HB-matrices te bepalen met behulp van verkeerstellingen, kentekenonderzoek, enquêtes enzovoort, maar die methoden zijn bewerkelijk en duur. Ook zijn het geen meetmethoden waarmee je ‘de vinger aan de pols houdt’ – je organiseert immers niet elke dag een enquête.

En juist een actueel inzicht in de herkomsten en bestemmingen en in de verdeling naar modaliteit zou het Havenbedrijf Rotterdam wat waard zijn. Denk aan de nog volop in ontwikkeling zijnde Tweede Maasvlakte. Is een nieuwe buslijn levensvatbaar? Waar zou die moeten beginnen, hoe zou die moeten lopen? Hoeveel auto’s op de weg zou dat schelen? Dat is nu niet of nauwelijks te bepalen.

Het Havenbedrijf besloot daarom de (extra) mogelijkheden van data te onderzoeken, te beginnen bij bluetooth en mobiele telefonie. HIG Traffic Systems en Mezuro kregen de opdracht te bepalen wat er met deze bronnen mogelijk is. Royal HaskoningDHV werd gevraagd het onderzoek inhoudelijk te begeleiden. De partijen rondden hun studie afgelopen december af.

Bluetooth
Het Havenbedrijf wint al vijf jaar data in met behulp van bluetooth. De organisatie heeft in de regio zelf zo’n zeventig bluetooth-kastjes staan, plus nog eens vijftien in het achterland. In eerste instantie werd bluetooth alleen gebruikt om reistijden op de weg te bepalen, maar al snel bleek dat het ook mogelijk is om verplaatsingsgegevens en reistijden van specifiek vrachtverkeer uit de metingen te destilleren. Mede op basis van deze input ontwikkelde het Havenbedrijf het Havenverkeersmodel, een dynamisch model waarin het vrachtverkeer goed en compleet tot zijn recht komt. HIG Traffic Systems richtte zich in zijn onderzoek dan ook op een logische vervolgvraag: zijn bluetooth-data geschikt om een beeld te krijgen van de modaliteit openbaar vervoer?

Om dat uit te zoeken zijn er vijftien extra bluetooth-kastjes geplaatst op typische ‘OV-locaties’ in het havengebied en in de regio. Er zijn meetpunten geplaatst voor de ingang van metrostations en busstations, bij een busbaan, een transferium etc. – zie figuur 1. Zulke meetpunten pikken bluetooth-signalen op in een straal van zo’n 100-200 meter. Met elk signaal wordt ook het MAC-adres van het betreffende device (smartphone, draadloze headset etc.) binnengehaald. [1] Omdat dit adres uniek is, kunnen andere meetpunten in het bluetooth-netwerk het device ‘herkennen’ en zo een verplaatsing vaststellen: iemand is van meetpunt A naar meetpunt B gereisd.

 

Figuur 1
Figuur 1: Tijdens het onderzoek zijn nabij OV-locaties extra bluetooth-meetpunten opgesteld: de blauwe punten.

 
In januari 2015 is er met de extra kastjes informatie ingewonnen voor een testanalyse. Het totaal aantal bluetooth-waarnemingen dat het Havenbedrijf die maand registreerde, lag rond de 2 miljoen; de vijftien OV-meetpunten waren goed voor 229.587 waarnemingen. Dat zijn op zich mooie getallen, maar het aantal waarnemingen dat daadwerkelijk inzicht bood in OV-verplaatsingen was helaas uiterst beperkt.

Allereerst waren 140.971 (61,4%) van de 229.587 waarnemingen enkelvoudig en dus onbruikbaar. Een device was dan op een van de OV-punten gedetecteerd, maar werd verder die dag door geen enkel bluetooth-meetpunt meer waargenomen. Dit had vooral te maken met het feit dat het tijdelijke OV-meetnetwerk bescheiden was uitgevoerd: niet alle mogelijke routes werden voor de test bemeten.
Nog eens 87.880 waarnemingen (38,3 %) waren weliswaar meervoudig (= vastgestelde verplaatsingen), maar het ging dan steeds om één detectie op een OV-punt en één detectie op de weg. De meest waarschijnlijke verklaring hiervoor is ‘bijvangst’ op de OV-meetpunten van langsrijdend autoverkeer. [2]
De oogst van een hele maand meten kwam daarmee op 736 waarnemingen (0,3%) met een OV-locatie als begin- en eindpunt.

Dat er al met al zó weinig echte OV-ritten werden gemeten, was een verrassing. Het deed de vraag rijzen of er überhaupt voldoende OV-reizigers zijn die bluetooth gebruiken. Om daar duidelijkheid over te krijgen heeft HIG een bluetooth-meetstation naast het spoor Bodegraven-Alphen aan den Rijn geplaatst, op een locatie waar bijvangst van ander verkeer is uitgesloten. De bedoeling van deze test was om vast te stellen hoeveel OV-reizigers op dit traject een device met bluetooth ‘aan’ gebruiken. Zoals blijkt uit figuur 2 zijn dat er inderdaad niet heel veel: het gaat om maximaal 20 unieke MAC-adressen per passerende trein.
Een kleine rondgang langs OV-reizigers op het traject verklaart waarom dat zo is. Veel OV-reizigers hebben bluetooth standaard uit staan, omdat ze deze draadloze techniek niet of nauwelijks gebruiken. Dat de bluetooth-penetratiegraad voor autoverkeer wel hoog is – 20 tot wel 70% – heeft puur te maken met het handsfree belgemak dat bluetooth carkits en oortjes de bestuurder bieden. OV-reizigers gebruiken liever bedrade oordopjes of koptelefoons.

 

Figuur 2
Figuur 2: Het aantal unieke MAC-adressen gemeten langs het spoor Bodegraven-Alphen aan den Rijn. Met enige moeite zijn voorbijrijdende treinen waarneembaar, maar het aantal metingen blijft zeer beperkt.

 
Een en ander betekent dat zelfs als het bluetooth-meetnetwerk voor OV fors wordt uitgebreid en ‘gesloten’ wordt gemaakt, bluetooth alléén te weinig matches zal genereren om op betrouwbare wijze OV-reizigersstromen te bepalen.

Is daarmee bluetooth een dood spoor wat OV-metingen betreft? Niet noodzakelijkerwijs. Eén mogelijkheid is om de bluetooth-kastjes ook van wifi-meetapparatuur te voorzien. Wifi wordt thuis en op kantoor veel gebruikt en mogelijk laten OV-gebruikers hun wifi-verbinding tijdens de reis openstaan. Dat zou op zichzelf tot voldoende input kunnen leiden, maar een optie is om wifi en bluetooth te combineren. Over het algemeen is het namelijk goed mogelijk eventuele dubbelingen (zelfde device met bluetooth én wifi aan) te filteren. Het Havenbedrijf overweegt om deze optie in een vervolgstudie mee te nemen.

Mobiele-telefoondata
Dan het onderzoek naar GSM-data, of nauwkeuriger geformuleerd: mobiele-telefoondata. Dit deel van het onderzoek was ruimer van opzet: wat kan het Havenbedrijf met deze databron?

Het is goed om eerst helder te hebben wat er precies aan gegevens beschikbaar is. In Nederland is Mezuro de enige aanbieder van mobiele-telefoondata. Als bron gebruiken zij Vodafone-netwerkgegevens over gesprekken, sms’jes, dataverkeer, de locaties en tijdstippen. Maar in verband met de privacywetgeving krijgen noch Mezuro noch de uiteindelijke afnemers van de data de beschikking over de ruwe data – die bevat simpelweg te veel privacygevoelige informatie. Alleen aantallen mensen en hun verplaatsingen op gebiedsniveau worden dagelijks ontsloten en beschikbaar gesteld. [3] Die gebieden waarop de afnemer kan inzoomen zijn viercijferige-postcodegebieden. De verplaatsingsgegevens betreffen minimaal 16 personen, waardoor er op langere afstanden en bij kleinere tijdsperiodes relaties missen.

Dat zijn flink wat beperkingen, maar daartegenover staat dat Vodafone 3 tot 4 miljoen actieve gebruikers in Nederland heeft, goed voor 380 miljoen transacties (gesprekken, sms’jes, dataverkeer) per dag, oftewel 11,4 miljard per maand. Het havengebied Rotterdam telt maandelijks 80.000 unieke bezoekers met een Vodafone-abonnement. Dat is voldoende voor betrouwbare analyses van het wegverkeer in het gebied, zo blijkt uit vergelijkingen tussen mobiele-telefoondata en lusdata – zie figuur 3.

 

Figuur 3
Figuur 3: Een vergelijking van metingen bij de Botlektunnel A15 met tellussen (NDW-data, grijze lijn), bluetooth (blauw) en mobiele-telefoondata (rood). Het gaat om de data van een enkele maand, weergegeven als tellingen per uur (werkdag). De mobiele-telefoondata op gebiedsniveau zijn voor deze analyse omgezet naar gegevens over specifiek de Botlektunnel met behulp van een kortste-routealgoritme.

 
Interessanter nog is dat van die 80.000 unieke bezoekers bekend is wat hun herkomsten en bestemmingen zijn (geaggregeerd naar viercijferig postcodegebied in Nederland), hoe lang ze erover doen om van gebied naar gebied te reizen en ook hoe lang ze in het havengebied blijven. Dat op zich geeft al antwoord op vragen als: waar komt het verkeer dat naar de Tweede Maasvlakte rijdt vandaan? Via welke locaties/wegen rijdt het buitenlandse verkeer Nederland in? Waar gaat het verkeer dat uit het havengebied vertrekt weer naartoe? Enzovoort. Zie het voorbeeld in figuur 4.

 

Figuur 4
Figuur 4: De top 10 herkomsten van het verkeer met bestemming Maasvlakte.

 
Natuurlijk is daarmee nog niet bekend wat de verdeling naar modaliteit van die verkeersstromen is. Is het mogelijk om allereerst het vrachtverkeer uit de data te destilleren?

Mezuro gebruikte hiervoor in eerste instantie een algoritme dat de (ruwe) data filterde op basis van aantal bestemmingen en de gemiddelde afstand. Dit algoritme kwalificeerde slechts 27% van de ritten naar de Maasvlakte als vrachtverkeer-ritten, terwijl dat volgens traditionele verkeerstellingen rond de 46% zou moeten liggen. Mezuro heeft het algoritme daarom onlangs verfijnd: het gaat nu uit van gemiddelde afstand, aantal doordeweekse ritten en specifiek industriebestemmingen. Deze nieuwe versie kwalificeert 41% als vrachtverkeer-ritten. Dat is veelbelovend, maar het aangepaste algoritme is nog niet gevalideerd door Royal HaskoningDHV. Het is ook onduidelijk hoe dit algoritme scoort op andere locaties.

Hoe zit het met het aandeel openbaar-vervoerreizigers? Puur op basis van de mobiele-telefoondata is daar weinig over te zeggen. Binnen stedelijke gebieden kun je met die data geen uitspraken over de modaliteit doen, simpelweg omdat de locatiebepaling op viercijferig-postcodeniveau daarvoor ontoereikend is. Op regionaal niveau is het wel mogelijk om specifiek treinreizigers uit de stromen te destilleren. Maar omdat er in het havengebied geen OV-treinen rijden, is dat in dit onderzoek van weinig waarde.

Door de met mobiele-telefoondata in kaart gebrachte verkeersstromen met andere data te vergelijken, zijn er echter wel degelijk zinvolle analyses te maken. Neem de vraag of een nieuwe buslijn naar de Tweede Maasvlakte zinvol is. Door bijvoorbeeld de bestaande OV-dienstregelingen naast de verschillende verkeersstromen (dan gefilterd op het aandeel ‘niet-vrachtverkeer’) te leggen, kan de OV-potentie voor een relatie worden ingeschat. De verkeersstromen kunnen ook worden gecombineerd met de uitkomsten van bijvoorbeeld het Onderzoek Verplaatsingen in Nederland (OViN) van CBS.

Uiteraard worden de kansen én ontwikkelingen op het gebied van openbaar vervoer pas echt goed inzichtelijk, als het mogelijk is om het daadwerkelijke aantal OV-reizigers te bepalen, bijvoorbeeld met behulp van wifi.

Conclusie
Er zijn in het onderzoek stappen gezet om het zicht op de verkeersstromen per modaliteit te verbeteren. Wat het vrachtverkeer betreft was bluetooth-data al voldoende betrouwbaar, zeker wat de verplaatsingen in de (goed bemeten) regio betreft. Mobiele-telefoondata hebben de potentie om de relaties buiten het havengebied scherp te krijgen, maar het gebruikte algoritme vereist nog validatie en ‘tuning’.

Als het gaat om openbaar vervoer is het Havenbedrijf op de grenzen van bluetooth- en mobiele-telefoondata gestuit. Er zijn op zich interessante analyses mogelijk door bijvoorbeeld HB-matrices op basis van mobiele-telefoondata naast bestaande OV-lijnen en cijfers van OViN te leggen, maar bluetooth en mobiele-telefoondata bieden het Havenbedrijf geen actueel inzicht in de OV-stromen in de regio. Nader onderzoek moet uitwijzen of wifi dat inzicht wel biedt.

___
 
[1] Aan deze detectie zit wel een maximum, afhankelijk van factoren als de snelheid waarmee de bluetooth-apparaatjes (smartphone in auto bijvoorbeeld) passeren en het bereik van deze systemen. Als het verkeer een snelheid heeft van 50 km/u dan zou een bluetooth-meetpunt theoretisch maximaal 65 MAC-adressen kunnen scannen.
[2] Zelfs als de meting op het OV-punt correct was en er sprake was van een multimodale rit, dan is de waarde van die waarneming beperkt: je brengt nog steeds geen OV-verplaatsing in beeld.
[3] Op deze ruwe data kan Mezuro wel algoritmes en filters toepassen, om de aantallen en verplaatsingen te specificeren naar bijvoorbeeld tijd of ritkenmerken.
 

___
 
De auteurs
Harmen van Dorsser is capaciteitsmanager bij het Havenbedrijf Rotterdam.
Hans Wolfrat en William van Genugten zijn respectievelijk projectmanager ICT en adviseur Mobiliteit bij Royal HaskoningDHV.