Sociale media als databron

Koningsdagen, muziekfestivals, botenparades – steeds meer steden zetten zich op de kaart met een spetterend stadsevenement. Crowdmanagement wordt daarmee belangrijker. In zijn promotieonderzoek onderzoekt Vincent Gong in hoeverre data op basis van sociale media de steden kunnen helpen zicht te houden op de mensenmassa’s.

Voor het crowdmanagement van een (stads)evenement bereiden de evenementenorganisatie, de gemeente en de politie mogelijke maatregelen voor die afhankelijk van de situatie op straat worden ingezet. Kennis van die situatie is dan een vereiste: we willen weten hoe groot de menigte is, hoe het staat met de dichtheid, waar de mensen zich bevinden, waar ze naar toe gaan, wie de bezoekers precies zijn en wat de ‘emotie’ van de mensenmassa is.

Voor die informatie is de organisatie vaak nog sterk afhankelijk van de waarnemingen van stewards ter plaatse. Soms worden ook sensorsystemen gebruikt, zoals telsystemen en bluetooth- en wifi-systemen. Een nadeel is dat sensorsystemen vrij duur zijn in gebruik en alleen op de plek waar ze zijn bevestigd data verzamelen. Om die reden moeten organisatoren het vaak doen met alleen menskracht.

Er is echter een relatief nieuwe en goed toegankelijke bron waar we uit kunnen putten: sociale media. Gebruikers van diensten als Instagram en Twitter genereren alleen al in Nederland elke dag miljoenen berichtjes: een tekst, een foto of een filmpje dat te linken is aan het profiel van de gebruiker, een tijdstip en – afhankelijk van de instellingen op de smartphone – een locatie (een geotag: waar bevond de persoon zich toen het bericht werd geplaatst?). Daarmee hebben we in potentie goud in handen, omdat we via die data als het ware onderdeel van de bezoekersmenigte worden.

Uitdagingen
Maar we schrijven bewust ‘in potentie’: er zijn namelijk nog enkele (stevige) barrières te slechten. Een eerste probleem is de beperkte beschikbaarheid van sociale-mediadata, zowel in tijd als in ruimte. Er worden weliswaar miljoenen berichten per dag gepost, maar dat gebeurt natuurlijk lang niet allemaal tijdens dat ene stadsevenement en op de locatie waar dat evenement plaatsvindt. Vervelender nog is dat slechts een vrij laag percentage berichten geotagged is – en dat is een voorwaarde om een bericht überhaupt aan de locatie van het evenement te kunnen koppelen. Vooral na de #nogeo-acties op Twitter en Instagram is de beschikbaarheid van geo-gerefereerde sociale-mediagegevens teruggevallen.

De tweede uitdaging is de bias die inherent is aan sociale-mediadata. Het gebruik van sociale media is immers niet gelijkelijk over de bevolking verdeeld. Jongeren gebruiken sociale media bijvoorbeeld meer dan de oudere generatie. Ook geldt dat vrouwen meer beeldgebaseerde sociale media (Instagram) gebruiken dan mannen. De informatie die we via de data kunnen afleiden, is dus nooit echt representatief voor de gehele populatie. Bovendien nodigen sociale media uit om te klagen of om juist heel positieve berichten te plaatsen.

Dan is er nog de uitdaging om überhaupt zinvolle informatie uit de berichten af te leiden. Oftewel: hoe vertalen we al die tekstjes en foto’s in bijvoorbeeld aantallen of dichtheid? Om dat geautomatiseerd te doen staan we voor de lastige taak om tekst en beeld softwarematig te interpreteren.

In ons onderzoek aan de TU Delft hebben we met een aantal casestudies proberen vast te stellen waar we precies staan met sociale-mediadata: in hoeverre zijn die bruikbaar voor (de ondersteuning van) crowdmanagement gedurende een stadsevenement? Uiteraard hebben we in de studies alle richtlijnen omtrent persoonsgegevens gerespecteerd.

Karakterisering van de menigte
Een eerste vraag die we hebben onderzocht, is wat sociale-mediadata ons leren over de karakteristieken van de menigte. We hebben bij wijze van casestudie twee evenementen onderzocht, Sail 2015 in Amsterdam en Koningsdag 2016, ook in Amsterdam. Het aardige van deze evenementen is dat we de analyses kunnen vergelijken: het gebied waarin het Sail-evenement plaatsvond (voornamelijk het gebied rond het IJ), valt geheel binnen het gebied van de Amsterdamse Koningsdag (het gebied binnen de Ring A10).

We hebben van beide evenementen de Twitter- en Instagram-data geanalyseerd op de demografie van de menigte (leeftijd en geslacht), het bezoekmotief (zijn het toeristen of inwoners van de stad), de verdeling van de drukte in de tijd, de locatie van de berichten en het woordgebruik. We lichten hieronder kort wat resultaten toe.

Leeftijd: Uit onze analyse van de sociale-mediadata blijkt dat de leeftijdsverdeling op Koningsdag gelijkmatiger was dan tijdens Sail. Simpel gezegd: Koningsdag trok meer ‘mensen van alle leeftijden’. Dit is in lijn is met de verwachte samenstelling van de menigte van deze evenementen.

Geslacht: We zien nauwelijks verschillen tussen Sail en Koningsdag als het gaat om de man-vrouwverhouding. In enkele deelgebieden waren er wel verschillen. Op het Zuidplein tijdens Koningsdag bijvoorbeeld was het aandeel vrouwen in de sociale-mediadata groter. De verklaring hiervoor moeten we waarschijnlijk zoeken in de recreatieve activiteiten op het Zuidplein tijdens Koningsdag: die nodigden mogelijk meer uit om foto’s te posten – en dat zorgt lokaal voor bias (meer vrouwen dan mannen posten foto’s).

Bezoekmotief: Koningsdag trekt meer ‘locals’ en minder toeristen in vergelijking met Sail, zo leren Twitter en Instagram. Dat lijkt logisch: mensen uit andere steden (en zelfs landen) zijn eerder bereid om naar Amsterdam te reizen voor een Sail-evenement dat eens in de vijf jaar plaatsvindt, dan voor het jaarlijkse Koningsdag-evenement (dat ze in hun eigen stad misschien ook hebben).

Verdeling van de drukte in de tijd: Een groot evenement als Sail en Koningsdag omvat vaak meerdere ‘sub-evenementen’, verspreid over verschillende locaties in de stad. De sub-evenementen die in grotere gebieden plaatsvinden en meerdere uren duren, zijn vaak goed te herkennen aan de verdeling in tijd van de berichten via Twitter en Instagram. Zie bijvoorbeeld figuur 1, waar de start van de parade van Tall Ships duidelijk is af te leiden uit het aantal berichten in de betreffende gebieden (langs de kades van het IJ). Als we met sociale data dit soort geplande activiteiten kunnen identificeren, moet dat ook mogelijk zijn voor ongeplande, spontane (sub-) evenementen.
 

Verdeling in tijd van de sociale-mediaberichten (en dus de menigte) tijdens Sail 2015.

 
Locatie van berichten: In het gebied van de IJhaven is tijdens Sail meer gebruikgemaakt van sociale media dan tijdens Koningsdag – zie figuur 2. Dat is uiteraard wat we zouden verwachten, omdat Sail rond het IJhaven-gebied is geconcentreerd.
 
De heatmap van de locatie van berichten (en dus mensen).

 
Woordgebruik: Uit een analyse van de teksten van berichten konden we een aantal ‘topwoorden’ destilleren. In dit overzicht van veel gebruikte woorden herkennen we het betreffende evenement – kanaal, Dam, Rijksmuseum, boot, schip – maar ook de gevoelens van de menigte: cool, beautiful, happy, love enzovoort. Interessant is dat op Koningsdag ook woorden als ‘vertraagd’ en ‘vechtpartij’ hoog scoren: interessante informatie voor crowdmanagers die dan weten welke gebieden ze extra in de gaten moeten houden.

Omvang menigte bepalen
Essentiële informatie voor crowdmanagement is het aantal voetgangers in een gebied. Dit aantal moeten we onder een bepaalde kritische waarde zien te houden, gezien het risico op overbelasting en zelfs verdrukking, in heel letterlijke zin. Om te kijken of sociale-mediadata ons kunnen helpen het aantal mensen in een gebied te schatten, hebben we gekeken wat we kunnen afleiden van op Instagram geposte foto’s. De casestudie betrof dit keer de Koningsdagen in 2016, 2017 en 2018 en Europride 2017, wederom in Amsterdam. Zie figuur 3 voor een aantal kenmerkende foto’s van die evenementen.

In de casestudie hebben we vier innovatieve methoden beproefd waarmee je personen in een afbeelding kan identificeren (en dus tellen): Faceplusplus, Darknet Yolo en twee Cascade-methoden (A en B). Om hun effectiviteit te bepalen, hebben we een geannoteerde dataset gemaakt, dat wil zeggen: een set afbeeldingen waarvoor we handmatig het aantal personen hebben bepaald. Deze zogenaamde ground truth (het correcte aantal personen) hebben we vergeleken met de resultaten van de vier methoden.
Omdat het moeilijk is om op basis van een foto het exacte aantal personen in een grote menigte vast te stellen, hebben we de afbeeldingen in klassen verdeeld. Als er minder dan twintig personen op de foto staan, hebben we wel het exacte aantal personen als referentie gebruikt. Voor grotere aantallen is met (grovere) schattingen (klassen) gewerkt.

We vonden dat de directe methoden Faceplusplus en Darknet Yolo beter schatten dan de indirecte Cascade-methoden. Verder geldt dat het type foto bepalend is voor de resultaten. Het scheelt nogal of de afbeelding een selfie is of niet, of de meeste personen op de voorgrond of op de achtergrond van de foto staan en of de foto werd genomen vanaf een hoog uitkijkpunt of parallel aan het straatniveau. Al met al geeft Darknet Yolo de hoogste nauwkeurigheid (72%) in het schatten als er grote groepen/menigten op de foto staan, terwijl Faceplusplus de hoogste nauwkeurigheid (41%) bereikt bij het exact tellen van kleinere groepen.
 

Voorbeelden van afbeeldingen verzameld tijdens Koningsdag 2016-2018 en Europride 2017 in Amsterdam.

 
Schatting van de dichtheid
In een derde onderzoek hebben we de geotags van de sociale-mediaberichten gebruikt om de dichtheid te schatten, dus het aantal personen in een gebied gerelateerd aan het oppervlak van dat gebied. We hebben drie schattingsstrategieën ontwikkeld: geo-, snelheids- en flow-gebaseerde dichtheidsschattingsstrategieën. Deze zijn getest in vijf (deel)gebieden tijdens Sail 2015 en Koningsdag 2016.

De flow-gebaseerde methode combineert de locaties waar sociale-mediaberichten zijn gepost met de onbewerkte gegevens van wifi-sensoren. Van wifi-sensoren is bekend dat ze het aantal voetgangers onderschatten, dus we wilden zien of de combinatie met sociale data betere resultaten oplevert. Deze methode leverde veelbelovende prestaties op in alle vijf de deelgebieden, zowel in termen van het gemiddelde verschil met de daadwerkelijke dichtheid (een 20% tot 123% verbetering ten opzichte van andere methoden) als met het voorspellen van de patronen in de dichtheid over tijd.
De op snelheid gebaseerde methode vertoont ook een sterke temporele correlatie, maar met hogere schattingsfouten. Geo-gebaseerde methoden gebruiken alleen de locaties van berichten en leveren als zodanig alleen bruikbare resultaten op wanneer de hoeveelheid berichten in het beoogde terrein voldoende hoog is.

Behalve de gebruikte methode zijn er nog andere factoren die bepalend zijn voor de nauwkeurigheid, zoals de infrastructurele eigenschappen van het betreffende gebied (waar zijn de knelpunten), demografie en de Points of Interest-voorkeuren van de menigte (waar willen mensen graag een bericht plaatsen). De maximale prestatie in onze case studies is bereikt op het terrein van Javakade tijdens Sail – zie figuur 4.
 

Een voorbeeld van de resultaten van de dichtheidsschattingen op de Javakade tijdens Sail 2015. Hierbij geeft de rode lijn de sensordata aan (werkelijke dichtheid), de blauwe lijn de flow-gebaseerde methode, de turquoise lijn de op snelheid gebaseerde methode en de oranje lijn de geo-gebaseerde methode.

 
Vervolgstappen
Bovenstaande resultaten geven aan dat sociale-mediadata potentie hebben: met name het schatten van dichtheden, gecombineerd met het verkrijgen van informatie over menigtes stelt crowdmanagers in staat om betere maatregelen voor het managen van de menigte te nemen. Bovendien geven sociale-mediadata meer informatie over het evenement zelf en bieden ze mogelijkheden voor een betere evenementplanning. Lang niet alle barrières zijn echter voldoende geslecht – en er is meer onderzoek nodig willen sociale-mediadata een volwaardig alternatief vormen bijvoorbeeld sensorsystemen. Vooralsnog is deze nieuwe bron dus vooral een mogelijke aanvulling op bestaande informatiebronnen.

We gaan dan ook verder met onze studie naar sociale-mediadata. In de volgende fase van ons onderzoek willen we kijken hoe de methoden voor het bepalen van de karakterisering, omvang en dichtheid van menigten zich houden in verschillende contexten: verschillende typen stadsevenementen, groottes en typen locaties in de stad. We zullen methoden verkennen om de menigte beter te karakteriseren, bijvoorbeeld in termen van economische status, beroep, interesseonderwerpen en sociale netwerken. Ook willen we onderzoeken hoe om te gaan met het feit dat zo weinig berichten geotagged zijn. Kunnen we andere lokalisatietechnieken toepassen om het aantal berichten dat te koppelen is aan een evenement, te vergroten? Voorbeelden zijn het identificeren van landmarks op foto’s en het doorzoeken van het bericht zelf op locatieaanwijzingen (zoals #SAIL2015).

Een laatste stap is meer praktisch van aard: we willen de sociale media-karakteriseringsmethoden integreren in ons TU Delft-crowdmonitoringsysteem. Een eerste succes hebben we daarbij al geboekt: op een evenement op de campus van de TU Delft konden we real-time woordwolken van bezoekers genereren uit hun Twitter-berichten.

____

De auteurs
Ir. Vincent Gong is PhD-onderzoeker aan de TU Delft.
Dr.ir. Winnie Daamen is universitair hoofddocent Actieve modaliteiten en dataverzameling aan de TU Delft.
Prof.dr.ir. Alessandro Bozzon is hoogleraar Human-Centered Artificial Intelligence aan de TU Delft.
Prof.dr.ir. Serge Hoogendoorn is hoogleraar Stedelijke mobiliteit aan de TU Delft.