Sinds deze zomer heeft de politie een eigen dataportaal. Dit portaal bevat cijfers over geregistreerde criminaliteit, politieprestaties en de bedrijfsvoering van de politie. Door de term “geregistreerde criminaliteit” werd ik direct nieuwsgierig. De vraag in welke woonplaats of gemeente de meeste (geregistreerde) misdrijven gepleegd worden, kan iedereen zonder de data te bekijken wel beantwoorden. Maar wat is de meest veilige gemeente van Nederland? En hoe verhoudt het aantal misdrijven zich ten opzichte van het aantal inwoners binnen een gemeente?

Stap één: Data discovery

Het leek mij een mooie uitdaging om deze vragen met behulp van Alteryx en Tableau in kaart te brengen.

Allereerst ben ik begonnen met de data discovery: wat is er precies aan data te vinden op het portaal en wat is de granulariteit van de beschikbare data? De misdaadcijfers zijn beschikbaar op jaar en jaar-maand niveau en zowel op woonplaats als gemeente niveau. Ik heb ervoor gekozen om de data op jaar en gemeente niveau te analyseren. De keuze hiervoor is mede gebaseerd op het feit dat inwoneraantallen van woonplaatsen op CBS niet voor ieder jaar beschikbaar zijn. Per gemeente zijn de inwoneraantallen per jaar wel te verkrijgen. Deze inwoneraantallen heb ik nodig om het aantal misdrijven af te zetten tegen het aantal inwoners binnen een gemeente om zo een ratio van misdrijven per inwoner te kunnen berekenen in Tableau.

Na de laatste 5 jaren te hebben gefilterd, heb ik de data als csv file van het politie dataportaal gedownload. De dataset bestaat uit twee dimensies; [Gemeente] en [Jaar] en één meetwaarde [Aantal misdrijven] en ziet er als volgt uit:

Data: Aantal misdrijven, per jaar per gemeente

Op het CBS is geografische data beschikbaar, hier heb ik shape files van de gemeentelijke indeling per jaar gedownload. In deze bestanden staan op jaar niveau de polygonen (vorm van een gemeente) en een meetwaarde met het aantal inwoners van de verschillende gemeentes:

CBS Data per woonplaats aantal inwoners

Data bewerken met Alteryx voor de gewenste analyse

Nu wil ik deze twee bronnen aan elkaar verbinden om de gewenste analyse te doen. Dit is waar Alteryx uitermate geschikt voor is:

De data bewerking in Alteryx

In het bovenste deel van de stroom prepareer ik de csv file (met aantal misdrijven) voor verder gebruik. In dit bestand zijn alle misdrijven geaggregeerd naar de gemeentelijke indeling van 2017.

In het onderste deel van de stroom wordt het wat interessanter. In de afgelopen jaren zijn er namelijk ieder jaar gemeentes gefuseerd in nieuwe of reeds bestaande gemeentes. Om de twee bronnen aan elkaar te kunnen knopen zonder data te verliezen is het dus zaak om de gemeentes die in de afgelopen 5 jaar zijn gefuseerd samen te voegen naar de gemeentelijke indeling van 2017.

Met de summarize tool groepeer ik op [Gemeente] en sommeer ik de meetwaarde [Aantal Inwoners] en combineer ik de polygonen om zo tot één nieuwe gemeente te komen:

Data bewerking "summerize tool"

Voor:

Na:

Gemeenten na de fusie

Nu heb ik twee bronnen met evenveel gemeentes met de daarbij horende inwoneraantallen per jaar. Middels de join tool kunnen de bronnen op basis van de velden [Jaar] en [Gemeente] aan elkaar gejoind worden. Nu heb ik één bestand met de dimensies [Jaar] en [Gemeente] de meetwaardes [Aantal misdrijven] en [Aantal inwoners] en een polygoon van de betreffende [Gemeente]:

Nu de data geprepareerd en samengevoegd is kunnen we aan de slag met Tableau.

Aan de slag met de data in Tableau

De polygonen kunnen gemakkelijk door Tableau gelezen en op een kaart geplot worden. Wanneer we de meetwaarde [Aantal inwoners] op kleur plaatsen zie je dat gemeente Amsterdam het donkerst ingekleurd wordt en daarop volgend Rotterdam en Den Haag:

De kaart geplot in Tableau

Deze conclusie had je waarschijnlijk ook zonder Tableau kunnen trekken. Om de gemeentes echt goed met elkaar te vergelijken heb ik in een calculated field het aantal misdrijven afgezet tegen het aantal inwoners:

Calculated field in Tableau

Uit dit calculated field komt een percentage. Een percentage van 8% wil zeggen dat er 8 misdrijven plaatsvinden op 100 inwoners van een gemeente. Wanneer we deze [Misdrijf/inwoner ratio] op kleur plaatsen ontstaat er veel meer context op de kaart:

Aantal misdrijven per 100 inwoners

Met een “Table calculation” heb ik vervolgens de rank (rangorde) van de gemeentes op basis [Misdrijf/inwoner ratio] bepaald. Daarnaast heb ik een top en bottom sheet toegevoegd om de uitschieters snel inzichtelijk te krijgen. Gemeente Dalfsen heeft in 2017 het minste aantal misdrijven per inwoner. Wat opvalt is dat het misdrijf/inwoner ratio van gemeente Waadhoeke slechts 0,13% boven dat van Dalfsen zit, terwijl deze gemeente ruim 2x zoveel inwoners heeft. Gemeente Roermond heeft een vergelijkbaar inwoneraantal als dat van Waadhoeke echter is Roermond de op 4 na minst veilige gemeente van Nederland in 2017 en is daarmee zelfs minder veilig dan gemeente ‘s-Gravenhage.

Het eindresultaat

Benieuwd hoe veilig de gemeente is waar jij woont? Door met de muis op jouw gemeente op de kaart te gaan staan zie je de exacte cijfers in de tooltip met daarbij een trend van [Misdrijf/inwoner ratio] over de laatste 5 jaar. 

Zelf aan de slag in Alteryx & Tableau?

Wil je zelf aan de slag in Alteryx & Tableau om de vragen die in jouw organisatie spelen weer te geven middels visualisaties? Download dan de gratis trials: https://infotopics.nl/software/download/