Infotopics Weekly Tableau Data Challenge: #1 RDW Data Design – De antwoorden
Deze week publiceerden wij de eerste Weekly Tableau Data Challenge met als onderwerp RDW Data Design. In deze blog geven we het antwoorden op de vragen die in de blog werden gesteld. Doe je volgende week (weer) mee?!
Hoeveel unieke gebreken zijn er?
Er zijn 593 unieke gebreken geconstateerd.

Neemt dit aantal toe over de tijd?
Ja, er is een licht stijgende trend in het aantal unieke gebreken dat elke maand wordt gevonden.

Welke gebreken komen het meeste voor?

Wat vind je hier opvallend aan?
Er is een gebrek waarbij een band onvoldoende profiel heeft, maar er is ook een gebrek waarbij er weinig bandprofieldiepte wordt geconstateerd. Weinig profieldiepte is geen reden tot afkeuring, maar geldt als advies. De RDW legt dit uit:
Dit zijn geen afkeurpunten, maar punten waarvan te verwachten is dat deze binnenkort niet meer aan de APK-eisen voldoen en waarschijnlijk binnen 1 jaar aan herstel of reparatie toe zijn. Deze punten gelden als advies voor de eigenaar van het voertuig.
In welke maand worden de meeste gebreken geconstateerd?
In januari worden de meeste gebreken geconstateerd.

En verschilt dit per merk?
Ja, er zit variatie tussen verschillende merken. Zo heeft bijvoorbeeld Ford in verhouding veel meer geconstateerde gebreken in januari ten opzichte van de verdeling van de andere 4 grote merken:

Of, iets pittiger: hoeveel gebreken zijn er in totaal waarbij iets met een lamp of licht aan de hand is?
Er zijn 106 verschillende gebreken die het woord ‘licht’ in de omschrijving hebben en dit telt op tot 5,2-miljoen gebreken.

En wat is het aandeel hiervan ten opzichte van de rest van de gebreken?
Het aandeel van deze gebreken is zo’n 23% van het totaal:

Winnaar van de week: Robby
Bedankt voor je inzending Robby! Je bent de winnaar van de week. Bekijk hier zijn interactieve dashboard.

Ga je de uitdaging aan en word jij volgende week de winnaar?
Lukt het jou ook om de challenge te voltooien? Houd onze website en social media in de gaten voor de nieuwe challenge.
Hallo Ruud,
Jammer dat mijn vrijdag al volgepland was, anders had ik graag meegedaan, leuke challenge.
Een vraag en een opmerking.
Klopt het dat de grotere dataset voor deze challenge anders is dan de geaggregeerde? GebrekID is zo te zien uniek en nooit leeg, dat levert 17.883.381 IDs op waarbij een ID volgens mij een gebrek is. De geaggregeerde set komt op 22.610.020 gebreken.
Daarnaast een opmerking: de uitkomst voor de lamp of licht vraag is fout. Je telt de gebreken aan richtingaanwijzers nu niet mee (14 categorieën) en je telt ‘verpLICHTe gordel ontbreekt’ wel mee als gebrek aan de verlichting.
Vriendelijke groet, Alexander
Hoi Alexander, je hebt helemaal gelijk over de wat pittigere vraag! Ik kom op 119 unieke gebreken uit en 6M constateringen als ik opnieuw tel, maar nu twijfel ik of reflectoren ook een probleem zijn met de verlichting. Ik hoop dat er nog een oplettende lezer voorbij komt 😉
Over jouw andere vraag: als je de 2 datasets vergelijkt telt het ‘gebrekAantal’ in beide sets op tot ‘t zelfde getal. Het gebrekID is inderdaad uniek, maar mijn vermoeden was dat een gebrek meerdere keren kan worden geconstateerd (gebrekAantal). Ik weet helaas niet zo veel van auto’s, maar wel dat de meeste auto’s maar 1 stuur hebben en bijna altijd meer dan 1 wiel. Het leek mij dus waarschijnlijk dat een stuurkogel gemiddeld niet meer dan 1x speling kon hebben en dat de bandenspanning gemiddeld vaker dan 1x niet op de juiste waarde kon zijn, dus heb ik mijn vermoeden getoetst met een scatter plot: https://i.imgur.com/clhk0YX.jpg
Doe je mee met de nieuwe Challenge?