Lees je wel eens het nieuws waarin allerlei statistieken worden vermeld, maar je eigenlijk meer inzichten wilt vergaren? Of heb je een website in gedachten waar veel statistieken op vermeld staan die bruikbaar kunnen zijn voor jouw business, maar je niet weet hoe je deze data kunt ontsluiten? Lees dan deze blog.

Interesse in auto’s

Van jongs af aan was ik altijd al geïnteresseerd in voertuigen. Waar het als kind zijnde tractors waren, daarna motoren en de laatste jaren auto’s. Door mijn interesse in auto’s probeer ik altijd zo veel mogelijk het nieuws in de gaten te houden. Eén van die nieuwssites is autoweek.nl. Ik lees elke dag het nieuws en ben hierdoor heel veel te weten gekomen over auto’s.

Eén van de dingen die mij interesseren op het gebied van auto’s zijn verkoopstatistieken. De automotive branche zit de laatste jaren weer in de lift en het omzetniveau zit weer op het niveau van voor de crisis. Als ik dit soort nieuwsberichten lees dan vraag ik mij af wat voor merken en modellen het goed doen. Vaak wordt er summier ingegaan op enkel de top vijf merken of modellen, maar ik ben ook geïnteresseerd in merken of modellen die buiten de top vijf vallen.

Autoweek kan mij hierbij helpen, aangezien zij op hun website verkoopcijfers presenteren over de verschillende jaren, merken en modellen. Deze overzichten zijn echter niet ideaal, aangezien ik steeds moet navigeren naar een dieper niveau op de website en het op deze wijze ook moeilijker is om merken en modellen te vergelijken. Ik zou deze inzichten graag in één overzicht willen zien.

Alteryx

Hier komt Alteryx in beeld. Binnen Alteryx is het mogelijk om HTML-code op te halen van een website. Op deze wijze kun je een eigen dataset genereren om inzichten te verkrijgen die op het eerste oog niet mogelijk waren. Dit zou je ook handmatig kunnen doen door alles te kopiëren in een Excel-bestand en vervolgens in te laden in Tableau. Echter kost dit veel meer tijd en dien je elke keer allerlei handmatige bewerkingen opnieuw uit te voeren. In Alteryx kan er eenmalig een workflow worden gemaakt en deze kan op elk gewenst moment gedraaid worden om nieuwe data op te halen. In Alteryx maak ik gebruik van een aantal tools om tot de juiste output te komen. Dit zijn de volgende tools:

Blog data van websites ontsluiten met Alteryx en Tableau - Download Tool.jpg

Download tool
Met de download tool kan data worden opgehaald van een specifieke URL. Dit is de tool in Alteryx om data van websites op te halen. De output bestaat uit twee kolommen: DownloadData en DownloadHeaders.

Data van websites ontsluiten en visualiseren met Alteryx en Tableau (2) - Infotopics - Tableau Gold Partner

Text to columns tool 
Met de text to colums tool kan er eenvoudig de tekst van een veld in verschillende rijen of kolommen worden gesplitst. In het geval van data ophalen van een website is dit heel erg handig. Op deze wijze kunnen we de code die in de DownloadData kolom staat eenvoudig verder uitsplitsen. Hiervoor gebruiken we vaak de delimiter \n (new line).

Data van websites ontsluiten en visualiseren met Alteryx en Tableau (3) - Infotopics - Tableau Gold Partner

Find Replace tool   
De find replace tool zoekt naar data in een veld van een input tabel en vervangt die met de gespecificeerde data in het veld van de referentietabel. In de workflow wordt dit gebruikt om op eenvoudige wijze te zien in welke DownloadData-regels er bruikbare data zit.

Data van websites ontsluiten en visualiseren met Alteryx en Tableau (4) - Infotopics - Tableau Gold Partner

Formula tool 
Met de formula tool kunnen nieuwe kolommen worden aangemaakt of bestaande kolommen worden geüpdatet door gebruik te maken van bepaalde expressies en/of calculaties. In de workflow wordt dit met name gebruikt om de HTML-tags te vervangen door een betere tag om vervolgens de boel eenvoudiger op te kunnen splitsen of op te schonen.

Data van websites ontsluiten en visualiseren met Alteryx en Tableau (5) - Infotopics - Tableau Gold Partner

Filter tool 
De filter tool filtert rijen op basis van de criteria die worden ingevuld. De filter tool heeft altijd twee outputs, true en false. In de workflow wordt dit met name gebruikt om lege regels weg te filteren en enkel met de gewenste output verder te gaan.

Data van websites ontsluiten en visualiseren met Alteryx en Tableau (6) - Infotopics - Tableau Gold Partner

Select tool     
Met de select tool kunnen velden hernoemd worden, gewijzigd in positie worden en veldtypen gewijzigd worden. In de workflow gebruik ik deze voor alle drie de mogelijkheden.

Data van websites ontsluiten en visualiseren met Alteryx en Tableau (8) - Infotopics - Tableau Gold Partner

Sample tool 
Deze tool wordt gebruikt om de data tot een opgegeven aantal, percentage of willekeurige reeks rijen te beperken.

Data van websites ontsluiten en visualiseren met Alteryx en Tableau (9) - Infotopics - Tableau Gold Partner

Multi-row formula tool   
De multi-row formula tool is een uitgebreidere variant op de formula tool. Met deze tool kan men calculaties doen over regels heen. In de workflow wordt deze tool gebruikt om het merk en het model terug te laten komen op tussengelegen lege regels.

Data van websites ontsluiten en visualiseren met Alteryx en Tableau (10) - Infotopics - Tableau Gold Partner

DateTime tool
Omdat we vanuit de achterliggende website enkel jaren en maanden ophalen en geen exacte datum, gaan we deze aanmaken in Alteryx. Dit zou in principe ook in Tableau kunnen, maar er wordt aangeraden dit in de ETL-laag te doen. Deze datum wordt vervolgens weer gebruikt om mee te rekenen in Tableau en om data eenvoudig in een lijngrafiek te plotten.

Met behulp van deze tools kunnen we in Alteryx een workflow maken om tot een dataset te komen die we vervolgens gaan visualiseren in Tableau.

Alteryx workflow - Infotopics - Tableau Gold Partner

Alteryx dataset - Infotopics - Tableau Gold Partner


Tableau

Wanneer de dataset in Alteryx gegenereerd is kan er in Tableau een dashboard gebouwd worden. Met dit dashboard worden er inzichten vergaard die nodig zijn om jouw vragen te beantwoorden. Ook om mijn eigen vragen te beantwoorden heb ik een dashboard gebouwd op basis van de dataset die ik heb gecreëerd met Alteryx. Dit dashboard is publiekelijk toegankelijk op Tableau Public en daarnaast is deze hieronder weergegeven:

Het mooie aan het dashboard is dat je eenvoudig periodes met elkaar kunt vergelijken. Daarnaast vallen er in de trendgrafiek meteen zaken op. Waar er in de afgelopen jaren telkens in december veel auto’s werden verkocht, i.v.m. bijtellingsveranderingen voor het jaar erop, is nu te zien dat december 2017 juist een slechte maand is aangezien er geen bijtellingsveranderingen meer zijn en men dus liever een auto koopt van het huidige jaar.

Slot

Met Alteryx kunnen we een dataset genereren die we in Tableau kunnen visualiseren. We kunnen dus zeggen dat de combinatie van Alteryx en Tableau ons in staat stelt om vragen te beantwoorden en/of extra informatie te geven die we in eerste instantie niet mogelijk achtten.

Ervaar zelf de kracht van Alteryx en Tableau: Download hier de gratis trials en schrijf je hier in voor onze gratis Tableau workshops, Alteryx workshops en Alteryx&Tableau workshops.