Datavaardigheid
Tijdens onze inspiratiedag omschreven wij datavaardigheid (data literacy) als één van de belangrijkste competenties van deze tijd. Uit een rondvraag bleek al snel dat er meerdere opvattingen over datavaardigheid zijn. In deze blog vertellen we meer over onze opvatting van datavaardigheid en hoe wij onze klanten helpen om hierin te groeien.
Actief vs Passief
Datavaardigheid kan gezien worden als een continue leerproces waarin enerzijds het vermogen wordt gecreëerd om data te verzamelen, verwerken, analyseren en communiceren, ook wel actieve datavaardigheid genoemd. Anderzijds, is het daarbij ook van belang dat de data op een juiste manier gelezen, begrepen en geïnterpreteerd wordt; dit wordt ook wel passieve datavaardigheid genoemd.
Om het verschil tussen actieve en passieve datavaardigheid verder te verduidelijken pakken we “Netflix” erbij. Aan de actieve kant van Netflix heb je de makers van de film; zij weten alles van licht, geluid, scenario’s en camera’s. Aan de passieve kant van Netflix vind je de kijker; als kijker wil je begrijpen waar de film over gaat. Daarnaast wil je als kijker dat de beelden vloeiend in elkaar overlopen en als de film of serie is opgenomen in een vreemde taal, dan heb je ondertiteling nodig.
Actief
Passief
Waar een goed opgebouwde film je van begin tot eind meeneemt in het verhaal, helpt een data visualisatie bij het juist interpreteren van de onderliggende data. In een data visualisatie kun je dan ook onderscheid maken in actieve en passieve datavaardigheid waarbij we de volgende categorieën onderscheiden:
- Degene die de visualisatie maakt (encoder)
- Degene die de visualisatie leest (decoder)
Encoding
Om een visualisatie te creëren heb je allereerst de juiste data nodig. Het is van groot belang dat de juiste meetwaardes worden verzameld. Allereerst moeten de systemen juist ingericht worden zodat er data verzameld kan worden. Daarbij moet de invoerder van de data goed weten en begrijpen waarom de data op een bepaalde manier ingevuld dient te worden. Zo weet de gebruiker wat de impact is als een veld misbruikt of leeggelaten wordt.
Vragen die je jezelf in deze stap kunt stellen zijn:
- Welke meetwaardes heb ik nodig voor het beantwoorden van mijn vraag?
- Heb ik hiervoor al data beschikbaar of moet deze data nog gecreëerd worden?
- Wordt de data op de juiste manier gevuld en is deze compleet genoeg?
Door middel van een data structuur zorg je er vervolgens voor dat de juiste connecties in de data kunnen worden gelegd. Denk bijvoorbeeld eens aan een sales dashboard; door de meetwaardes voor omzet en kosten te koppelen, kun je uiteindelijk ook de marge van je producten berekenen. Deze informatie kun je vervolgens weer uitbreiden met productspecifieke informatie zoals kleur, maat en gewicht. In dezelfde stap dien je dus ook na te denken over hoe je de data gaat opslaan.
Vragen die hierin aan bod komen zijn:
- Welke objecten zitten er in mijn data?
- Welke data is generiek en kan ik hergebruiken (dimensies)?
- Welke data is voor elke regel uniek (meetwaarden)?
Als de data dan beschikbaar is, kan er een visualisatie gebouwd worden. Uitgangspunt hierbij is de vraag van de decoder, waarbij er middels de visualisatie geprobeerd wordt om een antwoord op deze vraag te geven. Vaak worden verschillende meetwaarden en dimensies hierin gecombineerd.
Decoding
Nu dat er een visualisatie gemaakt is, neemt de decoder de visualisatie over. Deze persoon probeert eigenlijk aan de hand van de visualisatie terug te gaan naar het begrijpen van de onderliggende data.
De eerste stap hierin is het identificeren van de gecreëerde objecten. Voor het juist interpreteren van de visualisatie is het van groot belang dat de definities bekend zijn. Een datavisualisatie dient zichzelf daarin uit te leggen. Denk hierbij weer even terug aan het sales dashboard; wat wordt er verstaan onder de definities “omzet” en “kosten”?
Iemand die voor de eerste keer naar een visualisatie kijkt, stelt zichzelf vaak de volgende vragen:
- Waar gaat de visualisatie over? (Titel)
- Waar staan de vormen / kleuren in deze visualisatie voor?
- Wat voor tijdspad hangt er achter deze visualisatie?
- Kijk ik naar een som, gemiddelde of mediaan?
Als de definities duidelijk zijn, kun je je een beeld gaan vormen van de relaties tussen de verschillende objecten. Voorbeeld: in het geval de aandacht van de decoder van het sales dashboard getrokken wordt naar een ‘’knalrode” weergave van de marge, dan zal hij in deze fase willen achterhalen wat de betekenis is van deze uitspringende waarde. Het is dan ook vaak de fase waarin een decoder de visualisatie in gebruik gaat nemen, waarbij vanzelf de volgende vragen ontstaan:
- Wat gebeurt er als ik hier op klik / filter?
- Kan ik een verband leggen tussen de verschillende meetwaardes en dimensies die getoond worden?
Voorbeeld: Is er een verband te zien tussen de kosten van een product over tijd?
Wanneer je snapt hoe de data is opgebouwd en hoe de relaties onderling liggen, kun je een juiste interpretatie van de data visualisatie maken. Zo zou het nu mogelijk moeten zijn om een antwoord op je vraag te formuleren en wie weet vanuit daar weer nieuwe vragen te stellen!
Iteratief proces
Die nieuwe vragen ontstaan vaak vanzelf en in tegenstelling tot wat de afbeelding doet vermoeden, is het ontwikkelen van een visualisatie (of compleet dashboard) een iteratief proces. Dit proces wordt vaak gestart met een vraag van de decoder, van waaruit de encoder aan het werk kan gaan met het verzamelen van data. De encoder heeft daarbij input van de decoder nodig omtrent de juiste definities. Als de visualisatie eenmaal ontwikkeld is, dient er bij de eindgebruiker gecheckt te worden of de datavisualisatie juist is.
Een goede manier om dit te checken is het uitvoeren van een “Usability Test”. Tijdens zo’n proces start je met een user story, waarin de vraag van de eindgebruiker is geformuleerd. Vervolgens ga je middels de visualisatie kijken of je een antwoord kunt geven op deze vraag. Daarbij zijn er uiteindelijk 3 uitkomsten mogelijk:
- De datavisualisatie wordt juist geïnterpreteerd en er kan een correct antwoord worden gegeven op de vraag.
- De datavisualisatie wordt juist geïnterpreteerd, maar er wordt een incorrect antwoord gegeven. In dit geval dient er opnieuw gekeken te worden naar de invoer van de data; verloopt dit nog steeds zoals besproken, ontbreken er gegevens of heb ik nieuwe informatie nodig?
- De datavisualisatie wordt onjuist geïnterpreteerd. In dit geval dient er gekeken te worden naar het moment van misinterpretatie. Zijn de definities wel duidelijk genoeg weergegeven in de visualisatie?
Rolverdeling
Naast dat wij vaak zien dat de decoder en encoder twee verschillende personen zijn van twee verschillende afdelingen, kan dit ook één en dezelfde persoon zijn. In dit geval is het van groot belang dat elke stap binnen het datavaardigheidproces doorlopen wordt. Door vervolgens de visualisatie bij een buitenstaander te toetsen, weet je zeker dat de visualisatie geslaagd is!
De onderverdeling in decoder en encoder kan je ook maken in de verdeling van rechten op de Tableau Server / Tableau Online.
- Creator: Maakt en publiceert werkboeken en databronnen naar Tableau Server / Tableau Online. Hij heeft toegang tot de onderliggende data en werkt vaak vanuit de vraag van iemand met Viewer rechten.
- Explorer: Kan werkboeken bouwen aan de hand van gepubliceerde databronnen, of met bestaande werkboeken en dashboards aan de slag.
- Viewer: Heeft geen toegang tot de onderliggende data en kan alleen de werkboeken bekijken en de visualisaties lezen.
Ondersteuning door Infotopics
Datavaardigheid zie je binnen Infotopics gelijk terug in ons motto:
‘Zien, begrijpen, doen!’
Het is van belang dat iemand een visualisatie ziet, gelijk begrijpt en hier vervolgens acties uit kan laten voortvloeien. Dan ga je namelijk echt waarde uit je data halen.
Als Infotopics kunnen we dan ook ondersteunen in alle facetten van het datavaardigheidproces. Allereerst kunnen we door middel van een datavaardigheidstest achterhalen hoe data geletterd iemand is (nul meting). Vervolgens bieden wij een maatwerk opleidingstraject aan, die zowel de encoder als de decoder kunnen ondersteunen en versterken in hun werkzaamheden. Daarnaast ondersteunen wij ook vaak in het maken van de brug tussen beide kanten, omdat we zien dat hier nog veel verbeterpotentieel ligt. Wanneer beide partijen samenwerken is de kans groot dat data succesvol wordt toegepast en inzichten oplevert waarop je gericht actie kunt ondernemen.