Data management vanuit je analytics platform
Door de groeiende vraag naar data neemt de complexiteit toe, waarmee data management binnen het analytics platform een steeds belangrijkere rol gaat spelen. Organisaties en medewerkers willen grip hebben en houden op hun data, maar hoe? Want:
- ‘Waar vind ik de juiste data en waar komt het vandaan?’
- ‘Hoe kan ik eenvoudig en eenduidig communiceren over datakwaliteit?’
- ‘Hoe weet ik of ik naar juiste en betrouwbare data kijk?’
- ‘Wat zijn de gevolgen van een wijziging in de data?’
In deze blog neem ik jullie mee in hoe Tableau data management verweven heeft binnen het analytics platform met het kenmerkende gebruiksgemak.
Tableau Catalog
Met Tableau Catalog kun je binnen het analytics platform gemakkelijk, effectief en snel grip krijgen én houden op de beschikbare data. Deze functionaliteit, samen met de Tableau Prep Conductor onderdeel van de Data Management Add-on, biedt meer inzicht in de data wat leidt tot beter datamanagement. Het geeft sneller en makkelijker antwoord op de vraag welke data waar, hoe en door wie wordt gebruikt.
Hoe werkt dit in de praktijk? Dat gaan we hieronder toelichten aan de hand van een aantal use cases.
Datakwaliteit monitoren
Datakwaliteit is een belangrijke factor in het succes van analytics projecten. Het kenmerkt de juistheid en volledigheid van de data. Is dit op orde, dan zullen gebruikers vertrouwen op de data. En op het moment dat gebruikers op de data vertrouwen, zullen zij geneigd zijn het sneller te gaan gebruiken.
Het kan zijn dat data verouderd of juist onderhevig is aan een update. Als dit het geval is, dan wil je daarvan op de hoogte zijn zodat je voorkomt dat er bijvoorbeeld beslissingen worden genomen op basis van onjuiste of onvolledige data. Met quality warnings wordt de mogelijkheid geboden om labels/alerts toe te kennen aan datasources, prep flows, tabellen en databases. Hierdoor kun je betrokkenen op voorhand informeren over de status van de databron.
Is het issue binnen de data verholpen, dan kan de quality warning weer verwijderd worden. Daarbij kan door de verantwoordelijke een certification toegevoegd worden. De certification kenmerkt dat de data gevalideerd is en maakt daarmee de betrouwbaarheid van de data zichtbaar.
Inzicht krijgen
Deze vraag zullen gebruikers op het analytics platform zich geregeld stellen. Het is van groot belang gebruikers aangehaakt te houden (lees in het Tableau data trends report waarom waarom), waardoor deze vraag gemakkelijk en snel te beantwoorden moet zijn. En dat kan! De data details optie biedt inzicht in de datakwaliteit van je analyse, zonder dat je daarbij de analyse moet afsluiten. Je krijgt gemakkelijk en snel inzicht in één scherm.
De optie biedt verschillende inzichten. Zo geeft het bijvoorbeeld aan of de onderliggende data quality qarnings bevat, maar geeft het ook inzicht in het gebruik van de data en wie verantwoordelijk is voor de data. Daarbij kan het een startpunt zijn voor een diepere analyse op waar de data vandaan komt (hierover later meer).
Met Tableau Catalog kun je data binnen het analytics platform verrijken met meta data. Zo kun je bijvoorbeeld een description toevoegen aan een veld, waarin de definitie vastgelegd kan worden.
Doordat deze informatie opgeslagen kan worden vanuit één centraal punt binnen het platform, kan men werken aan ‘one single source of truth’.
Data details biedt inzicht in de gebruikte velden binnen een analyse, waarmee je deze informatie gelijk voor handen hebt en zodoende snel zicht hebt op de inhoud van de data.
Vindbaarheid van data binnen het platform is cruciaal. Het huidige platform biedt al vele mogelijkheden, maar met de Tableau Catalog wordt dit nog verder verrijkt. Denk bijvoorbeeld aan het gemakkelijk kunnen zoeken naar gevalideerde data (certification) zonder datakwaliteit issues (geen quality warning). De totstandkoming van de data, en waar het vandaan komt, is echter een heel andere uitdaging. Met lineage kun je deze uitdaging aan!
Door lineage is het mogelijk om in één oogopslag inzicht te verschaffen in hoe de data tot stand is gekomen vanuit de bron en hoe deze data gebruikt wordt. Het is bijvoorbeeld mogelijk om te achterhalen in welke dashboards een bepaald veld wordt gebruikt. Lineage is erg krachtig in de combinatie met de data details optie: vanuit een analyse krijg je inzicht in de gebruikte velden, waarna je middels lineage door kunt zoomen naar de tabel en database waar het veld vandaan komt. Snel, effectief en gemakkelijk weet je waar de data vandaan komt zonder daarvoor het analytics platform te verlaten.
Daarbij is het dé oplossing voor het doen van impact analyses op wijzigingen in de data. Stel: een veldnaam in een datasource wijzigt en jij moet alle connected Tableau Workbooks langs om te kijken of het veld ergens is gebruikt. Erg arbeidsintensief én zeer foutgevoelig.
Met lineage kun je dit gemakkelijk en snel binnen het analytics platform, waarbij je, zoals onderstaande video aantoont, eveneens de verantwoordelijken kunt inlichten. Dit alles wederom vanuit één omgeving.
Waarom is data management zo belangrijk?
Door de groeiende vraag naar data en het toenemen van beschikbare data, zal de complexiteit alleen maar gaan toenemen. Daarbij wordt wet- en regelgeving omtrent data steeds strenger, waarmee de risico’s toenemen. De noodzaak voor goed data management wordt alsmaar groter.
Buiten de risico’s, leidt goed data management ertoe dat de organisatie makkelijker in staat is mee te schalen met de groeiende vraag. Het vergroot de betrouwbaarheid in de data en verbetert de vindbaarheid van data. Dit werkt versterkend op de adoptie van data binnen organisaties, omdat medewerkers meer vertrouwen op de data en op basis daarvan sneller beslissingen zullen nemen.
De Tableau Catalog is hét middel voor goed data management. Doordat het geïntegreerd is binnen het analytics platform, met het kenmerkende gebruiksgemak van Tableau, stelt het jou en alle gebruikers in staat om alle vragen omtrent data(kwaliteit) gemakkelijk en snel te beantwoorden.