#Techtips: Relationships Performance Options tunen in Tableau
Wekelijks delen wij tips die jou helpen om het gebruik van Tableau, Alteryx, Snowflake, Matillion en DataRobot nog makkelijker te maken. Deze tips zijn afkomstig van onze gecertificeerde consultants die dagelijks met deze tools werken. Heb jij een handige tip voor iedereen? Laat het ons van vooral weten.
Deze week is het de beurt aan onze collega Jur Pol: Hoe tune je Relationships Performance Options?
Relationships in Tableau
Sinds 2020.2 kunnen we in Tableau gebruik maken van Relationships, waarmee we op innovatieve wijze data kunnen combineren. Het hoe en wat is al eens uitgelegd in een blog van mijn collega Roland van Leeuwen. Mijn tip gaat over hoe we met Relationships de performance van Relationships kunnen tunen!
Instellen van een ‘relationship’ tussen tabellen
Bij het instellen van een ‘Relationship’ tussen tabellen, krijg je in de nieuwe interface (zie bovenstaande afbeelding) extra opties om dit te optimaliseren: Performance Options. Je kunt hier de relatie tussen verschillende tabellen instellen (Cardinality) en aangeven of er sprake is van referentiële integriteit (Referential Integrity).
Maar hoe weet je nu welke opties je moet instellen? Het komt namelijk niet altijd voor dat je deze informatie kunt ophalen bij bijvoorbeeld een data engineer en daarnaast vult Tableau alleen de default instellingen voor jou in. Onderstaande video laat zien hoe je dit zelf kunt achterhalen met behulp van Tableau!
Let wel: voorbeeld is relatief simpel gehouden (feittabel x dimensietabel). Relationships komen met name tot hun recht bij complexere datamodellen.
Toelichting en resultaat
Wat gebeurt er precies:
- Het aantal records in de tabellen aggregeren per dimensie biedt zicht op hoe uniek deze waarden binnen een tabel zijn, waarmee vervolgens de Cardinality ingesteld kan worden.
- Dimensies uit de ene tabel combineren met het aantal records uit de andere tabel, zorgt voor inzicht in hoeverre alle eenheden voorkomen in beide tabellen (0 records of waarde ‘NULL’). Hiermee kun je dus de Referential Integrity bepalen.
Na het uitvoeren van deze stappen kun je de Performance Options juist instellen, wat leidt tot onderstaand resultaat.
Performance Options
Waarom is het belangrijk om de Performance Options (juist) in te stellen?
- Hiermee voorkom je dat Tableau de relatie tussen de verschillende tabellen op een verkeerde manier interpreteert, wat negatieve gevolgen zou kunnen hebben voor jouw uit te voeren analyse.
- Tableau is in staat om efficiëntere queries af te vuren op de data, wat een positieve invloed heeft op de performance.
- Als je de Performance Options hebt ingesteld, en daarmee dus kennis over hebt, maakt dat je de dataset begrijpt en daarmee beter en sneller in staat bent om de juiste analyse uit te voeren!