Het pad van een Data Scientist
Het Data landschap
Bij Datamo werk ik als data scientist, maar wat is een data scientist? En hoe verschilt dat ten opzichte van termen als een data analist, data engineer of een business intelligence specialist?
Vooral als je niet heel bekend bent in deze wereld, zullen bovenstaande termen best verwarrend zijn. Sterker nog: dit zijn geen beschermde titels en iedereen kan zich zo een dergelijke titel toe eigenen. In dit artikel ga in ik op welk pad ik heb bewandeld om een data scientist te worden.
Mijn pad
Wat heeft mij gemaakt tot de data scientist van vandaag?
Op de middelbare school koos ik voor een technisch profiel, en lagen mijn interesses in bèta vakken als natuurkunde, wiskunde en scheikunde. Logischerwijs heb ik een technische studie gekozen op de TU Delft, echter ben ik halverwege afgehaakt gezien de hoeveelheid aan natuurkunde vakken . Ik besloot om bedrijfskunde te gaan studeren op de Erasmus Universiteit, een groot contrast met mijn initiële studierichting, en ik heb een mastertitel in informatie management weten te behalen.
Gedurende mijn master fase sprak Data Science mij aan, wat mij motiveerde om vakken te volgen die daarop aansluiten. Verder heb ik een scriptie geschreven met behulp van verschillende voorspellingstechnieken voor een grote accountancy firma. Gezien ik bewust ben van het feit dat je data science niet zo ‘even’ leert, heb ik bijlessen genomen in machine learning en deep learning, computer science en web development, én daar bovenop allerlei online cursussen in programmeren gevolgd. Gelukkig heb ik een aantal wiskundige vakken op de TU Delft gedaan wat mij ook heeft geholpen bij het begrijpen van programmeren.
Tijdens mijn scriptie heb ik data gerelateerde werkzaamheden uitgevoerd bij dezelfde firma. Vrijwel direct na het behalen van mijn mastertitel kreeg ik een aanbod om collega te worden bij de data-analyse afdeling. Ik voelde mij enorm vereerd, zeker gezien het feit dat een van de vereisten is dat je een technische studie als achtergrond moet hebben. Vanuit mijn optiek is het wel van belang dat je jezelf op allerlei vlakken gaat bijspijkeren inzake cursussen voordat ik zomaar de titel data scientist kan gaan gebruiken. Vaak begint men als data analist als springplank voor een data scientist.
Maar wat is een data-scientist precies?
Op internet zul je veel artikelen lezen die hierop ingaan, maar deze rol is niet eenduidig. Graag wil ik mijn persoonlijke kijk hierop geven. Ik geloof dat een ieder een data scientist kan worden zonder een technische studie. Echter is het wel essentieel dat iemand begrijpt hoe algoritmes werken. En met begrijpen bedoel ik niet alleen programmeren, maar wat er onder de codetaal draait. Denk bijvoorbeeld aan de technieken die worden toegepast bij machine learning en deep learning.
Code schrijven wordt steeds toegankelijker sinds de introductie van programmeertalen als Python en R, maar begrijpen wat er onder water ligt, is een vak apart. Want als je begrijpt hoe de achterkant werkt, ben je ook in staat om jouw code veel beter te interpreteren en hoe je dit kunt verbeteren.
De basis van data science ligt vooral in wiskunde en statistiek met als gevolg dat je voorspellingen kunt begrijpen en uitvoeren. Programmeren helpt ons om al die wiskundige vergelijkingen simultaan uit te voeren. Een data scientist houdt zich dus vooral bezig met het doen van betrouwbare voorspellingen op basis van historische, gestructureerde data en in staat is om deze technieken continu te verbeteren. In het kort geef ik de volgende roadmap mee waar een data-scientist zich ongeveer mee bezighoudt:
Andere rollen
Een andere belangrijke rol is data engineer. Een data engineer richt zich op het inrichten en onderhouden van een omgeving waarin de data bestaat. Dat strekt zich uit tot het transformeren van data naar een bruikbaar formaat, tot het laden van data naar betrouwbare locaties die door anderen bruikbaar zijn. Verder werkt een data engineer nauw samen met de data scientist en data analist om aan hun behoefte te voldoen inzake data landschap. Bijvoorbeeld als ze een server nodig hebben om data op te slaan, of wanneer er een analysetool ontwikkeld moet worden.
Men spreekt ook vaak over de rol data analist, een rol die verward kan worden met data scientist. Een redelijke basis in statistiek en doorzettingsvermogen zijn de juiste ingrediënten voor zo een dergelijke rol. Een data analist houdt zich voornamelijk bezig met het inzichtelijk maken van grote, gestructureerde datasets middels data manipulaties. Deze inzichten kunnen eventueel gevisualiseerd worden richting verschillende stakeholders.
De laatste rol die ik wil bespreken is een business intelligence specialist. Zoals af te leiden uit de naam, zit een business intelligence specialist dichter op de business, met name op operationele en strategische beslissingen.
Deze specialist werkt nauw samen met een data analist die, gezien de aard van werkzaamheden, veel overlappen met elkaar. Zij richten zich voornamelijk op de visualisatie en brengen de inzichten in jip en janneke taal over aan de stakeholders.
Al met al, is het opgevallen dat deze rollen raakvlakken met elkaar hebben. Bovendien verschillen deze functies per organisatie, denk bijvoorbeeld aan een startup waar een data scientist ook als een data engineer fungeert en in bedrijven van de gevestigde orde, zijn deze functies verder opgesplitst, zoals een cloud specialist, machine learning engineer etc. Ondanks dat het pad naar data scientist toegankelijker wordt gemaakt, wordt je niet zomaar een data scientist.
Meer informatie over bovenstaande of over de vacatures die uitstaan bij Datamo?
Stuur mij een berichtje via LinkedIn of via
Door Amir Kalloe