October 3, 2017
Join our free event Dialogue Thursday on November 13. Sign up now!
Onze analytics expert Arend Zwaneveld heeft voor Webanalisten.nl een artikel geschreven over Data Science de toekomst van webanalisten?
Zoals in vorige blogartikelen op webanalisten.nl reeds enthousiast betoogd, beschikken de meeste technisch georiënteerde webanalisten van vandaag over een aantal vaardigheden die hen in potentie zeer geschikt maken als analist van ongestructureerde databronnen, in uitbreiding op het analyseren van webstatistieken.
Examples of “unstructured data” may include books, journals, documents, metadata, health records, audio, video, analog data, files, and unstructured text such as the body of an e-mail message, Web page, or word-processor document. While the main content being conveyed does not have a defined structure, it generally comes packaged in objects (e.g. in files or documents, …) that themselves have structure and are thus a mix of structured and unstructured data, but collectively this is still referred to as “unstructured data”.
Noel Yuhanna, Principal Analyst, Forrester Research
Webanalisten met technische kennis beschikken nú al over een aantal Data Science skills (zie ook quotes onderaan), die hen wellicht een betere basis geven om door te kunnen groeien tot Data Scientist dan bijvoorbeeld marketingdatabase- en business-analisten:
Data-visualisatie is een essentiële skill voor iedere webanalist en data scientist. Klik op de afbeelding voor een overzicht van de top 20 datavisualisatie tools. Bron: .net Magazine
Na een paar maanden intensief bezig geweest te zijn om het vak van Data Scientist te beheersen (zie nuttige links!), blijkt dat ik het gemak waarmee ik/een webanalist (eigenlijk voor iedere niet-programmeur!) op korte termijn Data Scientist kan worden behoorlijk heb onderschat.
Data Science vereist namelijk een groot aantal extra vaardigheden, waarvan de meeste niet op korte termijn te leren zijn… Hieronder de belangrijkste vaardigheden die webanalisten zullen moeten bijleren:
Met name deze allerlaatste noodzakelijke skill is voor de meeste webanalisten waarschijnlijk al direct een ‘show stopper’. Niet omdat het onmogelijk is… maar wel omdat het leren ervan ‘vanaf nul’ zéér veel geduld en doorzettingsvermogen vereist.
Hoewel je niet van de ene op de andere dag Data Scientist wordt, leven we gelukkig (!) in een tijd dat de vele kennis die ervoor nodig wél gewoon gratis beschikbaar is, onder andere met dank aan Coursera. Hieronder een met zorg samengestelde lijst met nuttige links om je op weg te helpen je Data Science ambities zo snel mogelijk waar te maken!
In dit artikel ben ik expres niet ingegaan op wat een Data Scientist nu precies is… alleen wat hij/zij allemaal moet kunnen en in hoeverre webanalisten al over deze vaardigheden beschikken. De exacte definitie van Data Scientist is waarschijnlijk net zo moeilijk te geven als de definitie voor Big Data:
“Big Data” is “it doesn’t fit in Excel”
Stéphane Hamel – één van inmiddels meer dan 30 definities van Big Data!.
Het antwoord op de vraag? Nog meer vragen! Wil je weten hoe ver je bent op weg naar het Data Scientist-schap? Probeer dan deze groeiende lijst met “job interview questions for data scientists” en laat je inspireren door onderstaande citaten:
Whoever chose the term data scientist has downplayed what’s most important about this job. A data scientist needs to be someone who can bridge the gap between complex analytics on large data sets and the dreams of company leadership. A data scientist needs to be creative about indentifying ways that data can solve company problems. And if the data’s not collected yet to solve a problem? They need to figure out how to get it.
John Foreman – Analytics made skeezy
Certifying data scientists is difficult, as the ability to create data products is the real mark of a practicing data scientist.
Data scientists solve business problems that aren’t immediately apparent, turning research into something unexpected.
Drake Baer over Hilary Mason van Bit.ly
The real science, in my opinion — the part where you form hypotheses, test them, revise them — comes less in the modeling and more in the scrub and explore steps.
Nina Zumel – “On Being a Data Scientist”
I’ve learned […] the importance of “Hypothesis-driven data analysis” rather than “blind/brute-force data analysis”. This highlighted the importance of understanding the business domains really well before trying to extract meaningful insights from the data.
Prasoon Sharma – Software engineer’s guide to “getting started with data science“
We feel that a defining feature of data scientists is the breadth of their skills — their ability to single-handedly do at least prototype-level versions of all the steps needed to derive new insights or build data products. We also feel that the most successful data scientists are those with substantial, deep expertise in at
least one aspect of data science, be it statistics, big data, or business communication.
O’Reilly Strata – There’s More Than One Kind of Data Scientist
A data scientist is somebody who is inquisitive, who can stare at data and spot trends. It’s almost like a Renaissance individual who really wants to learn and bring change to an organization.
Anjul Bhambhri, Vice President of Big Data Products, IBM
I think that what makes a good data scientist is more of the right attitude than skills. Besides a strong background in statistics or computer science, a good data scientist is a person who loves to solve problems. (S)he is not afraid of putting in (possibly) unrecognized hard work because shortcuts rarely produce good results from data. And (s)he is open-minded and is excited to learn new things.
Xavier Conort – #1 data scientist op Kaggle
Aanvullingen (quotes, links), tips, commentaren en praktijkervaringen bij het opdoen van bovenstaande skills zijn van harte welkom!!
Origineel geplaatst op 17 juli 2013 op Webanalists.com