Data Scientist
Der Data Scientist — oft als „Sexiest Job of the 21st Century" zitiert (Harvard Business Review, 2012) — ist die Rolle im Zentrum der datengetriebenen Entscheidungsfindung: eine Kombination aus Statistik, Programmierung und Domänenwissen.
Drew Conway visualisierte die benötigten Kompetenzen als Venn-Diagramm: Mathematik/Statistik, Informatik/Programmierung und Domänenwissen. Wer nur zwei von drei beherrscht, ist eingeschränkt: Statistik + Domänenwissen ohne Programmierung = traditionelle Forschung. Programmierung + Statistik ohne Domänenwissen = „Danger Zone" (technisch korrekte, aber inhaltlich sinnlose Analysen).
Das Aufgabenspektrum reicht von explorativer Datenanalyse (EDA) über Feature Engineering und Modellentwicklung (Regression, Klassifikation, Clustering, Deep Learning) bis zur Kommunikation der Ergebnisse an Stakeholder. In vielen Organisationen ist der Data Scientist auch für den produktiven Einsatz der Modelle verantwortlich (MLOps).
KI verschiebt die Rolle. LLMs automatisieren Code-Generierung, Datenexploration und Visualisierung. Die Befürchtung, Data Scientists würden durch KI ersetzt, ist übertrieben — aber die Aufgaben verschieben sich Richtung strategisches Denken, Problemformulierung und kritische Bewertung von Modellausgaben.
Der Arbeitsmarkt differenziert zunehmend: ML Engineer (Fokus auf Produktion), Research Scientist (Fokus auf neue Methoden), Applied Scientist (Anwendung in einer spezifischen Domäne) und Analytics Engineer (Fokus auf Dateninfrastruktur) sind spezialisierte Abkömmlinge der generalistischen Data-Scientist-Rolle.