Data Scientist: „Sexiest Job of the 21st Century“

Der Data Scientist wird häufig in Verbindung mit Buzzwords wie Industrie 4.0, Digitalisierung und Big Data genannt. Der Harvard Business Review hat den Data Scientist nicht von ungefähr zum „Sexiest Job of the 21st Century“ gekürt. Aber warum mangelt es trotz alledem in so vielen Unternehmen an Vertretern dieses heißbegehrten Berufs? Wie wird man überhaupt Data Scientist? Und welche Fähigkeiten und Kenntnisse braucht ein Data Scientist?

Data Scientist ist nicht immer gleich Data Scientist

Um die Frage beantworten zu können, warum es immer noch zu wenige Data Scientists gibt, muss zunächst geklärt werden, wie der Begriff Data Scientist interpretiert werden muss. Es lassen sich grob zwei verschiedene Berufsbilder voneinander unterscheiden, wobei Vertreter beider Gruppen sich gleichermaßen als Data Scientist definieren würden.

Zum einen ist das der „Enterprise Data Scientist“. Er arbeitet in einem Unternehmen und stellt gewissermaßen einen Mix aus Betriebswirtschaftler, IT-Spezialist, Statistiker und Kommunikationsexperte dar. Zum anderen gibt es dann noch den „Academic Data Scientist“. Er lässt sich eher der reinen Algorithmen-Entwicklung zuordnen. Er arbeitet mit „idealen“ Daten und ist weniger praxis- als vielmehr methodisch orientiert. Im Enterprise-Umfeld kommt es eher selten vor, dass ein gänzlich neuer Algorithmus entwickelt werden muss. Vielmehr geht es darum, bestehende Konzepte an die konkrete Problemstellung anzupassen oder zu erweitern. Eine vollständige Neuentwicklung von Modellierungsverfahren würde häufig zu lange dauern.

Was muss ein Data Scientist können?

Auf eine kurze Formel gebracht, muss ein Data Scientist über technisches Know-how und kommunikative Stärke verfügen. Das Grundrüstzeug besteht stets aus sehr guten Kenntnissen in Informatik, Betriebswirtschaftslehre, Mathematik und Statistik. Ein Data Scientist muss auch zwangsläufig betriebswirtschaftliche Vorgänge verstehen können. Ohne sie kann er Ergebnisse von Analysen und die datengenerierenden Prozesse kaum interpretieren und nachzuvollziehen. Außerdem sind auch das tiefgreifende Verständnis von Datenstrukturen, -banken und -modellen zwingende Kompetenzen.

Zum Standard gehören zudem programmiertechnischen Fähigkeiten, um mit diesen Daten auch arbeiten bzw. interagieren zu können. Dies umfasst beispielsweise die Beherrschung sehr großer Datenmengen, die Erstellung komplexer Abfragen und die Verknüpfung verschiedener Datenquellen. Die statistischen und analytischen Fähigkeiten kommen dann ins Spiel, wenn aus historischen Daten Prognosen über zukünftige Ereignisse abgeleitet werden sollen. Aber nicht nur die Fähigkeit, Prozesse zu verstehen und zu analysieren ist sehr wichtig. Analyse-Ergebnisse visuell aufzubereiten gehört ebenfalls zum Handwerkszeug.

Das weit verbreitete Bild vom Computer-Nerd passt nicht zum Data Scientist. Dessen Profil wird viel eher durch eine hohe Problemlösungskompetenz und sehr gute Kommunikationsfähigkeiten gekennzeichnet. Letztere sind erforderlich, um komplexe Sachverhalte und Modelle so kommunizieren zu können, dass das Management, Anwender und Kunde die Lösung verstehen und ihnen Vertrauen schenken. Data-Science-Projekte gelingen nur, wenn die Kundenperspektive und die Vision auf dem Weg durch den Datendschungel nicht verloren gehen. Denn am Ende des Tages geht es darum, die Geschichten zu erzählen, die in den Daten stecken – und zwar für jede Zielgruppe passend und relevant verpackt.

Warum es den perfekten Data Scientist nicht gibt

Die schiere Menge dessen, was ein perfekter Data Scientist beherrschen können müsste, ist unmenschlich. Und selbst wenn man die Summe aller maßgeblichen Fähigkeiten zusammennehmen würde und diese mit der rasanten technologischen Entwicklung kombinieren könnte, wird es den perfekten Data Scientist nie geben. Vielleicht ist das auch gar nicht nötig. In den meisten Fällen geht es ohnehin „nur“ darum, im Rahmen von konkreten Data-Science-Projekten datengetriebene Fragestellungen von Anfang bis Ende lösen zu können. Das funktioniert in der Regel nur im Team. Für bestimmte Teilaufgaben müssen Experten wie Statistiker oder Data Engineers eingesetzt werden. Diese bringen während eines Projekts ihre jeweiligen Stärken und Vorzüge ein – und auch ein Data Scientist entwickelt bei seiner Arbeit Schwerpunkte, die für sein Einsatzgebiet nützlich sind.

Detektivarbeit ist nicht für jedermann

Wer sich dieses umfassende und sehr anspruchsvolle Anforderungsprofil vor Augen führt, erkennt sofort, warum ein Mangel an Data Scientists herrscht. Die Kombination aus sehr gut ausgeprägten kommunikativen Fähigkeiten und großem technischen Know-how stellt eine große Hürde dar. Nicht jeder ist gleichermaßen für die Herausforderungen des Arbeitsalltags gemacht. Denn das Kerngeschäft von Data Scientists besteht auf Hypothesen-Bildung, die sich bestätigen können, aber immer wieder auch verworfen werden müssen. Diese hypothesengetriebene und experimentelle Arbeitsweise ähnelt einerseits dem wissenschaftlichen Arbeiten und so erklärt sich auch der Begriff des Data Scientist. Andererseits agiert der Data Scientist oft wie eine Art Detektiv. Immer wieder ist eine Portion Mut gefragt, weil Problemstellungen hinterfragt werden müssen: Was soll überhaupt erreicht werden und warum?

Data Scientist: Ein Beruf mit Zukunft

Aufgrund des bislang unstillbaren Bedarfs an Data Scientists entstehen an vielen Orten in Deutschland, der Schweiz und in Österreich (Aufbau-)Studiengänge und Weiterbildungsmöglichkeiten. Ergänzend bieten Firmen – wie beispielsweise auch die Alexander Thamm GmbH in München – Traineeprogramme für Data Science an. Die Voraussetzungen für einen Data Scientist sind nach wie vor ausgezeichnet: sehr gute Verdienstmöglichkeiten, ein vielfältiger, facettenreicher Aufgabenbereich und vor allem großes Zukunftspotenzial.