Data Science im Fachbereich – Welche Rolle spielt der Fachanwender in der Umsetzung von Advanced Analytics?

Fortgeschrittene Verfahren für Advanced und Predictive Analytics ergänzen in immer mehr Unternehmen herkömmliche BI-Analysen. Mit zunehmender Erfahrung verlassen Unternehmen die Experimentierphase und müssen sich der Herausforderung stellen, wie fortgeschrittene Analyse als wertstiftender Erfolgsfaktor im Unternehmen produktiv genutzt und damit auch breit ausgerollt werden kann.

Data Scientists spielen für die Umsetzung von Advanced Analytics eine zentrale Rolle. Allerdings gewinnt auch der Fachbereich immer mehr an Bedeutung. Dies hat verschiedene Gründe: Zum einen bieten immer mehr Business-Intelligence-Werkzeuge ihren Anwendern fortgeschrittene Methoden der Datenanalyse sowie Funktionalitäten der Datenaufbereitung. Hinzu kommt, dass Fachanwender zunehmend in den Dialog mit Data Scientists treten müssen, um Use Cases zu identifizieren und die Ergebnisse mathematischer Analysen zu verstehen. Dies erfordert von Anwendern ein grundlegendes Verständnis der Vorgehensweise der wichtigsten Analysekonzepte sowie die Fähigkeit, den Output fortgeschrittener Analysemethoden richtig zu interpretieren. Nicht selten werden Data-Science-Projekte auch von Key-Usern im Fachbereich durchgeführt. Dabei kann die Nähe zu den zu optimierenden Prozessen von entscheidender Bedeutung sein.

Sind für alle Aufgaben mit Data-Mining-Hintergrund immer die Statistik- und Mathematikkenntnisse eines Data Scientists und der Einsatz von Spezialwerkzeugen notwendig? Oder ermöglicht aktuelle Software mit intuitiven Benutzeroberflächen, fertigen Anwendungsfällen und vorkonfigurierten Algorithmen es heute auch Anwendern im Fachbereich, die notwendigen Erkenntnisse selbständig in ihren Daten aufzufinden und so zum „Citizen Data Scientist“ zu werden? Können Fachbereiche dabei ähnliche Mehrwerte erzielen wie Data Scientists und Data Labs? Und reduzieren sich durch die Nähe zu den operativen Prozessen die organisatorischen Hürden in der Umsetzung der Projekte vielleicht sogar?

Um auf diese Fragen Antworten zu finden, führte BARC eine weitere Anwenderbefragung durch. Mit 210 Teilnehmern aus der DACH-Region und einer breit gefächerten Branchenverteilung deckt die Studie verschiedene Unternehmensgrößen ab und bietet einen objektiven Blick auf die gegenwärtige und geplante Nutzung von Predictive und Advanced Analytics durch die Unternehmen. Die Studie steht zum kostenfreien Download hier bereit: https://barc.de/docs/research-note-advanced-predictive-analytics-survey-2017

Im Folgenden sind vier der wesentlichsten Erkenntnisse der Befragung zusammengefasst.

1.1   Advanced Analytics wird als wichtiges Thema gesehen – die Umsetzung hingegen stagniert

Advanced Analytics wird mittlerweile von 9 % der Befragten als sehr wichtig erachtet. Dies sind doppelt so viele wie noch in der letztjährigen Befragung. 40 % der Befragten erachten Advanced Analytics aktuell als wichtig, 43 % als weniger wichtig und 8 % als überhaupt nicht wichtig. Zukünftig halten sogar 63 % das Thema für sehr wichtig und 31 % für wichtig. Die Zahl der Unternehmen, in denen Advanced Analytics jedoch häufig bis vereinzelt angewendet wird, stagniert – 5 % der befragten Unternehmen nutzen Advanced Analytics häufig, 31 %vereinzelt. Diese Ergebnisse decken sich auch mit den BARC-Beobachtungen am Markt: Der Informationsbedarf zum Thema ist nach wie vor hoch, und immer mehr Unternehmen engagieren Mitarbeiter mit entsprechenden Skills bzw. investieren in die Fortbildung von Mitarbeitern. Die Unternehmen, die Advanced Analytics in eine konsistente Strategie einbetten, sind jedoch nach wie vor in der Unterzahl. Die Mehrheit der Unternehmen beginnt sich in einzelnen Projekten zu orientieren bzw. informiert sich auf Tagungen und anhand von Literatur über Wege, Advanced Analytics ins Unternehmen zu tragen. Die Bereitschaft, in das Thema zu investieren, ist im Laufe des letzten Jahres durchaus gestiegen – allerdings sind die meisten Unternehmen noch zurückhaltend damit, hier umfangreiche Programme aufzusetzen und in entsprechende Ausstattungen zu investieren.

Abbildung 1: „Wie relevant sind Advanced und Predictive Analytics heute und zukünftig für Ihr Unternehmen?“ (n=170)

1.2   Unternehmen befinden sich überwiegend in der Prototypisierung von Advanced Analytics Use Cases

Über 50 % der befragten Unternehmen, die aktuell Advanced Analytics nutzen, befinden sich derzeit in der Prototypisierung von Use Cases bzw. der Evaluation der Prototypen. 22 % haben diese Phase bereits abgeschlossen und setzen Advanced Analytics regelmäßig zur Entscheidungsunterstützung ein (15 %) oder haben wichtige Geschäftsprozesse automatisiert (7 %). 18 % befinden sich derzeit in der Use-Case-Identifikation. Interessant ist der Unterschied zwischen Unternehmen, in denen Advanced Analytics vom Fachbereich getrieben wird, und Unternehmen, in denen Advanced Analytics von Data Scientists oder der IT ausgeht. Fachbereichsgetriebene Unternehmen befinden sich überwiegend in der Phase der Use-Case-Identifikation und der Evaluierung von Prototypen, während Data-Scientist- und IT-getriebene Unternehmen sich eher in der Prototypisierung befinden. Fachbereichsgetriebene Unternehmen nutzen Advanced Analytics auch eher für die Unterstützung von Entscheidungen (18 %), jedoch nicht für die Automatisierung von Prozessen (0 %). Diese Prozessautomatisierung stellt jedoch für Data-Lab- & IT-getriebene Unternehmen einen Schwerpunkt dar (13 %). Dies lässt darauf schließen, dass die Kenntnisse professioneller Data Scientists sowie der IT gegenüber dem Fachbereich auch andere Use Cases zulassen oder Advanced Analytics von Fachbereichen mit deutlich anderen Erwartungshaltungen genutzt wird.

Abbildung 2: „In welcher Phase der Umsetzung befinden Sie sich derzeit hauptsächlich?“ nach fachbereichsgetriebenen und IT- & Data-Scientist-getriebenen Unternehmen (n=74)

1.3   Key-User im Fachbereich bleiben die größte Anwendergruppe – das Management ist die treibende Kraft für Advanced-Analytics-Projekte

Key-User im Fachbereich waren schon im Vorjahr die größte Anwendergruppe. Auch in 2017 führen wieder 25 % der Key-User im Fachbereich Data Science durch.

20 % der befragten Unternehmen nutzen Data Scientists, wobei nur bei etwas über der Hälfte Data Scientists in einem Data Lab organisiert sind. Data Scientists gewinnen insgesamt im Vergleich zum Vorjahr an Bedeutung für die Umsetzung von Advanced-Analytics-Projekten. Externe Dienstleister werden nach wie vor immerhin von 13 % der Befragten genutzt. Treiber bzw. Vordenker von Advanced Analytics ist das Management, gefolgt vom Fachbereich Finanzen/Controlling, wobei die BI-Organisation hier an dritter Stelle ebenfalls eine wichtige Rolle als Vordenker einnimmt.

Abbildung 3: „Wer führt bei Ihnen im Unternehmen Advanced und Predictive Analytics durch bzw. wird dies durchführen?“ (n = 171)

1.4   Fachbereiche setzen Advanced Analytics eher durch analytische Apps und BI-Werkzeuge um

Unternehmen, in denen Advanced Analytics fachbereichsgetrieben ist, setzen fortgeschrittene Analyse eher als Teil einer BI-Umgebung oder durch spezifische, analytische Applikationen um. IT- und Data-Lab-getriebene Unternehmen hingegen setzen wesentlich stärker auf Data-Mining-Software. Für fachbereichsgetriebene Unternehmen ist Excel/Power BI das am häufigsten verwendete Werkzeug (44 %), gefolgt von R (38 %), das sich mittlerweile gut mit den meisten populären BI-Werkzeugen kombinieren lässt. Spezielle Programmiersprachen wie Scala oder Python werden eher von IT- und Data-Lab-getriebenen Unternehmen verwendet. Die Anteile in der Nutzung von speziellen Data-Mining-Werkzeugen wie SAS, IBM SPSS oder RapidMiner sind in der Gruppe der fachbereichsgetriebenen Unternehmen eher niedrig. IT- und Data-Lab-getriebene Unternehmen weisen hier mehr als doppelt so hohe Anteile auf.

Diese Zahlen werden vor dem Hintergrund verständlich, dass Data Scientists und Data Labs oft auf spezielle, zusätzliche Software angewiesen sind. So bedarf beispielsweise die Umsetzung von Use Cases mit Fokus auf Prozessautomatisierung Software mit Funktionen für die Unterstützung des Model Deployment und des Modell-Managements. Open-Source-Programmiersprachen wie R bieten zwar umfangreiche statistische Bibliotheken und lassen sich gut mit BI-Werkzeugen integrieren, weisen allerdings häufig Nachteile in den Bereichen Modell-Management, -Performanz und -Operationalisierung auf.