Wie können GPS-Daten in einer IoT-Umgebung eingesetzt werden – Einblicke eines Automobilzulieferers

Die Nutzung von GPS-Daten im IoT-Kontext wurde von Dubravko Dolic von der Continental Reifen Deutschland GmbH beim Data Festival 2018 diskutiert. Dubravko Dolic, Lead Architect Advanced Analytics bei Continental Reifen, gab dem Publikum Einblicke in die Handhabung von GPS-Daten bei Continental in seiner Präsentation mit dem Titel “Working with GPS data in IoT environment from the data science perspective”. Die Präsentation behandelte sowohl Use Cases im Bereich GPS-Daten – einem der häufigsten Datentypen in IoT-Szenarien – sowie den Umgang damit. Dolic Dubravko präsentierte zudem geeignete Maßnahmen zur Validierung und Verbesserung der Genauigkeit von GPS-Daten.

GPS-Daten aus Sensoren

Reifen stellen einen wichtigen und auch teuren Bestandteil eines jeden Fahrzeugs dar. Aus diesem Grund und um eine Lösung für das Flottenmanagement zu entwickeln, begann Continental mit dem Sammeln von Daten aus Sensoren, die entweder direkt im Reifen oder im Fahrzeug verbaut werden. Sensoren im Reifen liefern zwei Arten von Daten: Informationen zur Temperatur und zum Reifendruck. Diese Daten werden dann mit den CAN-Bus-Daten des Fahrzeugs angereichert sowie mit den Beschleunigungsdaten des IMU-Sensors der FlexBox, dem Datenlogger von Continental.

Den Flottenmanagern kann ein Ist-Status hinsichtlich Temperatur und Druck geliefert werden, wodurch leicht Veränderungen bei diesen Kennwerten erkannt werden können. Darauf aufbauend hat Continental ein gesamtes integriertes Flottensystem entworfen, bestehend aus einem intelligenten Reifen, der mit dem Tire Management Portal und Tire Service vernetzt ist.

Wie das Tool im Detail funktioniert, zeigt dieses Video; grob skizziert, sind die Abläufe wie folgt:

  • Ein eingebauter Sensor im Reifen misst Temperatur und Reifendruck.
  • Diese Daten werden über verschiedene Telematik-Systeme im Fahrzeug an die sogenannte FlexBox
  • Sobald diese Daten mit GPS-Daten oder Beschleunigungsdaten angereichert wurden, werden sie entweder zum Backend einer Drittpartei oder der Continental FlexBox weitergeleitet.

Bereitstellung der GPS-Daten für Analysten

Bislang wurde erst eine geringe Anzahl an Fahrzeugen mit Sensoren zur Datengenerierung bei Continental ausgestattet, mit dem Ziel, das FlexBox-System zu testen. Die Box wird im Automotive-Bereich des Unternehmens getestet und die Daten von Dolics Advanced-Analytics-Team analysiert. Nichtsdestotrotz sammeln sich die GPS-, IMU- und TTM-CPC-Daten dieser wenigen Fahrzeuge über die Zeit zu einer großen Menge an Informationen an. Um diese Datenflut adäquat managen zu können, wurden verschiedene Tools getestet und werden teilweise nach wie vor eingesetzt.

GPS-Daten: von Continental genutzte Lösungen

PostgreSQL und Tableau

Zu Beginn wurden die Rohdaten auf PostreSQL (postgres) hochgeladen, was reibungslos funktionierte. Das Tool ist allerdings für die Datenanalyse nur bedingt geeignet, da seine Funktionen eingeschränkt sind und es nicht mehrere Tracks gleichzeitig visualisieren kann.

Im nächsten Schritt kam Tableau zum Einsatz, um die Tracks zu visualisieren und grafisch aufzubereiten – die Daten stammten hauptsächlich aus CSV-Dateien. Um schnell Datentracks zu generieren sowie Qualitätsprüfungen durchzuführen, eignet sich Tableau gut. Nicht aber für tiefgehende Analysen, da dafür weitreichendes (Programmier-)Know-how benötigt wird. Die Experten, die über das nötige Wissen verfügen, bevorzugen für Datenanalysen allerdings eher andere Lösungen. Tableau war also nicht die erste Wahl für das Datenmanagement. Positiv kann hervorgehoben werden, dass sein Einsatz keine Kenntnisse im Bereich der Geoinformationssysteme (GIS) erfordert und daher von einer breiten Masse an Nutzern verwendet werden kann.

QGIS

Für den Einsatz von QGIS sind Erfahrungen mit GIS vonnöten. QGIS eignet sich für die Realisierung von GIS-Verfahren auf einem einzigen Track-Datensatz, z.B. für die Simplifizierung von Tracks, zur Abstandsmessung oder zur Identifizierung von Interessenpunkten. Bei Continental kommt QGIS weitflächig zum Einsatz, wenn es um Visualisierungen für die Konstruktionsabteilung geht. Die Daten können auf vielfache Weise erschlossen werden:

  • über CSV-Dateien, was eine äußerst zuverlässige Methode ist.
  • über PostGIS – der Zugang erfolgt hier über die Nutzung der Datenbank PostgreSQL über PostGIS.
  • über Shapefiles, welche weitere geographische Informationen, z.B. Landkarten, bereitstellen.

R/Shiny

R und Shiny werden eingesetzt, um spezielle Berichte zu generieren, und befinden sich thematisch zwischen der Data-Science- und der Business-Seite: Die Business-User können von Programmierern entwickelte Apps nutzen. Im Kontext von GPS-Daten hat die Programmiersprache R den großen Vorteil, dass R eine Palette an „Geography Libraries“ zur Verfügung stellt, die ausgewählt und in den Code implementiert werden können. Definierte Reports visualisieren die Informationen, die die Ingenieure benötigen. Ein gebrauchsfertiges Dashboard und Landkarten mit Overlays in R und Shiny können so zur Verfügung gestellt werden. R und Shiny können verwendet werden, indem man sich entweder über Datenstreaming, HDFS oder PostgreSQL Zugang zu den Daten verschafft.

PostGIS

PostGIS bietet mehrere Funktionen für die Handhabung von GPS-Daten: Es kann zur Automatisierung der Aufbereitung von GPS-Daten eingesetzt werden, zur Bereitstellung von Geometrieelementen durch die Schaffung von Verbindungslinien zwischen einzelnen Punkten, um räumliche Daten zu aggregieren oder zur Erstellung von Geometrieindexen. Außerdem ist es ein mächtiges Tool für die Simplifizierung.

Simplifizierung von Tracks

Tracks können simplifiziert werden, indem die Anzahl der Punkte reduziert wird und dadurch Tracks in Pfade umgewandelt werden. Lückenhafte Daten müssen gelöscht und sinnvolle Einheiten, z.B. Minuten oder Tage, sollten erstellt werden. Eine Simplifizierung kann hauptsächlich über zwei Wege erreicht werden:

  • Simplifizierung über Sampling (z.B. die Verwendung nur jedes fünften Punktes)
  • Simplifizierung über Algorithmen (z.B. Douglas-Peucker-Ramer, der nur für die Visualisierung von Tracks auf Karten in R oder QGIS verwendet wird)

Diese Simplifizierungsfunktion ist wichtig, um die Datenmengen zu verkleinern und dadurch die Ladezeiten zu verringern. Simplifizierte Tracks können in Pfade umgewandelt werden, die gespeichert und den Usern direkt zur Verfügung gestellt werden. Trotz aller Vorteile ist die Simplifizierung nicht geeignet für eine detaillierte Analyse von Abbildungen.

Bereitstellung von räumlichen Daten

Räumliche Daten werden bei Continental in mehreren Schritten bereitgestellt. Zunächst einmal werden GPS-Daten erzeugt, gesammelt und weitergeleitet: Alle Rohdaten werden auf Amazon Glacier gespeichert, um sie zu konservieren. Die Daten können allerdings ohne vorherige Bearbeitung nicht zu Analysezwecken verwendet werden. Daher sind die nächsten Schritte die Verteilung und Speicherung von Daten, aber erst nach der Vorverarbeitungsphase sind sie tatsächlich bereit für die Analyse. Die Vorbereitung von Daten kann auf mehrere Arten erfolgen:

  • Aggregation von Punktdaten.
  • Ausrichtung der Daten mithilfe einer Inertial Measurement Unit (inertiale Messeinheit) – einem elektronischen Gerät, welches mehrere Fahrzeugdaten wie Umdrehungen oder Beschleunigung misst: die Aggregation von GPS- und Beschleunigungsdaten ist wichtig, da sie erst in kombinierter Form interessante Ergebnisse liefern. Die Aggregation könnte mithilfe eines Zeitstempels in R umgesetzt werden. Weitere Details zur Ausrichtung von Daten können Sie in untenstehendem Präsentationsvideo erfahren.
  • Anreicherung mit Wetterdaten: das folgende Video enthält ein Beispiel für einen HTTP-Request an einen Geodaten-Server hinsichtlich Standortdaten.

Die aufbereiteten Daten werden on premises gespeichert, so dass die Data Scientists für ihre Analysen direkten Zugriff darauf haben. Ganz zum Schluss werden die Daten für das Mapping bereitgestellt.

Genauigkeit der Daten

Manchmal liegen die bereitgestellten Daten nicht in optimaler Genauigkeit vor. Allerdings können bestimmte Maßnahmen vorgenommen werden, um das Qualitätsniveau zu steigern:

  • DOP (Dilution of Precision)-Werte als Qualitätsmarker: Die Genauigkeit der Daten kann verbessert werden, indem Werte oberhalb eines bestimmten Schwellenwerts gelöscht, die Werte genau überprüft und nur solche bis zu einem gewissen DOP-Wert beibehalten werden.
  • Welche Daten können als Geschwindigkeitsdaten genutzt werden? Geschwindigkeitsdaten können aus GPS-Daten abgeleitet werden, indem man die Werte aus den Längen- und Breitenkoordinaten errechnet.
  • Abstandsmessungen: Aus GPS-Daten abgeleitete Abstandsmessungen sind oft suboptimal, weisen Lücken auf und unterschätzen die Fahrzeugabstände. Eine Lösung für dieses Problem wird derzeit noch von Continental entwickelt; das Team arbeitet momentan mit einer Interpolations-Methode, um die Ungenauigkeiten zu beheben.
  • Beschleunigung: In manchen Fällen wird das Messgerät nicht gerade im Fahrzeug verbaut und liefert folglich fehlerhafte Daten. Vor allem bei der Datenvisualisierung in einem Koordinatensystem wird dieser Fehler sichtbar. Zur Lösung dieses Problems hat Continental wiederum einen Mechanismus entwickelt, der inkorrekte Werte identifiziert und automatisch korrigiert.

Erfahren Sie in der Originalpräsentation mehr über den Einsatz von GPS-Daten und entdecken Sie Hacks, um Herausforderungen wie Datenungenauigkeiten zu beheben. Die vollständige Präsentation von Dubravko Dolic ist hier verfügbar: