Jekaterina Kokatjuhha

Jekaterina Kokatjuhha

Jekaterina Kokatjuhha

Data Analyst (Business Excellence), Zalando SE |

Aufbau eines Data-Science-Projekts von Grund auf: eine Analyse der Berliner Mietpreise.

In diesem Vortrag geht es darum, wie man ein gutes Data-Science-Projekt, das auf einem realen Datensatz basiert, von Grund auf neu entwerfen kann. Als Vorzeigeprojekt analysieren wir die Mietpreise für Wohnungen in Berlin und führen Sie durch alle Schritte eines Kurzzeitprojektes: Motivation, Extraktion von Daten aus dem Web, Bereinigung und Engineering von Features mit Hilfe externer APIs, Storytelling und Aufbau von Machine Learning Modellen. Wir werden in die Fallstricke und Designmuster eintauchen, wenn wir Daten aus dem Web beschaffen. Die Bedeutung der interaktiven Dashboards sollte nicht unterschätzt werden, da sie Ihnen helfen, selbst nützliche Einblicke zu bekommen. Wir werden das menschliche Urteil über die Adresse der Wohnung anwenden, um neue Funktionen mit Google API zu entwickeln und korrelierte Funktionen zu verwenden, um die Funktion des Zinses zu berechnen. Am Ende werden mehrere Modelle des Machine Learning verwendet, um die Idee des Bagging und der Modelle zu erforschen.

Kurzbiographie

Jekaterina ist Datenanalytikerin bei Zalando. Sie erwarb einen Master-Abschluss in Bioinformatik an der FU Berlin und arbeitete in verschiedenen Forschungseinrichtungen in ganz Europa, wie der Charité in Berlin, dem Centre for Genomics Regulations in Barcelona und der Manchester University. Jekaterina ist begeistert von Machine Learning und Data Science und engagiert sich in einigen ML-Side-Projekten.