Was ist Data Science?
Definition
Data Science ist eine interdisziplinäre wissenschaftliche Disziplin, die sich mit der systematischen Analyse, Verarbeitung und Interpretation großer Datenmengen befasst, um daraus Wissen, Muster und Vorhersagen zu gewinnen. Sie verbindet Methoden aus der Statistik, der Informatik und einer jeweiligen Anwendungsdomäne, um datenbasierte Modelle zu entwickeln, die reale Prozesse und Zusammenhänge abbilden. Dabei werden moderne Algorithmen eingesetzt, um aus sogenannten Big Data relevante Merkmale zu extrahieren und diese für Mensch und Maschine nutzbar zu machen.

Ziel der Data Science ist es, fundierte Entscheidungen zu ermöglichen, Prozesse zu optimieren und neue Erkenntnisse zu gewinnen, unter Berücksichtigung von Datensicherheit, Ethik und verantwortungsvollem Umgang mit Daten.
Projektablauf
Der typische Ablauf eines Data-Science-Projekts lässt sich in mehrere aufeinanderfolgende Phasen unterteilen:
1. Datenerhebung und -vorbereitung
Hier werden Daten aus verschiedenen Quellen gesammelt, bereinigt, strukturiert und für die Analyse aufbereitet. Dazu gehören Schritte wie das Entfernen fehlerhafter Werte, das Zusammenführen unterschiedlicher Datensätze und die Auswahl relevanter Merkmale.
2. Modellierung und Analyse
In dieser Phase werden statistische Methoden, Machine-Learning-Verfahren oder KI-Algorithmen eingesetzt, um Muster, Zusammenhänge oder Vorhersagen aus den Daten zu gewinnen.
3. Interpretation und Anwendung
Die Ergebnisse werden bewertet, visualisiert und in der Praxis eingesetzt, z. B. in Form von Entscheidungshilfen, Prognosen oder automatisierten Systemen.
Etwas anschaulicher bitte?
Data Science lässt sich anschaulich mit der Arbeit eines Detektivs vergleichen. Zunächst werden viele Hinweise gesammelt (Daten), die zunächst ungeordnet und teilweise unzuverlässig sind. Diese Hinweise müssen sortiert, geprüft und aufbereitet werden. Anschließend sucht der Detektiv nach Mustern, Zusammenhängen und Verdächtigen (Modelle und Algorithmen), um schließlich eine fundierte Schlussfolgerung zu ziehen (Ergebnis oder Prognose).
Ein Beispiel aus dem Alltag ist die Navigations-App: Zunächst werden zahlreiche Verkehrsdaten gesammelt, anschließend ausgewertet und verarbeitet, um daraus die schnellste Route zu berechnen. Auch Sprachassistenten, Wettervorhersagen, Streaming-Empfehlungen oder medizinische Diagnosen beruhen auf genau diesen datengetriebenen Prozessen.
Ein zentraler Aspekt der Data Science ist dabei die Übertragbarkeit der Modelle auf neue Daten. Ein Modell, das im Labor mit Testdaten gut funktioniert, muss sich auch im realen Einsatz bewähren.
Data Science ist heute eine Schlüsseltechnologie, die in nahezu allen Bereichen unseres Lebens Anwendung findet, unter anderem in Medizin, Wirtschaft, Logistik, Umwelt, Mobilität und Industrie.
Übersicht der verschiedenen Bereiche der Data Science
Was ist eigentlich Data Science? Wie ist es an der Technischen Universität Hamburg (TUHH) zu studieren?
Im Bachelorstudiengang Data Science an der TUHH lernst du, wie moderne Algorithmen funktionieren und wie du sie nicht nur anwenden, sondern auch selbst weiterentwickeln kannst. Du erwirbst fundierte mathematische und statistische Grundlagen, kombinierst diese mit Informatikkenntnissen und setzt dein Wissen praktisch an realen Datensätzen um.
Der Studiengang ist stark praxisorientiert, bietet vielfältige Wahlpflichtmodule in unterschiedlichen Anwendungsgebieten (z. B. Medizin oder Logistik) und vermittelt dir zudem wichtige Kompetenzen in den Bereichen Datensicherheit und Ethik. Da der Studiengang im Kern als Informatikstudium aufgebaut ist, stehen dir anschließend viele Masterstudiengänge mit Informatikbezug offen.
Wenn du herausfinden möchtest, wie das Studium im Alltag aussieht, schau dir die folgenden Interviews mit Studierenden des Studiengangs Data Science der TUHH an.


