Die Durchführung von Machine Learning bzw. KDD-Projekte erfordert nebst fachlichem Wissens und Programmierfähigkeiten mit Data Mining-Werkzeugen insbesondere die Fähigkeit, in einem längeren Entwicklungsprozess laufend datenbasiert Kleinstentscheide zu fällen. Iterativ erstellte Machine Learning Projekte müssen laufend auf die aktuelle Eignung des bestehenden Prototyps, die Ursache eines Programmfehlers oder die Unangemessenheit eines Feature-Engineeringentscheids, der Wahl eines Hyperparameterwerts oder der Bedeutung einer Performanzvisualisierung hin analysiert werden, um daraus einen Entscheid für das weitere Vorgehen zu treffen.
Dieses Modul spielt mit den Studierenden einen Anwendungsfall der Stadt St.Gallen durch, um möglichst viele dieser Kleinstkompetenzen im Gesamtkontext eines KDD-Projekts zu beleuchten. Dabei liegt, ausgehend von dem Vorwissen der Studierenden, ein Schwerpunkt auf dem Erwerb von Fähigkeiten in der Nutzung von Programmier- und Softwareentwicklungswerkzeugen (Python, git, virtualenv), ein zweiter auf den konzeptionellen Themen des maschinellen Lernens (statistisches Lernen, Overfitting, Spezifika der Phasen des KDD-Prozesses).
Workload [h]
Vorlesung: 28
Übungen: 28
Selbststudium: 64
Total: 120
Fachkompetenzen:
Die Teilnehmenden können:
• Das methodische Vorgehen bei Machine Learning/Knowledge Discovery in Databases (KDD-) Projekten aus eigener Erfahrung erklären.
• in allen Phasen eines KDD-Projekts Entscheidungsoptionen nennen und an Hand eigener Erfahrung erläutern welche Auswirkungen diese haben.
• Die Grundzüge der wichtigen Klassen von statistischen Verfahren erklären, und intuitiv begründete Entwicklungsentscheide beim Prototypenbau fällen
Methodenkompetenzen:
Die Teilnehmenden können:
• angeleitet Programmieren und die wichtige Softwareengineeringaufgaben selbständig durchführen
• Anforderungen eines Kunden in Anforderungen und Massnahmen für ein KDD-Projekt übersetzen
• Die Zweckmässigkeit von Methoden der Textanalyse und -klassifikationen in konkreten Situationen beurteilen
Selbstkompetenzen:
Die Teilnehmenden können:
• Den aktuellen Stand eines KDD-Projekts beurteilen und daraus individuelle Massnahmen für das weitere Vorgehen ableiten.
• Verantwortung übernehmen für Teilfunktionalitäten in der Erarbeitung einer Data Mining-Software für einen Kunden
• Eine Deadline zur Produktfinalisierung einhalten
Sozialkompetenzen:
Die Teilnehmenden können:
• Sich mit Mitstudierenden Abstimmen im Hinblick auf ein gemeinsames Entwicklungsziel
• Kritisch die Leistung einer Data Mining-Lösung beurteilen und angemessen (vereinfacht) dem Kunden gegenüber darlegen.
Die Durchführung von Machine Learning bzw. KDD-Projekte erfordert nebst fachlichem Wissens und Programmierfähigkeiten mit Data Mining-Werkzeugen insbesondere die Fähigkeit, in einem längeren Entwicklungsprozess laufend datenbasiert Kleinstentscheide zu fällen. Iterativ erstellte Machine Learning Projekte müssen laufend auf die aktuelle Eignung des bestehenden Prototyps, die Ursache eines Programmfehlers oder die Unangemessenheit eines Feature-Engineeringentscheids, der Wahl eines Hyperparameterwerts oder der Bedeutung einer Performanzvisualisierung hin analysiert werden, um daraus einen Entscheid für das weitere Vorgehen zu treffen.
Dieses Modul spielt mit den Studierenden einen Anwendungsfall der Stadt St.Gallen durch, um möglichst viele dieser Kleinstkompetenzen im Gesamtkontext eines KDD-Projekts zu beleuchten. Dabei liegt, ausgehend von dem Vorwissen der Studierenden, ein Schwerpunkt auf dem Erwerb von Fähigkeiten in der Nutzung von Programmier- und Softwareentwicklungswerkzeugen (Python, git, virtualenv), ein zweiter auf den konzeptionellen Themen des maschinellen Lernens (statistisches Lernen, Overfitting, Spezifika der Phasen des KDD-Prozesses).
Pflichtliteratur wie Skript, Bücher:
Aurélien Géron, Praxiseinstieg Machine Learning mit Scikit-Learn, Keras und Tensorflow, O'Reilly, 2020
Weiterführende Literatur (Empfehlung an Studierende)
Annalyn Ng, Kenneth Soo, Data Science- was ist das eigentlich?! Springer, 2018
(Durchführung gemäss Stundenplan)