Educational Data Mining

E-Learning und Online-Bildung für Studenten- und Hochschulkonzepte. Grafische Oberfläche, die die Technologie des digitalen Schulungskurses zeigt, damit Menschen von überall aus digital Fernlernen können.

Educational Data Mining ist - vereinfacht gesprochen - Data Mining auf Daten, die im Bildungsbereich entstehen oder erhoben werden. Entstehen meint damit Daten, die einfach anfallen, ohne dass es ein spezielles Ziel in der Forschung oder auch zur Verbesserung von Programmen gibt. Das sind typischerweise administrative Daten, die sich in den Datenbanken von Schulen und Hochschulen sammeln; beispielsweise den Daten, die schon seit vielen Jahren erhoben werden, um zu sehen, wo in einem Studienablauf Hürden bestehen oder was die Bedingungen sind, die dazu führen, dass eine Schul- oder Studienbiographie gelingt. Dabei stehen in diesem Gebiet immer die Datenbank, klassische Statistik und Techniken aus dem Bereich des Maschinellen Lernens im Fokus. Educational Data Mining kann auf diesem Level von ganzen Schul- und Studiumsverläufen stattfinden oder auf dem Level einzelner Kurse oder Techniken. In diesen Fällen geht es darum, Bildungsdaten aus der Nutzung interaktiver Lernumgebungen durch z.B. Studierende aus computergestützten kollaborativen Lernplattformen zu verwenden. Das Ziel ist immer, die Lernenden und die Umgebung, in der sie lernen, besser zu verstehen; manchmal auch dabei, eine Software zu entwerfen, die dabei hilft, adaptiv Lernprozesse zu unterstützen. Jemand, der auf Bildungsdaten Data Mining betreibt, ist dabei nicht automatisch Didaktiker oder Pädagoge. Für einige wenige Fragen, die eher an Vorschlagssysteme von Verkaufsplattformen, hier nur eben für Aufgaben etc. erinnern, ist das auch nicht immer nötig. Aber das volle Potenzial erschließt sich in dieser Anwendung nur in der Arbeit in interdisziplinären Teams, sodass Didaktiker und Pädagogen Interpretationen aus den durch Statistik und maschinelles Lernen gewonnenen Mustern begleiten und Ergebnisse einordnen. Darüber hinaus sind Bildungsdaten sehr sensible Daten. Es geht um Menschen, denen man bei etwas über die Schulter schaut, was diese noch nicht können; wobei Freiwilligkeit hier ein Aspekt ist, der in gewisser Weise unter Datenschutz subsummiert werden kann, da eben eine Einverständniserklärung für die Datenverarbeitung vorliegen muss. Ein anderer Punkt ist aber die Erklärbarkeit als Teilaspekt der Trustworthy AI. Um Diskriminierung, die sich ggf. in Lernbiographien der Vergangenheit manifestierte, nicht fortzuschreiben, müssen wir bei Einschätzungen der KI-Systeme immer das „Warum“ verstehen und hinterfragen können. Das Potenzial dieser Anwendung von maschinellem Lernen ist sehr groß, um Bildungsgerechtigkeit und Qualität zu verbessern. Gleichzeitig ist es eines der Gebiete, in denen die Anwendung datengetriebener Innovationen mit einer besonderen Verantwortung einhergeht und in denen man die Idee der Trustworthy AI groß schreiben muss.