Mit „Reinforcement Learning“ zu optimalen Ergebnissen
Wissenschaftspreis für Logistik
12.03.2025
betrachtet einen wichtigen Bereich der Künstlichen Intelligenz im Hinblick auf ein konkretes praktisches Anwendungsfeld, nämlich die Berechnung von Produktionsablaufplänen und wurde im Rahmen der BVL Supply Chain CX mit dem Wissenschaftspreis Logistik ausgezeichnet. Lang nutzt in seiner Arbeit Methoden des sogenannten „Reinforcement Learning“ (RL), also des bestärkenden Lernens. Dieses erlaubt es, eine Software mittels Trial-and-Error so zu trainieren, dass diese im Anschluss Produktionsablaufentscheidungen in Echtzeit berechnen kann. Der Unterschied zu etablierten Verfahren ist, dass nicht nach Trai-ningslabeln, sondern eben durch Versuch und Irrtum trainiert wird. Aus dem positiven wie negativen Feedback ziehen RL-Anwendungen langfristig die richtigen Schlüsse und entwi-ckeln Schritt für Schritt die richtige Planungs- und Steuerungsstrategie. Damit betrat Lang Neuland: In den letzten 30 Jahren gab es nur rund 100 Veröffentlichungen zu RL. Das bestärkende Lernen eignet sich im besonderen Maße für die sehr anspruchsvolle Ablaufpla-nung in hochvolatilen, komplexen oder störanfälligen Produktionsumgebungen. Konkretes Ergebnis der Dissertation von Sebastian Lang ist ein Vorgehensmodell, wie Verfahren des Reinforcement Learning für die Produktionsablaufplanung zu entwickeln, zu integrieren und anzuwenden sind. Zusätzlich zeigt er anhand eines konkreten Beispiels aus der Transport-planung auf, dass sein Konzept auch auf andere Bereiche der Logistik übertragbar ist.
Die Verleihung des Wissenschaftspreises erfolgte durch Prof. Dr.-Ing. Ludger Overmeyer von der Leibniz Universität Hannover auf der BVL Supply Chain CX im Oktober.