Möchten Sie mit Ihrem Team teilnehmen? Ab drei Personen profitieren Sie von unseren Gruppenrabatten! Direkt im Shop buchen!

Reinforcement Learning: eine sanfte Einführung & industrielle Anwendung

Mit Reinforcement Learning erlernen Maschinen selbstständig, komplexe Abläufe, wie etwa Helikopterfliegen oder Schachspielen. Trainingsdaten mit den „richtigen“ Antworten benötigen sie nicht mehr. Die Algorithmen lernen selbst – durch taktisch geschicktes Ausprobieren.

Wie arbeiten solche Algorithmen und warum funktionieren sie?

Dieser Vortrag beantwortet und illustriert dies anhand der Art und Weise, wie ein Kind ein neues Spiel lernt. Zudem erfahren Sie, wie sich ein real existierendes Industrie-Problem als Reinforcement-Learning-Aufgabe modellieren und lösen lässt.

Unsere Industrie-Applikation aus dem Bereich der Druckdachentwässerung stellt sicher, dass große Gebäude wie Stadien oder Einkaufszentren bei starkem Regen nicht einstürzen. Da bis heute kein zumutbarer deterministischer Algorithmus bekannt ist, ist bei solchen Bauten die Wahl des „richtigen“ Durchmessers schwierig. Sie erfordert Intuition und hydraulisches Fachwissen. Mithilfe von Reinforcement Learning ist es uns jedoch gelungen, die Fehlerrate unserer bestehenden Machine-Learning-Lösung um 70 Prozent senken.

Vorkenntnisse

Spezielle Vorkenntnisse sind nicht nötig, ein Grundverständnis von Machine Learning und neuronalen Netzen ist aber hilfreich.

Lernziele

* Intuitives Verständnis, wie und warum Reinforcement-Learning-Algorithmen funktionieren
* Was braucht es, um ein bestehendes Problem mittels Reinforcement Learning zu lösen ?* Konkrete Anwendung jenseits von Atari-Games

Speaker

 

Christian Hidber
Christian Hidber arbeitet bei bSquare als Consultant mit Fokus auf Machine Learning, .Net und Azure. Nach seinem Mathematik-Studium doktorierte er an der ETH Zürich und arbeitete als Postdoc am International Computer Science Institute in Berkeley, Kalifornien. Derzeit wendet er Reinforcement Learning auf die Simulation hydraulischer Systeme an, im Kontext eines Produkts mit mehr als 7000 Installationen in über 40 Ländern.

heise-devSec-Newsletter

Sie möchten über die heise devSec
auf dem Laufenden gehalten werden?

 

Anmelden