Modul
Logik
Beta

Bestärkendes Lernen

LINKKostEn
1
HYPerlink Cost
Fähigkeit
Bestimme eine Domäne. Dein Gegner zeigt seine Handkarten offen vor und wirft dann 1 Karte dieser Domäne ab.
Basisstärke
2
Wächtermodul
Wächter

Der Herbst zeigt sein schroffes Gesicht: Nur wer schnell aus seinen Fehlern lernt, kann bestehen.

Illustr. Michele Esposito © 2022 Universität Innsbruck

Entdecke mehr

Stell dir einen ausgewachsenen Fuchs vor, der mutig in die Wildnis aufbricht, bereit, neue Herausforderungen zu meistern. Ohne Anleitung lernt der Fuchs durch Versuch und Irrtum und wird mit jedem Tag stärker und geschickter. Ähnlich können Maschinen ihr Verhalten anhand von Belohnungen anpassen und verbessern. Diese Technik nennt man bestärkendes Lernen. Besonders in Spielsituationen zeigt diese Methode vielversprechende Ergebnisse. Maschinen, die durch bestärkendes Lernen trainiert wurden, wie diejenigen, die das uralte Spiel Go oder DOTA meistern, können sogar Menschen übertreffen. Diese Algorithmen sind auf sehr spezifische Situationen spezialisiert, weshalb wir noch nicht von künstlicher allgemeiner Intelligenz sprechen können. Wenn man jedoch bestärkendes Lernen mit anderen Methoden wie unüberwachtem und überwachtem Lernen kombiniert, könnten diese Maschinen vielleicht zu vielseitigeren Agenten werden.

Illustr. Michele Esposito © 2022 Universität Innsbruck

Durchsuche das Archiv

Auch Maschinen können aus Fehlern lernen

Wie funktioniert bestärkendes Lernen?

Prev:
This is some text inside of a div block.
Alle Karten
Next:
This is some text inside of a div block.