Jusletter IT

KI-Sicherheit, Reward Hacking und die Paradoxa der Normenlogik

  • Author: Diogo Campos Sasdelli
  • Category of articles: Security and Law
  • Region: Czech Republic, EU
  • Field of law: Security and Law
  • Collection: Conference proceedings IRIS 2022
  • DOI: 10.38023/76692828-9da1-469a-8310-10fd68db582e
  • Citation: Diogo Campos Sasdelli, KI-Sicherheit, Reward Hacking und die Paradoxa der Normenlogik, in: Jusletter IT 30 June 2022
Reinforcement Learning zählt aktuell zu den beliebtesten Ansätzen im Bereich des Machine Learning. Hierbei geht es um den Ansatz, eine Art Belohnungsfunktion zu bestimmen, die der Maschine je nach ihrem Verhalten einen bestimmten Belohnungswert zuordnet. Die Maschine strebt an, diesen Wert zu maximieren. Der normative Charakter dieses Ansatzes springt in die Augen. In diesem Aufsatz wird gezeigt, dass einige Probleme, die im Zusammenhang mit Reinforcement Learning auftauchen (Reward Hacking) sehr enge strukturelle Verwandtschaften mit den sog. Paradoxa der Normenlogik aufweisen.

Table of contents

  • 1. Prolegomena
  • 1.1. Die Normenlogik und ihre Paradoxa
  • 1.2. Neuronale Netze, maschinelles Lernen, Reinforcement Learning
  • 2. KI-Sicherheit, Reward Hacking und die Paradoxa der Normenlogik
  • 3. Schluss
  • 4. Literatur

No comments

There are no comments yet

Ihr Kommentar zu diesem Beitrag

AbonnentInnen dieser Zeitschrift können sich an der Diskussion beteiligen. Bitte loggen Sie sich ein, um Kommentare verfassen zu können.