···269269 setbuilder(
270270 cases(
271271 & c_0 & = (s_0, a_0),
272272- forall t in NN quad & c_(t+1) & = M(c_t)
272272+ forall t in NN quad & c_(t+1) & = (M(c_t), a_t)
273273 ),
274274 (s_0, a) in S times A^NN
275275 )
···670670671671Un environnement de RL#footnote[Reinforcement Learning] ne se résume pas à son moteur de physique: il faut également charger des modèles 3D, le modèle du robot (qui doit être contrôlable par les actions), et également, pendant les phases de développement, avoir un moteur de rendu graphique, une interface et des outils de développement.
672672673673-Cet ensemble s'appelle un _simulateur_.
673673+Cet ensemble s'appelle un _simulateur_. Quand le simulateur simule égalment la partie logicielle, on parle de _simulateur système_.
674674675675676676=== Spécification de la tâche