this repo has no description
0
fork

Configure Feed

Select the types of activity you want to include in your feed.

Continue rapport

+8 -3
+8 -3
rapport/context.typ
··· 1 1 #import "@preview/fletcher:0.5.8": diagram, node, edge 2 2 3 3 #let comment = content => text(fill: gray)[(Note: #content)] 4 + #let refneeded = text(fill: luma(100), [[Réf. nécéssaire]]) 4 5 5 6 #show terms: it => grid( 6 7 columns: 2, row-gutter: 1em, column-gutter: (15pt, 0pt), align: (left, left), ··· 98 99 / Le remplissage du tableau: devient la rétropropagation pendant l'entraînement 99 100 100 101 101 - === Nécéssité de la validation 102 + === Tendances à la "tricherie" des agents 102 103 103 - Expérimentalement, on sait que des tendances "tricheuses" émergent facilement pendant l'entraînement: l'agent découvre des séries d'actions qui causent un bug avantageux vis à vis du coût associé, soit parce qu'il y a un bug dans le calcul de l'état de l'environnement post-action, soit parce que la fonction coût ne prend pas suffisemment bien en compte toutes les possibilités de l'environnement (autrement dit, il manque de contraintes). 104 + Expérimentalement, on sait que des tendances "tricheuses" émergent facilement pendant l'entraînement #refneeded: l'agent découvre des séries d'actions qui causent un bug avantageux vis à vis du coût associé, soit parce qu'il y a un bug dans le calcul de l'état de l'environnement post-action, soit parce que la fonction coût ne prend pas suffisemment bien en compte toutes les possibilités de l'environnement (autrement dit, il manque de contraintes). 104 105 105 106 ==== Sous-spécification de la fonction coût 106 107 ··· 126 127 127 128 #comment[ Rien à voir mais je me dis, c'est enfait un moyen de trouver des bugs dans un physics engine ! ça me fait penser au Fuzzing un peu, mais avec un NN plutôt que du hasard contrôlé ] 128 129 129 - ==== 130 + ==== La validation comme méthode de mitigation 131 + #comment[ça se dit mitigation en français?] 132 + 133 + 134 + 130 135 131 136 == Application en robotique 132 137
rapport/main.pdf

This is a binary file and will not be displayed.