Seguir
Stephane Hatgis-Kessell
Stephane Hatgis-Kessell
Dirección de correo verificada de utexas.edu
Título
Citado por
Citado por
Año
Models of human preference for learning reward functions
WB Knox, S Hatgis-Kessell, S Booth, S Niekum, P Stone, A Allievi
arXiv preprint arXiv:2206.02231, 2022
202022
Learning optimal advantage from preferences and mistaking it for reward
WB Knox, S Hatgis-Kessell, SO Adalgeirsson, S Booth, A Dragan, P Stone, ...
Proceedings of the AAAI Conference on Artificial Intelligence 38 (9), 10066 …, 2024
22024
El sistema no puede realizar la operación en estos momentos. Inténtalo de nuevo más tarde.
Artículos 1–2