monos estocásticos: Entender el aprendizaje por refuerzo para que los drones con IA no ataquen a sus dueños