Публикации по теме 'q-learning'


Понимание обучения с подкреплением посредством Q-Learning: простой пример 1D
Обучение с подкреплением (RL) — это отрасль машинного обучения, которая фокусируется на обучении агентов принимать решения в среде для достижения цели или максимизации некоторого понятия совокупного вознаграждения. В этой статье мы рассмотрим основы обучения с подкреплением, сосредоточившись на простом примере, в котором используется метод Q-обучения с поиском по таблице. В примере демонстрируется агент, который учится находить сокровища в одномерном мире. Теория Ключевые..

Вопросы по теме 'q-learning'

Q-обучение (несколько целей)
я только начал изучать Q-обучение и вижу возможности использования Q-обучения для решения моей проблемы. Проблема: я должен обнаружить определенную комбинацию данных, у меня есть четыре матрицы, которые действуют как входные данные для моей...
1736 просмотров

Различные награды за одно и то же состояние в обучении с подкреплением
Я хочу внедрить Q-Learning для игры про динозавров Chrome (в которую можно играть, когда вы не в сети). Я определил свое состояние как: расстояние до следующего препятствия, скорость и размер следующего препятствия. В качестве награды я хотел...
677 просмотров