Сравнение стратегий в МППР. Оптимальная стратегия. Теорема Ховарда. Оптимальная функция ценности состояний и оптимальная функция ценности действий. Уравнение оптимальности Беллмана. Жадная стратегия. Оптимальная и жадная стратегии в Gridworld example.