Статистическая обработка временных рядов

Марковский процесс принятия решений



Марковский процесс вознаграждений

Определение марковского процесса вознаграждений (МПВ). Мгновенные, n-шаговые и накопленные вознаграждения. Функция вознаграждений. Временной горизонт. Дисконтирование будущих вознаграждений. Функция ценности состояний МПВ. Уравнение Беллмана для МПВ.

Решение задач Список вопросов Экспериментальные исследования Проверь себя!

Контрольный тест


Марковский процесс принятия решений

Определение марковского процесса принятия решений(МППР). Лицо, принимающее решения. Матрица вероятностей переходов и мгновенные вознаграждения. Сравнение МППР и МПВ. Граф переходов МППР. Функция вознаграждений. Стратегия в МППР. Функция ценности состояний и функция ценности действий. Уравнение Беллмана для МППР. Gridworld example.

Решение задач Список вопросов Экспериментальные исследования Проверь себя!

Контрольный тест

Контроль знаний

Контрольная работа

Контрольная работа

(Для зарегистрированных пользователей)