Принятие решения водителем такси
21.12.12 23:18

Марковская модель принятия решения водителем такси

Е.С. Фарафонова

Острый интерес нашего общества в последнее время к транспортной ситуации в крупных городах обусловлен необходимостью улучшения качества, сокращения сроков и увеличения объемов перевозок. На фоне этого развивается общественный транспорт, растет количество таксопарков, транспортные сети становятся все более перегруженными. Одним из путей повышения качества транспортных услуг является оптимизация деятельности транспортных предприятий и отдельных транспортных единиц.

В работе рассматривается задача оптимизации принятия решений водителем такси. С помощью модели предполагается определять оптимальное решение в каждом из состояний процесса. Водителю предлагаются оптимальные решения, которые он может реализовать или отклонить, выбрав свое. Таким образом, для водителя модель становится элементом системы поддержки принятия решений (СППР).

Моделирование выполнено на основе марковских цепей принятия решений с платежами, т.е. управляемых марковских цепей (УМЦ). Для марковских цепей, в отличие от других случайных процессов, характерно то, что вероятность появления того или иного значения на clip_image002-м шаге зависит лишь от значения на k-м шаге и не зависит от значений на предыдущих шагах. Особенностью УМЦ является то, что имеется возможность управлять значениями переходными вероятностей, т.е. в зависимости от принятого решения инициируется соответствующая матрица переходных вероятностей, а после реализации решения будет получен определенный доход (платеж).

Постановка задачи.

Такси выполняет перевозки пассажиров внутри и между тремя подмосковными городами, например, Пушкино, Королёв и Ивантеевка. Город, в котором находится такси, является текущим -м состоянием УМЦ (clip_image004, где в рассматриваемом случае clip_image006). Всякий раз, когда водитель освобождается (высаживает очередного пассажира), он оказывается перед выбором одной из альтернатив (clip_image008, где для данного частного случая clip_image010): ездить по текущему городу в поисках пассажира, ждать вызова от диспетчера или ехать на стоянку в текущем городе и стать там в очередь. Задача заключается в поиске для водителя оптимальной стратегии clip_image012, позволяющей ему в каждом состоянии clip_image014 принимать наилучшее решение clip_image016. В работе рассматриваются три периода стационарности: дневное время, часы пик, вечернее время.

В задаче предполагаются известными следующие исходные данные: матрицы переходных вероятностей для каждой -ой альтернативы clip_image018, средняя стоимость проезда в такси из одного города в другой и внутри каждого из них clip_image020, а также средние затраты времени на перевозку пассажира clip_image022.

Поскольку размерность задачи небольшая, то для ее решения использован метод полного перебора. При больших размерностях для решения задачи поиска оптимальной стратегии можно воспользоваться, например, итерационным методом Р. Ховарда (итерации по стратегиям).

Решение задачи.

1-й этап - формирование множества clip_image024 стратегий clip_image026 из дискретного множества решений (clip_image028).

2-й этап состоит в формировании матриц переходных вероятностей clip_image030 и матриц платежей clip_image032, clip_image034 для каждой из возможных стратегий clip_image036.

3-й этап - вычисление вектора вероятностей состояний в установившемся режиме clip_image038 при больших значениях шага процесса clip_image040.

Средняя величина платежа за один шаг clip_image042, при условии, что процесс находится в -ом состоянии и применяется clip_image036[1]-ая стратегия, определится как clip_image044. А далее, чтобы избавиться от условий (clip_image046), необходимо усреднить условные средние платежи clip_image042[1] по множеству условий. Кроме того на данном этапе находим вектор вероятностей предельных состояний УМЦ из уравнения установившегося режима марковской цепи: clip_image048.

4-й этап - вычисление безусловного среднего платежа clip_image050за один шаг для фиксированной стационарной стратегии clip_image026[1], где clip_image050[1] выступает в роли целевой функции: clip_image052. Затем из множества стратегий выбирается оптимальная стратегия clip_image054.

5-й этап - на основе полученных данных о средних безусловных платежах определяются оптимальные стратегии clip_image056 для каждого периода стационарности по двум видам платежей: доходы и затраченное время.

Для исследования динамики изменения рассматриваемых показателей выполнена имитация работы такси в течение одной смены, для чего в среде MS Excel на основе случайных чисел сформированы изменения состояний и сымитированы решения, принимаемые водителем в разные периоды стационарности. Для выбора решения по двум критериям (доходы, время) применен метод, основанный на Парето-оптимальности.

Выводы.

Выполненные исследования в режиме имитации подтверждают полную работоспособность алгоритма оптимального выбора решений водителем такси на множестве исходных данных, близких к реальным.

В качестве дальнейших направлений развития данного исследования можно рассматривать реализацию алгоритма Р. Ховарда для решения задачи произвольной размерности, построение и исследование алгоритма решения обратной задачи, что позволит привязать модель к данным реально функционирующих предприятий. Кроме того построенная модель может быть реализована в виде компьютерной программы в составе СППР, которая позволит водителю такси принимать эффективные решения за счет сбора реальной статистики и накопления опыта принятия им эффективных решений.