ТПР Лаба1. ОтчетТПР1. Отчет по лабораторной работе 1 "Дискретные Марковские процессы" Курса "Теория принятия решений"
Скачать 81.01 Kb.
|
Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего образования «Уфимский государственный авиационный технический университет» ОТЧЕТ ПО ЛАБОРАТОРНОЙ РАБОТЕ №1 “Дискретные Марковские процессы” Курса “Теория принятия решений” Выполнил: Шакиров Д. Р., ПРО-414 Проверила: Агадуллина А.И. Уфа, 2019 Цель работыЦелью работы является освоение способов принятия решений в условиях риска. 1.2. Задачи1. Изучение рекуррентного метода дискретных марковских процессов (ДМП). 2. Реализация алгоритма для решения конкретной задачи. 1.3. Постановка задачиДано: N – число состояний системы (оно неизменно на каждом этапе); k – номер стратегии; n – количество этапов моделирования; – вероятность перехода от одного состояния (i) к другому (j); – доходность. Обозначим: – ожидаемая доходность; – полная ожидаемая доходность на n-ом этапе моделирования. Требуется найти: – номера оптимальных стратегий на каждом этапе процесса (n=1, 2, 3…) для каждого i-того состояния системы. 1.4. ПримерДано: 2 состояния системы − «Удовлетворительное» («У – Заработок покрывает все месячные расходы») и «Плохое» («П – заработка не хватает покрыть все месячные расходы»); 3 стратегии L – работа репетитором, M – работа учителем в школе, N – работа преподавателем специальных курсов, а также матрицы переходных вероятностей и доходностей для них: Переходные вероятности и доходности занесли в таблицу 1.1: Таблица 1.1
Найти: номера оптимальных стратегий на каждом этапе процесса (n =1,2,3…) для каждого состояния системы. Решение. Рассмотрим первый этап моделирования (принятия решений). Шаг 1. Величина является ожидаемым доходом за один переход при выходе из состояния i и при выборе стратегии k. Таким образом: Занесем вычисленные показатели в табл. 1.2. Таблица 1.2 Результаты первого этапа моделирования
Оптимальным является такое поведение, которое максимизирует полный ожидаемый доход для всех состояний и шагов моделирования. Шаг 2. Полный ожидаемый доход вычисляется по следующей рекуррентной формуле: Зададим Вычислим полный ожидаемый доход для 1-ой стратегии на первом этапе моделирования: Вычислим полный ожидаемый доход для 2-ой стратегии на первом этапе моделирования: Вычислим полный ожидаемый доход для 3-ей стратегии на первом этапе моделирования: Найдем максимальное значение полного ожидаемого дохода для каждого состояния для первого этапа моделирования: Шаг 3. Если система находится в «удовлетворительном» состоянии, то рекомендуется придерживаться 1-ой стратегии. Эта стратегия принесет доход на 1-ом этапе моделирования в размере 43,6 у.е. Если же система находится в «плохом» состоянии, то рекомендуется придерживаться 2 стратегии. Эта стратегия принесет доход на 1-ом этапе моделирования в размере 18,8 у.е. Таким образом, dУ(1) = 1, dП(1) = 2. Рассмотрим второй этап моделирования (принятия решений). Найдем полные ожидаемые доходности и решение, которое следует принять на втором этапе моделирования. Вычислим полный ожидаемый доход для 1-ой стратегии на втором этапе моделирования: Вычислим полный ожидаемый доход для 2-ой стратегии на втором этапе моделирования: Вычислим полный ожидаемый доход для 3-ей стратегии на втором этапе моделирования: Найдем максимальное значение полного ожидаемого дохода для каждого состояния на втором этапе моделирования: На втором этапе моделирования в «удовлетворительном» состоянии рекомендуется придерживаться 1-ой стратегии, то есть стратегии М. Поддержание этой стратегии принесет прибыль в размере 82,24 у.е. Если же система находится в «плохом» состоянии, то рекомендуется придерживаться 2-ой стратегии. Поддержание этой стратегии принесет прибыль в размере 52,48 у.е. Рассмотрим третий этап моделирования (принятия решений). Найдем полные ожидаемые доходности и решение, которое следует принять на третьем этапе моделирования. Вычислим полный ожидаемый доход для 1-ой стратегии на третьем этапе моделирования: Вычислим полный ожидаемый доход для 2-ой стратегии на третьем этапе моделирования: Вычислим полный ожидаемый доход для 3-ей стратегии на третьем этапе моделирования: Найдем максимальное значение полного ожидаемого дохода для каждого состояния на третьем этапе моделирования: На третьем этапе моделирования в «удовлетворительном» состоянии рекомендуется придерживаться 1-ой стратегии. Поддержание этой стратегии принесет прибыль в размере 119,888 у.е. Если же система находится в «плохом» состоянии, то рекомендуется придерживаться 2 стратегии. Поддержание этой стратегии принесет прибыль в размере 89,136 у.е. Основные результаты представлены в табл.1.3: Таблица 1.3 Итоговая таблица выбора стратегий
1.5. Руководство пользователя разработанного приложенияДля начала необходимо ввести количество стратегий и количество состояний. (Рис 1) Рисунок 1 Далее необходимо заполнить матрицу переходных вероятностей и матрицу доходностей. (Рис 2) Рисунок 2 После указываем количество этапов моделирования (принятия решений) и нажимаем кнопку «Рассчитать». (Рис 3) Рисунок 3 Далее происходит вывод итоговой таблицы с результатами, где имеется полная ожидаемая доходность и номер оптимальной стратегии для каждого состояния каждого шага моделирования (справа), а также таблица с промежуточными результатами – ожидаемой доходностью и полные ожидаемые доходности для каждого этапа (слева). (Рис 4) Рисунок 4 После расчета нажимаем кнопку «Отрисовка» и получаем граф состояний. Для каждого шага от каждого состояния цветной линией изображены переходы, цвет линии соответствует оптимальной стратегии для соответствующего состояния. (Рис 5) Рисунок 5 1.6. ВыводыВ ходе лабораторной работы изучили рекуррентный метод дискретных марковских процессов, разработали алгоритм для решения поставленной задачи. Убедились в его работоспособности, прогнав тестовый пример. |