Главная страница
Навигация по странице:

  • Требуется

  • Найти

  • Шаг 1

  • Шаг 2

  • Шаг 3

  • ТПР Лаба1. ОтчетТПР1. Отчет по лабораторной работе 1 "Дискретные Марковские процессы" Курса "Теория принятия решений"


    Скачать 81.01 Kb.
    НазваниеОтчет по лабораторной работе 1 "Дискретные Марковские процессы" Курса "Теория принятия решений"
    АнкорТПР Лаба1
    Дата24.11.2020
    Размер81.01 Kb.
    Формат файлаdocx
    Имя файлаОтчетТПР1.docx
    ТипОтчет
    #153467

    Министерство образования и науки Российской Федерации

    Федеральное государственное бюджетное

    образовательное учреждение высшего образования

    «Уфимский государственный авиационный технический университет»


    ОТЧЕТ ПО ЛАБОРАТОРНОЙ РАБОТЕ №1

    “Дискретные Марковские процессы”

    Курса “Теория принятия решений”

    Выполнил:

    Шакиров Д. Р., ПРО-414

    Проверила:

    Агадуллина А.И.

    Уфа, 2019
      1. Цель работы


    Целью работы является освоение способов принятия решений в условиях риска.

    1.2. Задачи


    1. Изучение рекуррентного метода дискретных марковских процессов (ДМП).

    2. Реализация алгоритма для решения конкретной задачи.

    1.3. Постановка задачи


    Дано:

    N – число состояний системы (оно неизменно на каждом этапе);

    k – номер стратегии;

    nколичество этапов моделирования;

    – вероятность перехода от одного состояния (i) к другому (j);

    – доходность.

    Обозначим: – ожидаемая доходность; –  полная ожидаемая доходность на n-ом этапе моделирования.

    Требуется найти: – номера оптимальных стратегий на каждом этапе процесса (n=1, 2, 3…) для каждого i-того состояния системы.

    1.4. Пример


    Дано:

    2 состояния системы − «Удовлетворительное» («У – Заработок покрывает все месячные расходы») и «Плохое» («П – заработка не хватает покрыть все месячные расходы»);

    3 стратегии L – работа репетитором, M – работа учителем в школе, Nработа преподавателем специальных курсов, а также матрицы переходных вероятностей и доходностей для них: Переходные вероятности и доходности занесли в таблицу 1.1:
    Таблица 1.1

    Состояния

    Стратегии

    Переходные вероятности

    Доходности

    У

    П

    У

    П

    У

    1

    1

    0

    8,68

    0,00

    2

    1

    0

    16,83

    0,00

    3

    1

    0

    3,23

    0,00

    П

    1

    0,10

    0,90

    2,43

    3,29

    2

    0,33

    0,67

    14,11

    7,63

    3

    0,33

    0,67

    10,07

    7,86


    Найти: номера оптимальных стратегий на каждом этапе процесса (n =1,2,3…) для каждого состояния системы.

    Решение. Рассмотрим первый этап моделирования (принятия решений).

    Шаг 1. Величина является ожидаемым доходом за один переход при выходе из состояния i и при выборе стратегии k. Таким образом:














    Занесем вычисленные показатели в табл. 1.2.

    Таблица 1.2

    Результаты первого этапа моделирования

    Состояния

    Стратегии

    Переходные вероятности

    Доходности

    Ожидаемые доходности

    У

    П

    У

    П

    У

    1

    0,8

    0,2

    50

    18

    43,6

    2

    0,9

    0,1

    26

    18

    25,2

    3

    0,95

    0,05

    38

    19

    37,05

    П

    1

    0,15

    0,85

    24

    7

    9,55

    2

    0,6

    0,4

    22

    14

    18,8

    3

    0,2

    0,8

    28

    16

    18,4


    Оптимальным является такое поведение, которое максимизирует полный ожидаемый доход для всех состояний и шагов моделирования.

    Шаг 2. Полный ожидаемый доход вычисляется по следующей рекуррентной формуле:



    Зададим

    Вычислим полный ожидаемый доход для 1-ой стратегии на первом этапе моделирования:





    Вычислим полный ожидаемый доход для 2-ой стратегии на первом этапе моделирования:





    Вычислим полный ожидаемый доход для 3-ей стратегии на первом этапе моделирования:





    Найдем максимальное значение полного ожидаемого дохода для каждого состояния для первого этапа моделирования:





    Шаг 3. Если система находится в «удовлетворительном» состоянии, то рекомендуется придерживаться 1-ой стратегии. Эта стратегия принесет доход на 1-ом этапе моделирования в размере 43,6 у.е.

    Если же система находится в «плохом» состоянии, то рекомендуется придерживаться 2 стратегии. Эта стратегия принесет доход на 1-ом этапе моделирования в размере 18,8 у.е. Таким образом, dУ(1) = 1, dП(1) = 2.

    Рассмотрим второй этап моделирования (принятия решений). Найдем полные ожидаемые доходности и решение, которое следует принять на втором этапе моделирования.

    Вычислим полный ожидаемый доход для 1-ой стратегии на втором этапе моделирования:





    Вычислим полный ожидаемый доход для 2-ой стратегии на втором этапе моделирования:




    Вычислим полный ожидаемый доход для 3-ей стратегии на втором этапе моделирования:




    Найдем максимальное значение полного ожидаемого дохода для каждого состояния на втором этапе моделирования:





    На втором этапе моделирования в «удовлетворительном» состоянии рекомендуется придерживаться 1-ой стратегии, то есть стратегии М. Поддержание этой стратегии принесет прибыль в размере 82,24 у.е. Если же система находится в «плохом» состоянии, то рекомендуется придерживаться 2-ой стратегии. Поддержание этой стратегии принесет прибыль в размере 52,48 у.е.

    Рассмотрим третий этап моделирования (принятия решений). Найдем полные ожидаемые доходности и решение, которое следует принять на третьем этапе моделирования.

    Вычислим полный ожидаемый доход для 1-ой стратегии на третьем этапе моделирования:



    Вычислим полный ожидаемый доход для 2-ой стратегии на третьем этапе моделирования:



    Вычислим полный ожидаемый доход для 3-ей стратегии на третьем этапе моделирования:




    Найдем максимальное значение полного ожидаемого дохода для каждого состояния на третьем этапе моделирования:




    На третьем этапе моделирования в «удовлетворительном» состоянии рекомендуется придерживаться 1-ой стратегии. Поддержание этой стратегии принесет прибыль в размере 119,888 у.е. Если же система находится в «плохом» состоянии, то рекомендуется придерживаться 2 стратегии. Поддержание этой стратегии принесет прибыль в размере 89,136 у.е. Основные результаты представлены в табл.1.3:

    Таблица 1.3

    Итоговая таблица выбора стратегий

    n

    0

    1

    2

    3

    vУ(n)

    0

    43,6

    82,24

    119,888

    vП(n)

    0

    18,8

    52,48

    89,136

    dУ(n)

    -

    1

    1

    1

    dП(n)

    -

    2

    2

    2


    1.5. Руководство пользователя разработанного приложения


    Для начала необходимо ввести количество стратегий и количество состояний. (Рис 1)



    Рисунок 1

    Далее необходимо заполнить матрицу переходных вероятностей и матрицу доходностей. (Рис 2)





    Рисунок 2

    После указываем количество этапов моделирования (принятия решений) и нажимаем кнопку «Рассчитать». (Рис 3)



    Рисунок 3

    Далее происходит вывод итоговой таблицы с результатами, где имеется полная ожидаемая доходность и номер оптимальной стратегии для каждого состояния каждого шага моделирования (справа), а также таблица с промежуточными результатами – ожидаемой доходностью и полные ожидаемые доходности для каждого этапа (слева). (Рис 4)



    Рисунок 4

    После расчета нажимаем кнопку «Отрисовка» и получаем граф состояний. Для каждого шага от каждого состояния цветной линией изображены переходы, цвет линии соответствует оптимальной стратегии для соответствующего состояния. (Рис 5)



    Рисунок 5

    1.6. Выводы


    В ходе лабораторной работы изучили рекуррентный метод дискретных марковских процессов, разработали алгоритм для решения поставленной задачи. Убедились в его работоспособности, прогнав тестовый пример.


    написать администратору сайта