Практикум по теории систем и системному анализу для студентов бакалавриата по направлениям Прикладная информатика в экономике
Скачать 0.65 Mb.
|
ТЕМА 5. ТЕСТИРОВАНИЕ ДВУХУРОВНЕВОЙ МОДЕЛИ Теоретическая часть Вероятности значений входной переменной низшего уровня опреде- ляются путём последовательного использования формулы Байеса для учё- та информации о состоянии каждой входной переменной. Формула Байеса имеет вид p(A i /B gh ) = p(A i ) p(B gh /A i ) å j =1 n p(A j ) p(B gh /A j ) (4) Она позволяет перейти от вероятности p(A i ) события A i к вероятности p(A i /B gh ) события A i при условии, что имеет место событие B gh . В нашем случае p(A i /B gh ) — вероятность i-го значения выходной переменной при условии, что имеет место h-е значение входной переменной x g ; n — число возможных значений выходной переменной; p(B gh /A i ), p(B gh /A j ) — веро- ятность h-го значения входной переменной x g при условии i-го (j-го) значе- ния выходной переменной; p(A i ), p(A j ) — вероятность i-го (j-го) значения выходной переменной. Если входные переменные независимы, можно вычислить вероят- ность i-го значения выходной переменной при условии, что известны зна- чения некоторых или всех входных переменных. Например, предположим, что требуется определить вероятность p(A i /(B gh U B qw )) события A i при условии, что x g = h и x q = w. Для этого можно использовать формулу Бай- еса в любой из нижеследующих форм: p(A i /B gh ) p(B qw /A i ) å j =1 n p(A j /B gh ) p(B qw /A j ) , (5) где значение p(A i /B gh ) ранее определено по формуле (4), либо p(A i /B qw ) p(B gh /A i ) å j =1 n p(A j /B qw ) p(B gh /A j ) , (6) 39 если ранее с помощью формулы, аналогичной (4), определено значение p(A i /B qw ). Рассмотрим использование формулы Байеса на упрощённом приме- ре, в котором каждая переменная имеет по два дискретных значения, а входных переменных две. Положим, что вероятности значений выходной переменной x 0 до получения информации о входных переменных отличают- ся лишь немного: p(x 0 =1)=0,55, p(x 0 =2)=0,45. Заданы следующие условные вероятности (вертикальную черту следует читать как «при условии, что»): ¨ p(x 1 =1|x 0 =1) = 0,5; ¨ p(x 1 =2|x 0 =1) = 0,5; ¨ p(x 1 =1|x 0 =2) = 0,2; ¨ p(x 1 =2|x 0 =2) = 0,8; ¨ p(x 2 =1|x 0 =1) = 0,1; ¨ p(x 2 =2|x 0 =1) = 0,9; ¨ p(x 2 =1|x 0 =2) = 0,8; ¨ p(x 2 =2|x 0 =2) = 0,2. Положим, что поступила информация о значении второй входной переменной: x 2 =1. Согласно формуле (4), вероятность события x 0 =1|x 2 =1 составит 0,55 0,1 0,1325. 0,55 0,1 0,45 0,8 × = × + × Вероятность события x 0 =2|x 2 =1 составит 0,45 0,8 0,8675. 0,55 0,1 0,45 0,8 × = × + × Как и следует, сумма этих двух вероятностей равна единице. Теперь положим, что в дополнение к уже имеющейся информации о второй переменной поступила информация ещё и о первой: x 1 =2. Согласно формуле (5), вероятность события x 0 =1|(x 2 =1 U x 1 =2) равна 0,1325 0,5 0,0871. 0,1325 0,5 0,8675 0,8 × = × + × Вероятность события x 0 =2|(x 2 =1 U x 1 =2) составит 0,8675 0,8 0,9129. 0,1325 0,5 0,8675 0,8 × = × + × Как и следует, сумма этих двух вероятностей равна единице. 40 Итак, если энтропия переменной x 0 до получения информации со- ставляла –0,45·log 2 0,45 – 0,55·log 2 0,55 = 0,9928 бит, то после получения первого сигнала она стала равна 0,5643 бит, а после второго сократилась до 0,4267 бит. На практике поступление новой информации может не только сни- жать, но и увеличивать энтропию. В общем случае для определения вероятности i-го значения выход- ной переменной формулу Байеса применяют ровно столько раз, сколько имеется известных значений входных переменных. Вероятности значений выходных переменных более высоких уров- ней при заданных значениях переменных низшего уровня определяются по формуле средней взвешенной p(C k /B) = å i =1 m p(C k /D i ) p(D i /B), (7) где B — сочетание значений входных переменных низшего уровня; D i — сочетание значений входных переменных данного уровня; p(C k /B) — ве- роятность k-го значения выходной переменной при условии, что имеет ме- сто сочетание B; p(C k /D i ) — вероятность k-го значения выходной пере- менной при условии, что имеет место сочетание D i (эта вероятность опре- деляется последовательным применением формулы Байеса); p(D i /B) — вероятность сочетания D i при условии, что имеет место сочетание B (рав- на произведению вероятностей вошедших в сочетание D i значений пере- менных данного уровня при условии, что имеет место сочетание B), m — число сочетаний значений входных переменных данного уровня. Рассмотрим числовой пример применения этой формулы. Пусть в вышеприведённом примере информация об x 1 не поступила, и для её оце- нивания была использована модель второго уровня, которая дала следую- щие результаты: p(x 1 =1)=0,3, p(x 1 =2)=0,7. Тогда в соответствии с форму- лой (7) нам следует определить величину p(x 0 =1|(x 2 =1 U x 1 =1))·0,3+ p(x 0 =1|(x 2 =1 U x 1 =2))·0,7 Второе слагаемое, как следует из расчётов величины p(x 0 =1|(x 2 =1 U x 1 =2)), проведённых выше, составляет 0,0871·0,7. Для пер- вого слагаемого нужно заново вычислить p(x 0 =1|(x 2 =1 U x 1 =1)) по форму- ле Байеса, пользуясь уже определённым ранее значением p(x 0 =1|x 2 =1). 41 Получим 0,2763. Окончательно имеем 0,0871·0,7+0,2763·0,3, то есть 0,1439. Аналогичным образом получим оценку вероятности для второго значения переменной x 0 , то есть величину p(x 0 =2|(x 2 =1 U x 1 =1))·0,3+ p(x 0 =2|(x 2 =1 U x 1 =2))·0,7. Она составит 0,8561. Сумма вероятностей всех возможных значений пе- ременной (в данном случае двух) равна единице — иное означало бы, что в расчётах допущена ошибка. Библиографический список Искусственный интеллект: Справочник: в 3 книгах / Под ред. Э.В. Попова. М., 1990. Нейлор К. Экспертные системы: принципы работы и примеры. М., 1987. Построение экспертных систем / Под ред. Ф. Хейеса-Рота. М., 1987. Численные методы / Н.С. Бахвалов, Н.П. Жидков, Г.М. Кобельков. 4-е изд. М.: БИНОМ. Лаборатория знаний, 2006. Практическая часть Аудиторные занятия: 4 часа. Самостоятельная работа: 4 часа или 8 часов (см. ниже). Цель работы Приобрести практические навыки применения алгоритмов вычисле- ния вероятностей значений выходной переменной системы, описанной средствами формализма условных вероятностей. Закрепить теоретические знания по темам «метод моделирования», «свобода систем». Приборы и материалы Отчёты о выполнении предыдущих лабораторных работ; ПЭВМ, табличные процессоры, трансляторы алгоритмических языков. 42 Задание 1. Разработать программное средство для определения вероятностей значений выходной переменной модели. 2. Определить вероятности значений выходной переменной и мате- матическое ожидание её величины для десяти различных комбинаций зна- чений входных переменных. 3. Дать оценку энтропии, снимаемой с выходной переменной посту- пающей информацией. Методические указания по выполнению задания Комбинации значений входных переменных формируются студента- ми самостоятельно. При этом должны выполняться следующие требова- ния: ¨ среди комбинаций должны быть такие, по которым отсутствуют данные по входной переменной первого уровня и по всем соответствую- щим ей входным переменным второго уровня; ¨ не менее чем в половине вариантов должны использоваться дан- ные о значениях переменных второго уровня; ¨ не менее чем в двух вариантах должны использоваться данные всех переменных второго уровня; ¨ варианты, в которых данные о значениях переменных второго уровня не используются, должны быть обязательно; ¨ для каждой входной переменной первого уровня должен найтись вариант, в котором она принимает любое из возможных для неё дискрет- ных значений. По результатам расчётов определяются: ¨ распределение вероятностей выходной переменной первого уров- ня; ¨ её математическое ожидание (для числовых переменных); ¨ её энтропия после получения информации о значениях входных переменных и размер снятой энтропии. Математическое ожидание определяется: ¨ для переменных, приведённых к дискретному виду, — по фор- муле 1 1 ( ) , i i x Q i i x p f x dx - = æ ö ç ÷ ç ÷ è ø å ò 43 где Q — число квантилей, p i — оценка вероятности i-го дискретного зна- чения переменной с учётом поступившей информации о входных перемен- ных; f(x) — функция плотности распределения вероятностей данной пере- менной, x i –1 и x i — нижняя и верхняя границы квартили i; ¨ для остальных дискретных переменных — как сумма произведе- ний их возможных значений на соответствующие оценки вероятностей, полученные с учётом поступившей информации о входных переменных. Доказательство корректности расчётов, выполненных программой, производится посредством аннотированных расчётов по одному из вариан- тов, в котором используется наименьшее количество входных переменных второго уровня (рекомендуемое количество — одна), выполненных в элек- тронных таблицах или вручную. Если рабочей программой курса на выполение практического зада- ния по данной теме выделено 2 часа, преподаватель не проверяет качество программных компонентов, разработанных для решения задачи, а только корректность расчётов. Если рабочей программой курса на выполение практического зада- ния по данной теме выделено 8 часов, к программному средству для вы- полнения расчётов согласно заданию к данной теме предъявляются сле- дующие требования: ¨ оно должно принимать значение входных переменных как в дис- кретной форме (номер квантили), так и в непрерывной, с присущей данной переменной единицей измерения, за исключением тех переменных, кото- рые являются дискретными по своей природе, если таковые имеются в мо- дели; ¨ отсутствие данных о значении каких-либо переменных не должно препятствовать выполнению вычислений и их корректности; ¨ интерфейс пользователя должен предотвращать ввод данных по входным переменным второго уровня, если введено значение соответст- вующей переменной первого уровня; ¨ если значение входной переменной первого уровня неизвестно, но известны соответствующие значения переменных второго уровня (хотя бы одной), программой должны отображаться вероятности каждого дис- кретного значения входной переменной первого уровня, оценённые при помощи формулы Байеса; ¨ исполнение программы не должно сопровождаться ошибками, приводящими к её аварийному завершению или зависанию. 44 Требования к отчёту Отчёты о выполнении практического задания составляются индиви- дуально. Объём каждого отчёта не должен превышать 3 страниц (не счи- тая приложений). В каждом отчёте должны присутствовать: ¨ значения входных переменных, для которых определяются веро- ятности значений выходной переменной; ¨ вероятности значений выходной переменной и её математическое ожидание, определённые составителем; ¨ доказательства корректности вычислений; ¨ результаты оценки энтропии, снимаемой с выходной переменной поступившей информацией; ¨ наименования инструментальных средств, использованных для выполнения расчётов; ¨ исходные тексты тех фрагментов программ для выполнения рас- чётов согласно заданию, которые разработаны составителем отчёта; ¨ список использованной литературы. Если на выполнение самостоятельной работы выделяется 8 часов самостоятельной работы, неотъемлемой частью отчёта является исполняе- мый файл или дистрибутив, предоставленный преподавателю на съёмном носителе данных (возвращаемом студенту) либо посредством электронных коммуникаций. 45 ПРИЛОЖЕНИЯ 1. Основные статистические распределения Нормальное распределение Нормальное распределение (рис. 2) является теоретической моде- лью случайной величины, представляющей собой сумму константы с бес- конечно большим количеством независимых случайных величин (помех), распределённых по произвольным законам на интервале (–¥; ¥). Данная константа равна математическому ожиданию нормально распределённой случайной величины. Функция плотности вероятности нормального распределения: 2 2 ( ) 2 1 ( ) , 2 x p x e m s s p - - = где x — значение случайной величины, m — её математическое ожидание, s — среднее квадратическое отклонение, e » 2,7182818 — основание на- турального логарифма. Функция нормального распределения не выражается через элемен- тарные функции и вычисляется с использованием численных методов ин- тегрирования (например, метода трапеций). Математическая запись: 2 2 ( ) 2 1 ( ) 2 t x F x e dt m s s p - - -¥ = ò В Excel плотность распределения вероятности нормального распре- деления для значения, хранящегося в ячейке Значение, вычисляется с помощью формулы =НОРМРАСП(Значение;Средняя;Корень(Дисперсия);0), где Средняя и Дисперсия — имена ячеек, содержащих соответствующие значения. Значение функции нормального распределения (вероятности то- го, что нормально распределённое случайное значение не превысит ука- занную величину) вычисляется с помощью формулы =НОРМРАСП(Значение;Средняя;Корень(Дисперсия);1). 46 Определить величину, которую с заданной вероятностью не превысит нор- мально распределённое случайное значение, можно с помощью формулы =НОРМОБР(Вероятность;Средняя;Корень(Дисперсия)), где Вероятность — имя ячейки, содержащей требуемое значение веро- ятности. Источник: http://ru.wikipedia.org Рис. 2. Графики нормального распределения. В программе MathCad те же вычисления могут быть выполнены с помощью формул dnorm(Значение;Средняя; Дисперсия), , pnorm(Значение;Средняя; Дисперсия) , qnorm(Вероятность;Средняя; Дисперсия) где Значение, Средняя, Дисперсия и Вероятность — имена соответ- ствующих переменных. 47 Равномерное распределение Равномерное распределение (рис. 3) не характерно для случайных величин, описывающих экономические, социальные и природные процес- сы 1 . Однако оно может оказаться подходящим приближением к реальному (неизвестному) распределению при следующих условиях: ¨ диапазон вариации случайной величины x заключён между зна- чениями a и b, каждое из которых имеет интерпретацию в терминах ис- следуемого процесса (подобно тому, как температура воды при атмосфер- ном давлении может быть распределена между 0 и 100°C); ¨ среднее и модальное значения отличаются от медианы (a+b)/2 несущественно; ¨ дисперсия исследуемой случайной величины отличается от вели- чины (b–a) 2 /12 несущественно; ¨ на гистограмме эмпирического распределения отсутствуют выра- женные вершины. Источник: http://ru.wikipedia.org Рис. 3. График равномерного распределения. Обычно равномерное распределение оказывается приемлемой моде- лью только при малом числе наблюдений случайной величины. Принятие гипотезы о равномерном распределении, как правило, означает недоста- 1 За исключением тех редких случаев, когда оно оказывается частным случаем бета-распределения. 48 точную степень изученности моделируемой случайной величины, но может оказаться лучшей гипотезой из всех, которые не могут быть отвергнуты на имеющихся опытных данных. Функция плотности вероятности равномерного распределения: 1 ( ) , [ ; ], p x x a b b a = Î - где x — значение случайной величины, a и b — границы множества её значений. Функция равномерного распределения: ( ) , [ ; ]. x a F x x a b b a - = Î - Математическое ожидание равномерно распределённой случайной величины равно (a+b)/2; дисперсия — (b–a) 2 /12. |