Практикум по теории систем и системному анализу для студентов бакалавриата по направлениям Прикладная информатика в экономике
Скачать 0.65 Mb.
|
ТЕМА 1. СПЕЦИФИКАЦИЯ ПЕРВОГО УРОВНЯ АГРАРНОЙ ПРОИЗВОДСТВЕННОЙ СИСТЕМЫ Теоретическая часть Приступая к исследованию системы, структура которой неизвестна, прежде всего определяют множество переменных (как количественных, так и нечисловых), которыми можно описать её состояние и поведение. Выделив в их числе выходную переменную — ту, зависимость которой от других переменных необходимо определить для решения тех или иных за- дач управления, — и задавшись целью представить данную зависимость в форме таблиц условных вероятностей, полезно предварительно определить набор переменных, связь которых с выходной переменной наиболее суще- ственна. Теоретически для этой цели можно использовать все доступные для наблюдения переменные. Однако на практике такое решение приводит к неприемлемо высоким затратам труда на представление системы в требуе- мой форме. Поэтому обычно из всего множества доступных для наблюде- ния переменных отбирают те, которые, по мнению экспертов, накопивших большой опыт наблюдения исследуемой системы, сильнее других влияют на выходную переменную. В дальнейшем мнение экспертов подвергают проверке с помощью формализованных методов, которые будут рассмотре- ны в теме 3. В практических приложениях число отобранных таким образом пе- ременных имеет порядок сотен или тысяч. При этом в процессе оценива- ния выходной переменной участвуют лишь немногие из них, отбираемые на основе формализованных критериев (статистических оценок тесноты связи, показателей относительной информативности и т.д.). Мнения одного эксперта относительно степени влияния переменных (факторов) на выходную переменную обычно бывает недостаточно. Если система сложна, каждый эксперт, как правило, располагает достаточными сведениями о зависимости выходной переменной лишь от части факторов, с которыми она связана в действительности. Чтобы повысить вероятность адекватного представления исследуемой системы, включающего наиболее существенные факторы, к оценке их значимости привлекают группы экс- пертов. При этом необходимо заботиться о том, чтобы мнение каждого 15 эксперта оставалось, по возможности, не зависимым от мнений его коллег. В противном случае внимание экспертов, как показывает практика, сосре- доточивается на сравнительно узком круге факторов, и многие существен- ные переменные ускользают от их внимания. Для организации коллективных экспертиз предложен ряд специаль- ных методик, содействующих преодолению данной проблемы: метод мозго- вого штурма, метод Дельфи, метод провокаций, метод решающих матриц и др. В нашем случае целесообразно использовать форму организации кол- лективной экспертизы, в которой выделяются три этапа: ¨ идентификация факторов; ¨ согласование мнений экспертов о факторах; ¨ ранжирование факторов. На этапах выявления и ранжирования факторов каждый эксперт работает самостоятельно, чем достигается его независимость от мнения других экспертов. Процедура согласования обладает характерными черта- ми метода комиссий: она представляет собой открытое обсуждение с це- лью уточнения смыслового содержания отобранных факторов и характера их влияния на выходную переменную. Последнее необходимо для того, чтобы эксперты, не знакомые со смысловым содержанием отдельных фак- торов, могли на третьем этапе экспертизы дать оценку их ранга в сравне- нии с другими факторами. Для проведения первого этапа каждый эксперт получает задание в течение установленного времени (обычно 15-20 минут) указать (как пра- вило, в письменном виде) как можно больше известных ему факторов, влияющих на заданную целевую переменную. На этом этапе взаимодейст- вие между экспертами должно быть полностью исключено. Факторы могут иметь числовое или нечисловое выражение, но должны характеризоваться единственным значением — в частности, не могут выражаться векторами 1 Эксперту вменяется в обязанность формулировать факторы таким образом, чтобы из формулировки однозначно вытекала процедура их измерения или оценивания. Тем самым, в частности, подразумевается следующее: ¨ каждому фактору, допускающему количественное выражение, должна сопоставляться единица измерения, а также процедура его изме- рения, если она не очевидна 2 ; 1 Фактор, требующий представления в векторной форме, должен рассматри- ваться как набор факторов, соответствующих каждому компоненту вектора. 2 Как правило, процедура измерения приводится в форме ссылки на источник, в котором она описана. 16 ¨ если фактор отражается нечисловой переменной, эксперт должен однозначно указать множество его значений и процедуру определения конкретного значения данного фактора. На данном этапе эксперт не должен принимать во внимание дос- тупность фактора для наблюдения и измерения, сопряжённые с этим про- цессом затраты и другие возможные препятствия его использованию. Его задача состоит лишь в том, чтобы перечислить возможно больше факто- ров, информация о которых (если доступна) снимает неопределённость выходной переменной. Цель второго этапа — формирование объединённого списка факто- ров. На этом этапе должны быть исключены повторяющиеся (возможно, под разными наименованиями) факторы, встречающиеся в индивидуальных списках, и достигнуто единообразное понимание смысла каждого фактора, названного каждым экспертом. Работа осуществляется по процедуре, схожей с методом комиссий в том отношении, что решения принимаются по результатам открытого об- суждения (как правило, консенсусом). Отличие состоит в отсутствии за- ранее определённого списка дискутируемых положений: его функцию вы- полняет объединённый список факторов, названных каждым из экспертов. Комиссия (состоящая из тех же экспертов, которые работали на первом этапе) обладает правами: ¨ исключить фактор, названный каким-либо экспертом, только в том случае, если он в точности повторяет по смыслу и по процедуре изме- рения фактор, названный другим экспертом и уже включённый в объеди- нённый список; ¨ уточнять наименование факторов, а также единицы их измерения либо множество их значений. Продолжительность второго этапа, как правило, не регламентирует- ся. Неповторяющиеся факторы включаются в объединённый список да- же в том случае, если эксперт, предложивший данный фактор, на втором этапе экспертизы отказывается от своего мнения, выраженного на первом этапе. Во избежание непродуктивных дискуссий не разрешается также включение в объединённый список факторов, не названных на первом эта- пе, но выявленных в процессе работы комиссии. При необходимости по результатам второго этапа координатор экс- пертизы может вынести решение о повторении её первого этапа с целью пополнения полученного объединённого списка факторов. Такое решение 17 принимается в случае, если комиссия в процессе уточнения смысла уже названных факторов выявила отсутствие в результатах работы экспертов целых классов факторов, отражающих существенные аспекты формирова- ния значения целевой переменной. Вновь предложенные факторы попол- няют ранее полученный объединённый список. На третьем этапе эксперты получают задание ранжировать объеди- нённый список факторов, выработанный комиссией, по предполагаемой степени информативности для оценивания значения целевой перемен- ной. Время, выделяемое на ранжирование, как правило, не регламентиру- ется. От эксперта не требуется указание мотивов, по которым он присвоил показателю тот или иной ранг. Технически этот этап поддерживается программным обеспечением, позволяющим эксперту визуально располагать факторы в определённой последовательности. Лучше других зарекомендовала себя следующая процедура ранжи- рования. Вначале каждому фактору присваивается балльная оценка по пя- тибалльной шкале, отражающая мнение эксперта о его информативности для получения оценки выходной переменной, и производится ранжирова- ние по баллам. Далее процедура повторяется для всех показателей, полу- чивших одинаковый балл на предыдущем этапе, но высшую оценку (пять баллов) получает наиболее информативный, а низшую (один балл) — наименее информативный фактор из числа получивших одинаковый балл на предыдущем этапе. Новая балльная оценка приписывается к предыду- щей в качестве разряда десятичной дроби. Например, если некоторый фактор в группе факторов, оценённых в 4 балла, получил оценку, равную 2 баллам, то ему приписывается оценка 4,2. Когда все показатели получили двузначную балльную оценку, ранжи- рование всего списка повторяется. Факторы, снова получившие одинаковый балл, могут быть вновь подвергнуты оценке по тому же принципу, что и выше, и таким образом приобретают трёхзначную оценку (например, 4,25); но если численность факторов, имеющих одинаковый балл, не более 4 или 5, то они могут быть упорядочены между собой непосредственно, без помощи присвоения бал- лов. Характерная ошибка, допускаемая экспертами на этом этапе, — размещение целой группы факторов в ранжированном ряду как неделимого целого. Эксперты должны вполне уяснить, что ранг каждого фактора опре- деляется безотносительно к смысловым связям данного фактора с другими 18 факторами. Он должен отражать только способность фактора информиро- вать о вероятном значении целевой переменной. Завершается процедура суммированием индивидуальных оценок рангов каждого фактора, полученных каждым экспертом, и повторным ранжированием списка факторов в порядке возрастания полученной сум- мы. Факторы, сумма номеров рангов которых оказалась одинаковой, упо- рядочиваются решением комиссии экспертов. По завершении экспертизы в формализованное описание исследуе- мой системы включается заранее оговорённое число факторов, получив- ших наибольший ранг. Это число зависит, с одной стороны, от уровня приемлемых затрат труда и денежных средств на представление исследуе- мой системы, с другой — от требуемой точности предсказания значения выходной переменной. При этом допускается: ¨ заменять факторы, не доступные для наблюдения, их аппрокси- маторами, если выполняются два условия: аппроксиматор поддаётся на- блюдению и не встречается в ранжированном списке факторов; ¨ пропускать факторы, которые в принципе не поддаются наблюде- нию в сроки, обусловленные целью исследования системы, с помощью средств, имеющихся в распоряжении исследователей. Библиографический список Гаврилова Т.А., Червинская К.Р. Извлечение и структурирование знаний для экспертных систем. М.: Радио и связь, 1982. Глушков В.М. О прогнозировании на основе экспертных оценок // Кибернетика, 1969. — №2. Литвак Б.Г. Экспертные технологии в управлении. М.: Дело, 2004. Нейлор К. Как построить свою экспертную систему. М.: Энерго- атомиздат, 1991. Практическая часть Аудиторные занятия: 2 часа. Цель работы Овладеть приёмами спецификации входных и выходных переменных исследуемой подсистемы. Закрепить теоретические знания по вопросам «предмет теории сис- тем» и «методы организации сложных экспертиз». 19 Приборы и материалы Компьютерный класс с доступом к сети Internet; программное обес- печение, автоматизирующее рутинные операции по ранжированию факто- ров 1 ; информационный сайт Продовольственной и сельскохозяйственной организации ООН (FAO): http: // faostat.fao.org / DesktopDefault.aspx?PageID=567&lang=ru Задание Выполнить предварительную спецификацию входных переменных подсистемы первого уровня производственной системы, исследуемой в со- ответствии с индивидуальными вариантами задания, приведёнными на с.13 практикума. Для этого: ¨ составить ранжированный список факторов, влияющих на целе- вой показатель, соответствующий индивидуальному варианту задания; ¨ выбрать факторы для включения в модель исследуемой системы с учётом их положения в ранжированном списке, требования их взаимной независимости, имеющейся информационной базы. Оформить отчёт. Методические указания по выполнению задания Задание выполняется коллективно рабочей группой численностью 4…6 чел., сформированной преподавателем. Ранжированный список факторов составляется в соответствии с ме- тодиками, изложенными в теоретической части данной темы. Учитывая учебный характер задачи, предлагается отобрать 4 (реко- мендуется) или 5 входных переменных подсистемы первого уровня. Каждый член рабочей группы индивидуально составляет список пе- ременных, оказывающих, с его точки зрения, непосредственное влияние на выходную переменную. Рабочая группа совместно производит объединение индивидуальных списков, устранение повторов, достигает соглашения о точных наименова- ниях переменных, исключает переменные, не связанные непосредственно с выходной. 1 Всеми необходимыми возможностями для этого обладают табличные процес- соры. 20 Отмечаются переменные, информация по которым не содержится в материалах производственной практики и не может быть предоставлена преподавателем. Оставшиеся переменные тем или иным способом ранжируются по степени их влияния на выходную. Из наиболее существенных формирует- ся список переменных для включения в модель. Среди них не должно быть заведомо зависящих друг от друга переменных. Чтобы исключить возможную неоднозначность толкования перемен- ных, каждая переменная должна иметь название, исчерпывающим образом характеризующее её смысл. Для каждой переменной должна быть указана единица её измерения или (если переменная нечисловая) возможные зна- чения. Рекомендуется указывать источник, из которого можно получить значение переменной (коды документа, строки и столбца). Требования к отчёту Отчёт о выполнении практического задания состоит из коллектив- ной и индивидуальных частей. Объём коллективной части не должен пре- вышать 3 страниц 1 , каждой индивидуальной — 1 страницы. При необходи- мости отчёт может быть дополнен приложениями. В индивидуальной части должны быть представлены: ¨ краткая характеристика личного вклада студента в работу груп- пы; ¨ список предложенных составителем переменных, из которых производился отбор входных переменных; ¨ список использованной литературы. В коллективной части должны быть представлены: ¨ ранжированный список переменных, составленный рабочей груп- пой; ¨ список выбранных входных переменных; ¨ краткие аргументы в пользу выбранных входных переменных; ¨ краткое описание использованных подходов к спецификации под- системы первого уровня, отличающихся от рекомендуемых в методических указаниях (с указанием источника). 1 Предполагается, что одна страница содержит не более 40 строк по 66 символов. 21 ТЕМА 2. ПРИВЕДЕНИЕ ЧИСЛОВЫХ ПЕРЕМЕННЫХ К ДИСКРЕТНОЙ ФОРМЕ Теоретическая часть Для приведения числовых переменных системы к дискретной форме проводится их статистический анализ, преследующий цели: ¨ снизить энтропию модели до уровня, обусловленного целями ис- следования; ¨ повысить достоверность определения вероятности каждого со- стояния модели. Один из приёмов приведения числовых переменных к дискретной форме состоит в разбиении интервала вариации переменной на кванти- ли — интервалы, обладающие тем свойством, что вероятности попадания значения переменной в каждый из них равны. На практике часто выделя- ют квартили приближённо, пользуясь непосредственно эмпирическими данными. Однако во многих (хотя не во всех) случаях использование тео- ретического знания о законе распределения исследуемой переменной в до- полнение к имеющимся опытным данным (часто ограниченным и не всегда достоверным) позволяет несколько повысить точность разбиения, а значит, и достоверность результатов системного анализа. В этом случае следует: ¨ определить число наблюдений исследуемой переменной (N). ¨ разбить интервал вариации переменной на N аналитических ин- тервалов, определить число наблюдений в каждом аналитическом интерва- ле, выдвинуть гипотезу о характере статистического распределения вариа- ции переменной и проверить её (см. Приложение 2); ¨ определить число квантилей, учитывая требования снижения эн- тропии модели и обеспечения достаточной точности её результатов; ¨ выделить квантили. Для выделения квантилей используется алгоритм, приведённый ни- же. ¨ Определить вероятность p = 1 / Q того, что значение перемен- ной принадлежит требуемой квантили (Q — число квантилей). ¨ Определить верхнюю границу x 1 первой квантили из уравнения 1 ( ) , x a f x dx p = ò (1) 22 где f(x) — функция плотности распределения вероятностей значений переменной, a — нижняя граница области определения f (x), x 1 — верхняя граница первой квантили. Если известны значения функции распределе- ния вероятностей F(x), то следует решить относительно x 1 уравнение F(x 1 ) – F(a) = p. ¨ Определить верхнюю границу следующей квантили из уравнения õ ó x a x b f (x) dx = p, (2) где x a — верхняя граница предыдущей, x b — искомая верхняя граница данной квантили. Если определены границы N–1-й квантили, перейти следующему шагу; иначе повторить предыдущий. ¨ Убедиться, что имеет место равенство õ ó x a β f (x) dx = p (3) (β — верхняя граница области определения f (x)). Расхождение, обуслов- ленное ограниченной точностью численных методов, не должно быть слишком большим. После разбивки интервала вариации на квантили каждое значение переменной заменяется номером квантили, которой оно соовтетствует. В результате получаем отображение непрерывного множества значений переменной на конечное дискретное множество значений. Это впоследст- вии обеспечит требуемую уровень грубости (робастности) модели анали- зируемой системы, обеспечивающую её работоспособность при ограничен- ной эмпирической базе для её разработки. Библиографический список Бронштейн И.Н., Семендяев К.А. Справочник по математике для инженеров и учащихся ВТУЗов. М, 1980. 23 Гатаулин А.М. Система прикладных статистико-математических методов обработки экспериментальных данных в сельском хозяйстве. М., 1992. Искусственный интеллект: Справочник: в 3 книгах / Под ред. Э.В. Попова. М., 1990. Орлов А.И. Прикладная статистика: Учебник. М.: «Экзамен», 2004. Численные методы / Н.С. Бахвалов, Н.П. Жидков, Г.М. Кобельков. 4-е изд. М.: БИНОМ. Лаборатория знаний, 2006. Практическая часть Аудиторные занятия: 4 часа. Самостоятельная работа: 2 часа. Цель работы Освоить приёмы приведения числовых переменных к дискретной форме. Закрепить теоретические знания по вопросу «виды шкал». Приборы и материалы Компьютерный класс с доступом к сети Internet; программное обес- печение, реализующее аналитическую группировку, проверку статистиче- ских гипотез о характере распределения случайной величины и численные методы решения интегральных уравнений (рекомендуется MathCad; в его отстутствие задача может быть решена средствами Excel и VBA); инфор- мационный сайт Продовольственной и сельскохозяйственной организации ООН (FAO): http: // faostat.fao.org / DesktopDefault.aspx?PageID=567&lang=ru Задание Привести числовые переменные системы, специфицированной при выполнении предыдущего задания, к дискретной форме. Для этого: ¨ обоснованно выдвинуть и проверить гипотезу о характере стати- стического распределения факторных переменных; ¨ выделить квартили интервалов вариации факторных переменных. 24 Методические указания по выполнению задания Чтобы избежать неоправданно большого объёма вычислений, в учебной задаче достаточно выделить четыре квантили для каждой число- вой переменной, а нечисловые переменные не должны иметь более пя- ти вариантов. Если переменная принимает только неотрицательные значения, её распределение не может быть нормальным 1 . Многие из неотрицательных экономических переменных имеют распределения, близкие к гамма- распределению или логнормальному распределению. Переменные, озна- чающие численность редких событий (неисправностей сельхозтехники, за- болеваний скота, отказов контрагентов от выполнения обязательств), рас- пределены согласно закону Пуассона. Если эмпирическое распределение многовершинное, совокупность наблюдений (при их достаточной численности) часто удаётся разделить на качественно различающиеся совокупности, в каждой из которых эмпири- ческое распределение одновершинное. Если наблюдений мало (до 20), в подобных случаях практически оправданно выдвигать гипотезу о равно- мерном распределении. Требования к отчёту Отчёты о выполнении практического задания составляются индиви- дуально. Объём каждого отчёта не должен превышать 6 страниц (не счи- тая приложений). В каждом отчёте должны присутствовать: ¨ характеристики распределения вероятности для каждой числовой переменной, исследованной составителем отчёта; ¨ расчёт и результаты проверки гипотезы о соответствии эмпири- ческого распределения выбранному теоретическому распределению; ¨ краткое описание подходов к статистическому анализу, не опи- санных в методических указаниях, но использованных при выполнении практического задания (со ссылками на источники); ¨ границы квантилей числовых переменных; ¨ список использованной литературы. 1 В ряде случаев для таких переменных гипотеза о нормальном распределении может быть приемлемой, если вероятность отрицательных значений согласно теорети- ческому распределению исчезающе мала. |