Применение стандартной SIR-модели. Применение стандартной SIR - статья на ИТИс-2017_3. Абитуриентов с целью оптимизации плана рекламы и прогнозирования результатов приемной компании
Скачать 200.98 Kb.
|
О.Ю. Шилова, А.В. Мельников ПРИМЕНЕНИЕ СТАНДАРТНОЙ SIR-МОДЕЛИ ЭПИДЕМИИ И ЕЕ МОДИФИКАЦИЙ ДЛЯ ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ ПОВЕДЕНИЯ ПОТЕНЦИАЛЬНЫХ АБИТУРИЕНТОВ С ЦЕЛЬЮ ОПТИМИЗАЦИИ ПЛАНА РЕКЛАМЫ И ПРОГНОЗИРОВАНИЯ РЕЗУЛЬТАТОВ ПРИЕМНОЙ КОМПАНИИ В данной статье представлен краткий обзор современного состояния математического моделирования распространения эпидемий и информации, описана классическая модель распространения инфекционного заболевания (SIR) и ее модификации; приведены примеры использования модели распространения инфекционного заболевания (SIR) и ее модификаций. А также, в данной работе разработана концептуальная модель для прогнозирования поведения потенциальных абитуриентов для оптимизации затрат на рекламу на основе изменения характеристик (маркетинговых решений) системы с применением математического аппарата и имитационного моделирования при приеме абитуриентов в институт. Введение Моделирование является общепризнанным средством познания действительности и универсальным методом получения и использования знаний об окружающем мире. Моделирование всегда используется человеком в целенаправленной деятельности. При использовании этого метода решения, исследуемая система заменяется более простым объектом, который описывают реальную систему. Особым видом математических моделей являются имитационные модели. Имитационная модель — это компьютерная программа, которая описывает структуру и воспроизводит поведение реальной системы во времени. Имитационная модель позволяет получать подробную статистику о различных аспектах функционирования системы в зависимости от входных данных [1]. Одной из популярных проблем имитационного моделирования в настоящее время является моделирование поведения людей. Можно ли предсказать поведение потребителей? Каким образом потребители делают свой выбор, и что именно играет решающую роль – низкая цена, удобство расположения или вежливость и приветливая улыбка продавца, который общается с клиентами? Как оценить реакцию потребителей на изменения в маркетинговой стратегии или запуск нового продукта? Примерно десять – пятнадцать лет назад решение подобных вопросов казалось невозможным, однако сегодня построение подобных прогностических моделей рынка стало реальностью благодаря поведенческой экономике и агентному моделированию [2]. В основе агентного моделирования лежит попытка понять логику принятия решения отдельно взятым индивидумом, формализовать ее и объединить в единую модель поведения. На языке моделирования автономно принимающий решение субъект и называется агентом: агентом может быть как индивидуальный потребитель, так и целые социальные группы или организации. Модель распространения инфекционного заболевания (SIR) и ее модификации При исследовании поведения потребителей важной составляющей является проблема распространения информации среди этих потребителей. Классической моделью, связанной с распространением информации, считается модель распространения инфекционного заболевания (SIR). В 1927 году, W. O. Kermack and A. G. McKendrick создали модель эпидемической ситуации, которая в настоящее время считается классической SIR-моделью. В данной модели у каждого человека есть три состояния: Susceptible (S) - восприимчивый к заболеванию, Infectious (I) - зараженный и Recovered (R) - выздоровевший и обладающий иммунитетом. Люди общаются друг с другом с определенной интенсивностью. Если зараженный человек контактирует с восприимчивым к заболеванию, то последний заражается с заданной вероятностью. По прошествии определенного времени после заражения человек выздоравливает и вырабатывает иммунитет к заболеванию. На основе базовой SIR модели возможно создание уточнѐнных моделей, учитывающих эпидемиологические особенности различных инфекций. [3]. На рисунке 1 представлены простые примеры моделей, которые ориентируются на базовую модель SIR, где: E — группа пассивно инфицированных, не распространяющих инфекцию (Exposed) C —инфицированные, болезнь которых перешла в пассивную/хроническую фазу (Carrier). Рис.1 . Примеры простых моделей SEIR-модель (Рисунок 1а) создана для заболеваний, патогенез которых включает фазу пассивного инфицирования, когда индивид является носителем, но не является распространителем инфекции. SIS-модель (Рисунок 1б) подходит для эпидемий заболеваний, не формирующих у выздоровевших устойчивого иммунитета (например: инфекции, активность которых связана с общим охлаждением организма). На рисунке 1в изображена модель заболеваний, которые могут принять пассивный характер течения, при котором индивид не является распространителем инфекции, но может вернуться в группу распространителей [4]. Скорости переходов из одного класса в другой математически выражается в виде производных, поэтому модель формулируется с помощью дифференциальных уравнений. При создании таких моделей, следует предположить, что численность населения в купе дифференцируема по времени и что эпидемический процесс является детерминированным. В работе [5,6] проведен сравнительный анализ нескольких моделей, которые описывают три группы населения: 1) Восприимчивые к заболеванию (Susceptible); 2) Зараженные, инфицированные, восприимчивые (Infectious); 3) Выздоровевшие, получившие долговременный иммунитет (Recovered). На рисунке 2 изображена SIR-модель эпидемического заболевания (на примере гриппа) [7]. В данной модели используются следующие обозначения: S - число индивидов восприимчивых к инфекции , I - число распространителей инфекции, R - число выздоровевших, - частота появления новых восприимчивых в популяции, - частота инфицирования, - частота выздоровления, - частота естественной смерти, i - частота смерти от болезни, N – общая численность населения. Рис.2. Классическая модель SIR Модель (рисунок 2) задается системой дифференциальных уравнений модели эпидемии (при Δt = 1): (1) Примеры использования модели распространения инфекционного заболевания (SIR) и ее модификаций Стандартная модель распространения инфекционного заболевания (SIR) была первой моделью, которая занялась исследованием проблемы распространения заболевания. Несмотря на то, что в модели распространения инфекционного заболевания (SIR) не рассматривается в явном виде распространение информации, многие авторы в своих работах опираются именно на нее, например: В статье [8] рассматривается модель распространения информации и информационного противоборства в социуме. За основу данной модели взята стандартная модель SIR: в обществе выделены две группы людей, одна из которых получает информацию от СМИ, а другая через слухи; индивид принимает информацию лишь тогда, когда определенное количество других членов группы уже прияли ее. Однако в данной модели есть и отличия от стандартной модели SIR: усвоение информации лишь после двукратного ее получения; забывание информации. Данные отличия обусловлены тем, что авторы анализируют распространение информации, а не болезни, исходя из чего, возникает необходимость учитывать восприятие информации индивидуумами и возможность забывать информацию. В работе [9] описана компьютерная модель распространения информации в сетевых системах с различной структурой. В данной работе применяется традиционная, классическая модель SIR в явном виде, зависящая от стадии информированности (зараженности): изначально агент восприимчив к информации; затем при условии контакта с информированным элементом (инфицированным), он сам заражается с какой-то вероятностью; через какое-то время элемент теряет восприимчивость к информации (выздоравливает), через какое-то время элемент снова может начать воспринимать информацию (заболевать). В исследовании [10] модифицируется SEIR-модель на основе характеристик социальных сетей, исходя из анализа значения информации и поведения пользователей при распространении информации. Данную измененную модель авторы назвали S-SEIR. В данной модели учитываются актуальность значения информации, скорость информационного аудита, а также исследуется влияние пользовательского поведения исходя из количества пользователей разных стран. Результаты моделирования показывают, что: S-SEIR модель может моделировать информационный процесс распространения информации в социальной сети. В статье [11] рассматривается практический пример разработки имитационной модели для российского Интернет – портала по продаже авиабилетов и бронирования гостиниц. В модели, представленной в статье, проводится анализ динамики выручки компании в зависимости от механизмов распространения информации об Интернет – портале среди потенциальных клиентов. Моделируется поведение пятисот тысяч агентов. Авторы предложили делить клиентов на 3 категории: неосведомленные, осведомленные непользователи и пользователи в точности как и в классической модели: восприимчивые к заболеванию, зараженные, выздоровевшие. Основная задача при этом модели состояла перевести потенциальных клиентов из категории «неосведомленные» в категорию «пользователи». В статье [12] описывается работа по сбору информации со страниц пользователей, индексация и поиск по полученным данным, а также анализ социальной сети. В статье расписываются такие задачи исследования особенностей распространения информации в социальных сетях как: автоматический сбор информации из Сети; анализ собранной информации с учетом изменения по времени; идентификация источников данных, представляющих информацию по определенной теме; непосредственный анализ полученных на первых этапах данных с целью выявления определенных закономерностей и особенностей. Данная статья представляет собой отчет о промежуточных результатах решения указанной комплексной задачи, которые на данный момент нельзя считать законченным исследованием, а стоит рассматривать лишь как некую подготовительную работу по решению указанной сложной задачи. В статье [13] рассматриваются проблемы, связанные с передачей информации в компьютерных сетях. Автор представляет использование современных компьютерных сетей как сложную научно-техническую задачу. О современных компьютерных сетях можно говорить как об объектах, характеризующихся тем, что они распределены: есть реконфигурируемость в транспортной инфраструктуре, децентрализованность и кооперативность управления при проведении «натуральных» экспериментов. Для данного распределения, совместное использование средств для моделирования и осуществления экспериментального анализа по результатам функционирования сети, дают возможность получения объективных данных о том, каковы свойства сетевых процессов и какие возможности для их прикладного использования. В статье [14] рассмотрены аналитическая и имитационная модели распространения вредоносных программ в информационных системах. Автор в данной статье рассматривает модель Progressive SIDR (PSIDR) [15] и проводит исследование зависимости продолжительности эпидемии от времени беспрепятственного распространения вредоносных программ (ВПр). Модель PSIDR состоит из двух фаз: начальное заражение – вредоносная программа (ВПр) заражает один узел сети и затем в течение некоторого времени распространяется свободно, т.е. согласно SI-модели; фаза реакции – по прошествии некоторого времени ВПр обнаруживается и со стороны субъектов производятся немедленные действия. Все узлы, оставшиеся незаражёнными, автоматически вакцинируются, а инфицированные – обнаруживаются с определённой скоростью, избавляются от инфекции и приобретают иммунитет. В этой фазе скорость распространения остаётся прежней, однако восприимчивые принципалы вакцинируются со скоростью μ, а инфицированные субъекты обнаруживаются со скоростью μ и «лечатся» со скоростью δ (μ представляет собой не что иное, как скорость обновления антивируса). В данной модели используются следующие обозначения: S(t) – число субъектов подверженных заражению, I(t) – число разносчиков ВПр, R(t) – число восстановленных и имеющих защиту, D(t) – количество обнаруженных инфицированных субъектов Для моделирования распространения информации большинство авторов используют за основу стандартную модель распространения инфекционного заболевания (SIR), исключение являются статьи [12, 13], но в данных статьях пока только планируется эксперимент по моделированию, поэтому не исключено, что и авторы данных статей в будущем будут применять модель SIR. А также большинство примеров использования модели распространения инфекционного заболевания (SIR) связаны с моделированием работы компьютерных сетей, с защитой информации. Задача В нашем диссертационном исследовании необходимо разработать многоагентную модель для прогнозирования поведения абитуриентов для оптимизации затрат на рекламу на основе изменения характеристик (маркетинговых решений) системы с применением математического аппарата и имитационного моделирования при приеме абитуриентов в институт. К данной задаче можно применить одну из модификаций классической модели SIR - модель Progressive SIDR (PSIDR) [14, 15]. Данную модель в задаче моего исследования можно интерпретировать следующим образом: S – число абитуриентов, которые хотят поступить в наш институт, I – число людей (студенты, выпускники, абитуриенты), которые распространяют информацию о нашем институте, R – число абитуриентов, которые передумали поступать в наш институт, D – число абитуриентов, которые точно собираются поступать к нам и никуда больше. При выборе учебного заведения на абитуриента могут влиять: мнения студентов, друзей и родителей, заметки и статьи в СМИ, рекламные кампании, сайт заведения, частота и качество проведения дней открытых дверей и других мероприятий по привлечению абитуриентов, качество организации приемной комиссии, наличие военной кафедры, наличие знакомых среди числа студентов/абитуриентов, статус заведения (государственное или нет), размер стипендии. Помимо этого, при выборе факультета и направления обучения на абитуриента могут влиять: полученные баллы ЕГЭ и необходимый для поступления балл, личные интересы, тенденции к востребованности специалистов. При выборе финансовой основы обучения (бюджет/контракт) на абитуриента могут влиять: достаток семьи/студента, полученные баллы ЕГЭ и необходимый для поступления на бюджет балл, наличие бюджетных мест на интересующей специальности, конкурс на одно место, наличие льгот. При выборе формы обучения (очная/заочная) на абитуриента могут влиять: наличие работы, наличие семьи. Перечисленные выше связи в графическом виде изображены на рисунке 3. Рис. 3. Концептуальная схема Для корректного составления модели и проведения исследования могут понадобиться следующие данные об объектах, участвующих в исследовании: количество бюджетных мест; средний размер стипендии на факультете/в учебном заведении; кол-во проведенных мероприятий по привлечению клиентов; средний конкурс на одно место; частота обновления информации на сайте факультета/заведения; наличие военной кафедры; наличие государственного статуса заведения; затраты на рекламу в течение последней приемной комиссии и другие. Для получения такой информации может потребоваться проведения анкетирования участников исследования. Так, абитуриентам следует предложить указать в анкетах следующие данные: возраст; пол; наличие семьи; наличие работы; уровень образования; балл ЕГЭ или других вступительных испытаний; наличие льгот; возможность поступления на контрактной основе (да/нет). В анкетах для представителей учебных заведений и отдельных факультетов могут быть предложены следующие пункты: затраты на рекламу за последний год; количество публикаций в СМИ; наличие сайта; статус заведения (государственное или нет); наличие военной кафедры; количество проведенных мероприятий по привлечению абитуриентов; количество потенциальных абитуриентов, оставивших контактную информацию о себе; количество бюджетных мест; конкурс на одно место; установленный размер стипендии. Вывод Исходя из приведенных аналогичных примеров в п.3 «Примеры использования модели распространения инфекционного заболевания (SIR) и ее модификаций» (см. выше) можно сказать, что применение модели SIR к задаче диссертационного исследования является адекватным. Данная модель, в случае ее успешной реализации с помощью инструментов имитационного моделирования, может помочь в оптимизации расходов на продвижение учебного заведения или факультета, и предоставить показатели, при которых число абитуриентов останется на прежнем уровне (то есть сокращение средств не повлияет на уменьшение числа абитуриентов) и при которых их число можно будет увеличить. Также на основании проведенных экспериментов можно будет говорить об успешности тех или иных каналов продвижения, а также отметить те факторы, которые имеют наибольшее влияние на выбор абитуриента. Такие данные смогут помочь сотрудникам, связанным с приемом абитуриентов, оптимизировать свою работу в целях создания позитивного имиджа и привлечения большего числа потенциальных абитуриентов. Библиографический список AnyLogic [Электронный ресурс] : сайт / The AnyLogic Company. - Режим доступа: http://www.anylogic.ru/use-of-simulation, свободный (дата обращения: 22.12.2016). Катаевский, Д.Ю. Моделирование поведения потребителей [Текст] / Д.Ю. Катаевский, В.В. Солодов, К.К. Кравченко // Ежеквартальный Интернет – журнал Искусственные общества. — 2012. — Т. 7, № 1 - 4. Башабшех, М. М. Комбинированная имитационная модель пространственного распространения эпидемий на основе стохастической компартментной модели и вероятностного клеточного автомата [Текст]: дис. на соиск. учен. степ. канд. техн. наук (05.13.01) / Башабшех Мурад Махмуд Али; Тверской государственный технический университет. – Тверь, 2014. – 245 с. Watts, D., Muhamad, R., Medina, D. С. & Dodds, P. S. Multiscale, Resurgent epidemics in a hierarchical metapopulation model // Proc. Natl. Acad. Sci. USA.102 2005. С. 11157-11162 Башабшех, М.М. Исследование и прогнозирование эпидемиологических заболеваний на основе компартментальных моделей [Текст] / М.М. Башабшех, А.В. Скворцов, Б.И. Масленников // Сборник научных трудов магистрантов и аспирантов. Раздел информационные технологии в науке и образовании. – Тверь: ТвГТУ, 2013. – Выпуск 3. – С.6-9. Башабшех, М.М. Компартментные модели распространения заболеваний (эпидемии) [Текст] / М.М. Башабшех, Б.И. Масленников и др. // Система гарантий качества образования: Разработка и внедрение: материалы научно- практической конференции. – Тверь: Купол, 2012. – С.23-27 Kermack W.O. A Contribution to the Mathematical Theory of Epidemics. / A.G. McKendrick, W.O. Kermack //Proc. Roy. Soc. Lond.A 115.1927. C.700-721 Маревцева, Н.А. Моделирование распространения информации и информационного противоборства в структурированном социуме. / Н.А. Маревцева, А.П. Михайлов, А.П. Петров // Материалы международной научно-практической конференции. под общей редакцией В.Н. Буркова. – Москва: Институт проблем управления им. В.А. Трапезникова РАН, 2014. – С.209-210 Носова, М. В. Моделирование распространения информации в децентрализованных сетевых системах с нерегулярной структурой / М. В. Носова, Л. И. Сенникова // Новые информационные технологии в автоматизированных системах. 2014. №17. URL: http://cyberleninka.ru/article/n/modelirovanie-rasprostraneniya-informatsii-v-detsentralizovannyh-setevyh-sistemah-s-neregulyarnoy-strukturoy (дата обращения: 22.12.2016). RuzhiXu, Heli Li and Changming Xing, “Research on information Dissemination Model for Social Networking Services,” International Journal of Computer Science and Application, vol. 2 (1), 2013. Каталевский, Д.Ю. «Динамический бизнес-план»: новый подход к бизнес-планированию на основе агентного имитационного моделирования / Каталевский Д.Ю., Панов Р.А. URL: http://www.anylogic.ru/upload/iblock/2fe/2fe887025f65256f1f65cd07b96459a3.pdf (дата обращения: 22.12.2016). Рабчевский, Е. Некоторые аспекты задачи исследования распространения информации в социальной сети ВКонтакте / Е. Рабчевский, А. Цукерман. URL: http://seuslab.ru/articles/art01/ (дата обращения: 22.12.2016). Гребенников, А.Н. Моделирование распространения информации в компьютерных сетях / А.Н. Гребенников, А.В. Данилова // Моделирование, оптимизация и информационные технологии. 2015. №2(9). URL: https://moit.vivt.ru/wp-content/uploads/2015/06/GribennikovDanilova_2_15_1.pdf дата обращения: 22.12.2016). Груздева Л.М., Монахов Ю.М. Об одной математической модели динамики распространения вредоносных программ. // Математические методы в технике и технологиях – ММТТ-20. [Текст]: сб. трудов XX междунар. науч. конф. В 10 т. Т. 6. Секция 12 / под общ. Ред. В.С. Балакирева. – Ярославль: Изд-во Ярос. гос. техн. Ун-та, 2007. С. 65-66. Leveille, J. Epidemic Spreading in Technological Networks [Электронный ресурс]. - Режим доступа: http://www.hpl.hp.com/techreports/2002/HPL-2002-287.pdf, свободный (дата обращения: 22.12.2016). Сведения об авторе Шилова Оксана Юрьевна — аспирант, преподаватель кафедры информационных технологий и экономической информатики Челябинского государственного университета, Челябинск. oxsa91@gmail.com, mou@csu.ru Мельников Андрей Витальевич — доктор технических наук, профессор, директор Института информационных технологий Челябинского государственного университета, Челябинск. mav@csu.ru O. Yu. Shilova, A. V. Melnikov APPLICATION OF STANDARD SIR-EPIDEMIC MODEL AND ITS MODIFICATIONS TO SIMULATE POTENTIAL ENROLLEES BEHAVIOR FOR OPTIMIZATION ADVERTISING PLAN AND FORECASTING RECEIVING COMPANY RESULTS This article provides a brief overview of the current state of mathematical modeling of the spread of epidemics, and the information described in the classical model of the spread of infectious disease (SIR) and its modifications; are examples of the use of the spread of infectious disease models (SIR) and its modifications. And also, in this paper developed a conceptual model to predict the behavior potential enrollees for optimization of advertising based on the characteristics of changes of costs (Marketing Solutions) systems using the mathematical formalism and simulation modeling in the recruitment of entrants the institute. |