НОРМАТИВНОЕ РЕГУЛИРОВАНИЕ В СФЕРЕ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ. Курс лекций Москва 2021 Одобрено редакционноиздательским советом Академии управления мвд россии Рецензенты
Скачать 0.81 Mb.
|
Сравнительные характеристики технологий Характеристики Базы данных Big data Структурированность Структурирована Неструктурирована или малоструктурирована Объем Гигабайты, терабайты Петабайты, эксабайты Хранилище Централизованное Децентрализованное Взаимосвязь данных Сильная Слабая Технология БД для обработки огромных массивов структу- рированной и неструктурированной информации использует сле- дующие технологии (Machine learning, Data mining и собственно массивы необработанных данных). Machine learning – это процесс машинного обучения на основе обнаруженных связей в аналити- ческой работе. Data mining – процесс предварительной обработки и структуризации данных с целью выявления закономерностей. Технология БД для получения результата решает следующие задачи: – первичная обработка, хранение и управление огромными объемами постоянно обновляющихся данных; – структурирование разнородных данных для поиска неоче- видных или скрытых связей; – анализ и прогнозирование. Условно говоря источники данных для БД можно разделить на две большие группы: внутренние (базы данных, транзакции, архивы, данные сотовой связи, СКУД и т. п.) и внешние (информа- ция социальных сетей, блогов, СМИ, форумов, сайтов и т. п.). К основным методам, используемым технологией БД, следует отнести некоторые достаточно хорошо известные (математической статистики, кластерного анализа, Data Mining, нейронные сети и др.) и перспективные (анализа социальных сетей, машинного обу- чения, искусственного интеллекта) методы, появившиеся относи- тельно недавно. Искусственный интеллект (далее – ИИ) можно разделить на две большие группы по уровню принятия решений. К слабому ИИ можно отнести различные методы и методику, направленную на решение задач сбора, обработки и хранения информации, постро- 32 ения аналитических и прогнозных моделей, а также обеспечение коммуникаций. Вместе с тем в настоящее время решение задачи создания сильного (универсального) ИИ еще не решена. Выделим несколько ключевых проблем при внедрении техно- логии БД (ИИ) в повседневную деятельность ОВД: 1. Недостатки в обеспечении безопасности и конфиденциаль- ность данных. 2. Низкий объем накопленных данных в ОВД, не достигающий уровня применения технологий Big Data (ИИ). 3. Высокая стоимость технологий. 4. Недостатки программного обеспечения. 5. Отсутствие высококвалифицированных специалистов в обла- сти анализа данных. 33 Лекция III. Аналитическое обеспечение информационных технологий Вопрос 1. Технология анализа статистических данных Развитие любой социальной системы-организации, в т. ч. и ОВД, происходит не изолированно, само по себе, а в тесной взаимосвя- зи со сложившимися условиями окружающей среды. Следует под- черкнуть, что методы анализа данных в настоящее время активно используется в самых разных сферах человеческой деятельности, в различных отраслях с целью изучения закономерностей их разви- тия. Они также широко применяются и в управленческой деятельно- сти, позволяя принимать обоснованные решения и делать достаточно точные прогнозы, например, динамики валового внутреннего продук- та, объемов промышленного производства, динамики безработицы и т. п. Рассмотрим типовую методику информационно-аналитиче- ской работы в ОВД. Так, различные подразделения ОВД выполня- ют специфические функции и задачи. Например, информационные центры территориальных органов МВД России: – организуют обработку в территориальном органе МВД Рос- сии документов первичного учета и статистической отчетности, формируют и хранят массивы статистической информации 1 ; – обеспечивают выдачу (предоставляет доступ) штабу и струк- турным подразделениям территориального органа МВД России необходимую информацию о состоянии преступности и результа- тах деятельности ОВД 2 ; – по запросам штаба и иных структурных подразделений тер- риториального органа МВД России осуществляют необходимое информационное обеспечение проводимых аналитических иссле- дований по актуальным вопросам противодействия преступности, 1 О едином учете преступлений [Электронный ресурс]: приказ Генеральной проку- ратуры РФ, МВД России, МЧС России, Минюста России, ФСБ России, Минэкономраз- вития России, ФСКН России от 29 декабря 2005 г. № 39/1070/1021/253/780/353/399. Доступ из справ.-правовой системы «КонсультантПлюс». 2 Типовое положение об информационном центре территориального органа внутренних дел [Электронный ресурс]: приказ МВД России от 7 декабря 2012 г. № 1088 (п. 7.4, 7.5). Доступ из справ.-правовой системы «КонсультантПлюс»; О статистической отчетности органов внутренних дел Российской Федерации [Электронный ресурс]: приказ МВД России от 30 декабря 2005 г. № 1170 (п. 16). Доступ из справ.-правовой системы «КонсультантПлюс». 34 предупреждению административных правонарушений в пределах сведений, имеющихся в информационных массивах. Таким образом, указанные функции тесным образом пересе- каются с типовыми функциями информационных центров. Заме- тим, что информационно-аналитическая работа более не является специфическим видом управленческой деятельности, характерным только для штабных подразделений. Следовательно, информационно-аналитическую работу можно представить как деятельность по поиску, получению, систематиза- ции, анализу и оценке информации о состоянии оперативной обста- новки (результатах работы ОВД) с целью эффективного решения поставленных задач. В общем случае технология (алгоритм) анализа статистических данных заключается в построении на их основе математических моделей, описывающих поведение исследуемого объекта (процесса, явления), изучении этих моделей. Разработанные математические модели используются в дальнейшем как средство поддержки при- нятия управленческих решений. Более подробно весь процесс анализа данных можно разделить на следующие этапы: – постановочный (на этом этапе формируется цель исследова- ния и его основные задачи); – априорный (проводится анализ особенностей функциониро- вания изучаемого объекта, его характеристики, определяется набор данных, необходимых для исследования); – информационный (собирается необходимая статистическая информация, характеризующая отобранные переменные); – идентификации модели (на этом этапе проводится анализ качества модели статистическими методами и оценка ее параметров). Заметим, что идентификацию модели следует отличать от ее иденти- фицируемости, т. е. от оценки возможностей получения однозначно определенных параметров; – верификации модели (проверяется адекватность модели и осуществляется ее корректировка). Первые три этапа весьма важны для качественного решения задачи спецификации модели, заключающейся в представлении в математической форме выявленных характеристик объекта, свя- зей и соотношений, обосновании количества и состава объясняющих переменных, формулировки предпосылок и ограничений модели. Спецификация опирается на имеющиеся социальные теории, специ- альные знания, а также на интуитивные представления исследовате- ля об анализируемой социальной системе, процессе или явлении. 35 Реализация на практике представленных выше этапов сегод- ня не представляет значительных сложностей ввиду развития современных информационных технологий, которые максималь- но упростили их осуществление. Наиболее трудоемкая работа по математическому моделированию, вычислению статистических параметров, построению таблиц и графиков в основном выпол- няется средствами вычислительной техники, а за исследователем остается работа по постановке задачи, а также определение харак- теристик объекта, обоснование выбора соответствующей модели анализа данных, сбор эмпирической информации и интерпретация полученных результатов. В общем случае, при проведении анализа данных исследова- тель, как правило, пользуется пространственной (панельные дан- ные, Panel data) либо временной (временные ряды, Time series) формой их представления, или более сложными пространственно- временными формами (перекрестные данные, Cross section). Про- странственные данные характеризуют значения различных пока- зателей (факторов) в один и тот же момент или интервал времени, временные являются результатом серии наблюдений за значением одного и того же показателя в последовательные моменты време- ни. Пространственно-временная форма является сочетанием двух вышеперечисленных и характеризует наблюдения за набором про- странственных данных в общий момент времени. Типовая процедура анализа данных состоит из четырех этапов: 1. Первый этап постоит из четырех компонентов. 1.1. Поиск и получение информации из внутренних (сайты тер- риториальных органов МВД России, ресурсы ЕМТС и др.) и внеш- них (сайты органов государственной власти в субъекте РФ, сайты Росстата и др.) источников. 1.2. Предварительный анализ факторов внешней среды, заклю- чается в отборе факторов за счет их обобщения по группам (эконо- мические; социальные; демографические; географические; админи- стративно-территориальные; экономического развития; культур- ные; правовые факторы). 1.3. Формирование предположений о статистической зависимо- сти заключается в подборе функции, наилучшим образом описыва- ющей развитие процесса или явления. Функции могут быть отобра- ны по направлению действия связи (прямые и обратные), а также по аналитическому выражению (линейная зависимость, степенная, логарифмическая, экспоненциальная и др.). 1.4. Расчет структурно-динамических параметров исследу- емого вида преступности основывается на некоторых показате- 36 лях. Относительный показатель получается в результате деле- ния сравниваемого показателя с базой сравнения. Различают следующие показатели: структуры и динамики. Относительный показатель структуры характеризует долю отдельных частей в общем объеме совокупности и рассчитывается по формуле: Показатель, характеризующий часть сопокупности С = _________________________________________ Показатель по всей совокупности в целом Например: известно, что количество зарегистрированных пре- ступлений в 2018 г. составило 7 842,7 тыс., а число зарегистрирован- ных преступлений, совершенных в общественных местах в том же году – 2 834,6 тыс., то относительная величина динамики составля- ет 2 834,6 / 7 842,7 = 0,36. Следовательно, структура преступлений, совершенных в общественных местах в общем количестве зареги- стрированных преступлений составила 36 %. Относительный показатель динамики характеризует измене- ние какого-либо явления (процесса) во времени и рассчитывается по формуле: Текущий показатель Д = _________________________ Предшествующий показатель Например: известно, что количество зарегистрированных преступ лений в 2018 г. составило 7 842,7 тыс., а в 2017 – 7 203,3 тыс., то относительная величина динамики составляет 7 842,7 / 7 203,3 = 1,09. Следовательно, число преступлений выросло на 9 %. Для характеристики развития явления (процесса) во времени рассчитываются показатели интенсивности изменений. Абсолютный прирост (∆y) рассчитывается как разность двух уровней ряда. В случае сравнения каждого последующего уровня ряда со своим предыдущим он называется цепным: 37 Если в качестве базы сравнения берется один и тот же период, то прирост называется базисным: , где y 0 – период, принятый за базу сравнения. Темп прироста (Тпр) показывает, насколько изменился уровень изучаемого показателя и рассчитывается как отношение абсолют- ного прироста к уровню динамического ряда: Например: известно, что количество зарегистрированных престу- плений в 2018 г. составило 7 842,7 тыс., а в 2017 – 7 203,3 тыс., то темп прироста составляет (7 842,7 – 7 203,3) / 7 203,3 * 100= 8,87 %. Следо- вательно, число преступлений выросло на 9 %. 2. Второй этап включает два элемента. 2.1. Изучение отобранной и систематизированной информации. 2.2. Определение связи и влияния тех или иных факторов и усло- вий (детерминантов) на состояние правопорядка и эффективность оперативно-служебной деятельности. На данном этапе проводится корреляционный анализ, который позволяет выявить наличие связи между объектами (процессами, явлениями), а также силу связи между объектами (процессами, явлениями). В рамках данного элемента осу- ществляется построение поля корреляции, его интерпретация и оценка статистической значимости коэффициента. Оценка коэффициента кор- реляции обычно производиться на основе шкалы Чеддока, где 0,1–0,3 – слабая связь, 0,3–0,5 – умеренная связь, 0,5–0,7 – связь заметная, 0,7– 0,9 – связь высокая, 0,9–0,999 – связь очень высокая (близка к функ- циональной). На практике гипотеза о наличии статистической связи принимается, если коэффициент корреляции R >= 0,7 и R<= –0,7. 3. Третий этап заключается в выборе метода анализа (про- гнозирования). Одним из основных направлений информацион- но-аналитической работы является выявление и прогнозирова- ние тенденций и отклонений. В практической деятельности ОВД используются три основных метода анализа (прогнозирования). 38 3.1. Многофакторное моделирование. Данный метод более распро- странен в форме регрессионного анализа, который позволяет выявить характер связи между явлениями, а также построить и исследовать модель. Для нахождения неизвестных параметров модели использу- ется метод наименьших квадратов, разработанный немецким ученым Гауссом в XVIII в. Сущность данного метода состоит в том, что под- бирается теоретическая линия регрессии, которая должна пройти так, чтобы сумма квадратов отклонений от нее до каждого эмпирического значения была минимальной. Нестрого говоря, речь в данном случае идет о построении аппроксимирующей кривой, которая может иметь вид одной из функций (линейной, степенной, логарифмической и др.). Также, в рамках регрессионного метода, осуществляется отбор социально-экономических и иных факторов, корреляционный анализ и построение модели (парной, множественной) регрессии. В общем виде модель регрессии обычно представляется как: , где y – зависимая переменная, x – независимые переменные, β – оце- ниваемые параметры модели, n – количество факторов, ε – случайная компонента. 3.2. Статистическая экстраполяция динамических рядов. Дан- ный метод относиться к технологии анализа временных рядов и в качестве основного фактора, оказывающего влияние на ряд, является время. Экстраполяция – это отличный от интерполя- ции метод, который заключается в распространении выводов, полученных из наблюдения над одной частью явления, на другую его часть. Типовая структура временного ряда состоит из тренда, а также сезонной, циклической и случайной компонент. В каче- стве теоретической модели могут применяться как линейные, так и нелинейные (полиномы, логарифмические, степенные и др.) функции. В общем виде модель временного ряда обычно представляется как: , где y – зависимая переменная, t – независимая переменная (номер временного ряда), β – оцениваемые параметры модели, ε – случай- ная компонента. Типичный вид временного ряда с основными эле- ментами представлен на рис. 1: 39 Рис. 1. Временной ряд (кражи). 3.3. Методы экспертного прогнозирования (в данном курсе лек- ций данные методы не рассматриваются). 4. На последнем этапе осуществляется формулирование выводов и оценка сложившегося положения, а также подготовка конкретных предложений, содержащих в себе варианты (альтернативы) управ- ленческих воздействий на складывающуюся на обслуживаемой тер- ритории и объектах оперативную обстановку. Вопрос 2. Технологии оценки результатов деятельности ОВД Рассмотрим методику расчета оценки результатов деятельно- сти ОВД, закрепленную в приказе МВД России от 31 декабря 2013 г. № 1040 «Вопросы оценки деятельности территориальных органов Министерства внутренних дел Российской Федерации» (далее – Приказ). Комплексная оценка складывается из вневедомственной и ведомственной, в свою очередь последняя подразделяется на ста- тистическую оценку результатов деятельности территориального органа и экспертную оценку. Вневедомственная оценка основывает- ся на социологических опросах, отражающих общественное мнение населения. Общая экспертная оценка формируется на основе экс- пертных оценок, выставленных главными инспекторами и сотрудни- ками центрального аппарата МВД России по материалам зонального контроля по соответствующим направлениям деятельности. 40 Статистическая оценка осуществляется по показателям (25 – территориальные органы по субъектам и 21 – органы на транспорте), отражающим результаты оперативно-служебной деятельности тер- риториального органа МВД России (9 – территориальные органы по субъектам и 7 – органы на транспорте) по направлениям деятель- ности. Основным источником статистических данных являются агре- гированные данные из документов первичного учета уголовной стати- стики, обобщаемые ИЦ-ГИАЦ. Примечательно то, что нормотворец допускает разработку соб- ственной системы оценки, либо изменение показателей, характеризу- ющих оперативную обстановку, с сохранением подхода, изложенного в приказе. Вместе с тем изменение показателей, характеризующих общественное мнение, приказом запрещается. Объектом оценки являются: управления на транспорте Министер- ства внутренних дел Российской Федерации (далее – МВД России) по федеральным округам, Восточно-Сибирское и Забайкальское линей- ные управления МВД России на транспорте, министерства внутренних дел по республикам, главные управления, управления МВД России по иным субъектам Российской Федерации (далее – территориальные органы МВД России). Предметом оценки выступает эффективность выполнения основ- ных полномочий, возложенных на ОВД и реализуемых полицией и следственными подразделениями. Основным элементом статистической оценки является статисти- ческий показатель (далее – СП) который представляет собой относи- тельный показатель, характеризующий качественное и количественное состояние объекта (процесса, явления). Под критерием оценки понима- ется наилучшее значение СП среди оцениваемых объектов оценки. Оценочный показатель (далее – ОП) – это выраженное в баллах от 0 до 100 соотношение между СП и критерием оценки. При этом 100 баллов получает объект оценки, имеющий наилучшее (максимальное или мини- мальное) значение СП, а 0 баллов – объект, имеющий наихудшее (макси- мальное или минимальное) значение. Набранные баллы в остальных объ- ектов оценки распределяются соответственно значениям их СП. Для положительных СП наилучшим является максимальное его значение среди оцениваемых объектов и рассчитывается по формуле: 41 Для отрицательных СП наилучшим является минималь- ное его значение среди оцениваемых объектов и рассчитывается по формуле: , где СП max , СП min – соответственно максимальное (минимальное) значение СП. Итоговая оценка рассчитывается как средневзвешенное значе- ние ОП и рассчитывается по формуле аддитивной свертки, и стро- ится единый ранжир: , где Ki– коэффициенты значимости (являются отражением функции предпочтения ЛПР и принимают значение от 1 до 10), ОПi – оценоч- ные показатели, n – количество оценочных показателей. Для расчета итоговой оценки с равнозначными показателями, либо при отсутствии коэффициента значимости применяется формула . Экспертная оценка выставляется по двухбалльной шкале («удов- летворительно» или «неудовлетворительно») сотрудниками централь- ного аппарата МВД России. Таким образом, все оцениваемые статистические показатели делятся на две категории: положительные (характеризующие пози- тивный достигнутый результат) и отрицательные (характеризующие количественную сторону негативных явлений). Для свертывания оценочных показателей используется вычисле- ние их средневзвешенного значения, т. е. система оценки предусмат- ривает коэффициенты значимости (веса), присвоенные всем показа- телям, и отражающие то, в какой мере каждый отдельный показатель влияет на итоговую оценку. Существуют два вида оценочных показателей, характеризующие состояние (ОП с ) и динамику (ОП д ) относительного показателя, рас- 42 чет которого осуществляется по формулам, указанным выше. Средне- взвешенное значение состояние (ОП с ) и динамику (ОП д ) определяет- ся по формуле: Итоговая ведомственная оценка рассчитывается как средне- арифметическое значение итоговой статистической оценки и итого- вой экспертной оценки. Комплексная оценка деятельности (КОД) определяется как средневзвешенная сумма итоговой ведомственной оценки (ИВО) и итоговой вневедомственной оценки (ИВВО) по формуле: Изложенная система оценки называется технологией минимаксного оценивания и применяется в настоящее время для оценки эффективности деятельности территориальных орга- нов МВД России. Основой рассмотренного подхода является технология норми- рования показателей. Под нормированием понимается преобразова- ние формальных показателей, выражаемых в различных единицах, к безразмерному виду для их сопоставления и сравнения. Обычно задача нормирования сводиться к задаче многокритериального оце- нивания. Как правило, задача данного типа разбивается на несколь- ко последовательных подзадач: 1. Нормализация статистических показателей. 2. Определение критерия оценки, т. е. за счет какого критерия один объект лучше или хуже других. 3. Учет приоритетов критериев в тех случаях, когда из физического смысла ясно, что некоторые критерии имеют приоритет над другими. В статистике часто складывается ситуация, когда максимальное или минимальное значение носит характер статистического выбро- са – особой точки со значением сильно отличающимся от остальных. Применительно к деятельности ОВД, появление таких точек часто может рассматриваться как эксцесс и служить причиной проведения проверки с последующей трактовкой аномального значения. Нормальное распределение, также называемое распределением Гаусса, – это распределение вероятностей, которое играет важнейшую 43 роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она под- вержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение. Не является исключением и социальная сфера, где большинство величин стремится к нормальному распределению. |