Issn молодой учёныйМеждународный научный журналВыходит еженедельно 22 (156) Редакционная коллегия bГлавный редактор
Скачать 4.99 Mb.
|
. № 22 (156) . Июнь 2017 г. 144 Информатика REST-запроса на корпоративный портала также получение и разбор их результатов диспетчер занимается определением событий, поступающих на вход модуля, и вызовом соответствующего контроллера бизнес логика представляет из себя набор контроллеров, в которых запрограммирован алгоритм взаимодействия с системой, для каждого возможного события модуль логирования осуществляет регистрацию сообщений об ошибках в текстовых файлах; На рисунке 2 представлена схема данных программного модуля, отображающая общий маршрут движения и этапы обработки входной информации. Рис 2. Схема данных ПМ ИАП Входными данными модуля являются информация о телефонном вызове и название события. Они поступают через специальный AGI интерфейс телефонной станции, как аргументы командной строки. В зависимости от типа события входные данные отличаются по составу и количеству, содержат определенную для типа события информацию. Также при установке модуля в специальном файле настроек прописываются интернет адрес корпоративного портала, ключи код приложения, логин и пароль для авторизации в портале. Выходными данными являются управляющие последовательности команд для телефонной станции, а также файлы логирования хода выполнения программы и ошибок. Работа основного алгоритма начинается с разбора и анализа входных данных (событие, данные входящего или исходящего звонка для сохранения, параметры приводятся к строковому типу данных. Дальше происходит выбор соответствующего события контроллера. Далее, если поступает запрос на создание исходящего вызова, то из входных данных берется номер целевого абонента, формируется последовательность управляющих команд и отправляется в АТС. Если вызов уже совершен, то информация, которая поступила на вход, представляется в формате JSON-документа. После происходит сохранение информации в CRM- системе, с использованием протокола. Перед их выполнением происходит проверка авторизационного токена ив случае его истечения выполняется дополнительный запрос на продление авторизации. На заключительном этапе работы алгоритма, происходит разбор и анализ ответа от сервера. В случае, если ответ содержит ошибки или система недоступна, тов лог заносится соответствующее сообщение. Разрабатываемый модуль предназначен для интеграции АТС Asterisk с корпоративным порталом Би- трикс24, с использованием стандартных способов интеграции обеих систем. Модуль осуществляет автоматическую регистрацию входящих и исходящих вызовов в системе. Потенциальными пользователями являются колл-центры, а также компании активно использующие телефонную связь для работы с клиентами. Литература: 1. CRM (рынок России. CRM, Россия, Рынки, Рынки программное обеспечение // TAdviser — портал выбора технологий и поставщиков. URL: Статья CRM_(мировой_рынок) (дата обращения. Колдаев В. Д. Основы алгоритмизации и программирования учебное пособие. —: ФОРУМ ИНФРА-М, 2012. — 416 с. Home — Asterisk Project — Asterisk Project Wiki // Dashboard — Asterisk Project Wiki. URL: https://wiki.as- terisk.org/wiki/dashboard.action (дата обращения 31.05.2017). 4. RFC6690 — Constrained RESTful Environments (CoRE) Link Format // IETF Tools. URL: https://tools.ietf.org/ html/rfc6690 (дата обращения Классификация новостей сайта правительства Российской Федерации Чуриков Никита Сергеевич, студент Санкт-Петербургский государственный университет В данной работе рассматриваются подходы для классификации новостей с сайта правительства govern- ment.ru. Для этого были загружены документы за все года, с момента создания сайта. Так как у каждого документа может быть несколько категорий, то задача классификации является множественной классификацией меток (mutilabel calssification). Нами рассмотрены различные методы представления текстовой информации и классификации. Ключевые слова машинное обучение, классификация, правительство Введение Классификация текстовых документов является классической задачей в машинном обучении. Люди классифицируют объекты для облегчения ежедневных задач нахождения книги по жанру, новостей по интересующим тематикам, документов по категориями т. п. Существует несколько вариантов, как могут быть представлены данные перед построением модели они могут быть размечены экспертом и, зная эти категории, можно построить обучающую модель. В таком случае у каждого документа может быть одна категория (muliclass classification) [1], может быть несколько категорий (mutilabel classifica- tion) [1]. Также данные могут не иметь проставленных меток. В таком случае могут быть применены методы кластеризации или тематического моделирования [2]. Документы, представленные на сайте правительства РФ [3] имеют проставленные метки и при этом, один документ может иметь несколько категорий. Поэтому перед нами стоит задача множественной классификации (mutilabel Постановка задачи Дан набор текстовых документов D с проставленными метками Y для каждого из них. Необходимо построить модель, где d’ — некоторый новый текстовый документа предсказанный набор категорий. Анализ данных Рассмотрим документы, которые представлены на сайте правительства. Каждый документ имеет заголовок, краткое описание и приложенный текстовый файл. Также у него может быть от 1 до 5 категорий. Нами были выгружены документы с 2013 погода. Всего было получено 4606 документов. С полученным датасетом можно ознакомиться по ссылке [4]. Рассмотрим, сколько документов имеет различное количество категорий на Таблице В датасете представлены 34 категории, которые имеются в датасете, и сколько раз они встречаются в различных документах. Нами были выбраны категории, которые встречаются больше 100 раз, поскольку раньше этого числа, как правило, категории имеющие слишком локальный характер, например Оперативный штаб по урегулированию вопросов, связанных с временным приостановлением авиационного сообщения с Арабской Республикой Египет до 12.12.2015)». Поэтому на Рис. 1 представлено распределение выбранных 24 категорий. Предобработка текстовой информации Во-первых, важно исключить всевозможные стоп- слова из рассмотрения, вроде а, ты, мы, они и т. п. Во- вторых, исключим все слова, частота которых по документам ниже 5 и выше 80%. В третьих, лемматизируем их с помощью алгоритма snowball из библиотеки nltk Таблица Количество документов и количество категорий Документы/категории 1 2 3 4 5 Документы 4606 456 24 4 3 Молодой учёный» . № 22 (156) . Июнь 2017 г. 146 Информатика В итоге получим частоты лемм слов по документам. Затем найдем представление слов в виде векторов с помощью технологии word2vec [5] и отдельно нормализуем матрицу частот с помощью инвертированной частоты слов по документам (idf) Реализацию word2vec возьмем из библиотеки gensim [7], а предобратоку через idf возьмем sklearn [8]. Классификация Существует несколько подходов для работы с множественными категориями. Свести задачу множественной классификации к мно- гоклассовой. Для этого, необходимо для каждой категории документа выделить отдельный документ, продублировав его. Построить бинарную матрицу Y из множества категорий размерности [n ̆ k], где n — количество документов, а k — количество категорий. Соответственно каждый элемент матрицы будет означать наличие категории у документа значение 1) или отсутствие (значение 0). Используя такую матрицу можно построить множество классификаторов по правилу один против всех (one-vs-rest) [1]. Этот подход предусматривает отсутствие связи между категориями. Построить бинарную матрицу по правилу из пункта 2, однако для классификации воспользоваться правилом цепочки (chain rule) [9]. При построении классификатора по такому правилу учитывается то, насколько коррелируют друг с другом категории. В таком случае добавляется информация о том, насколько связаны категории, встречающиеся вместе. Нами будут применены все три подхода. Для сравнения эффективности алгоритмов воспользуемся стандартными метриками точностью (precision), полнотой (recall) и F1 мерой В качестве базового алгоритма классификации, воспользуемся алгоритмом Random Реализацию one-vs-rest и Random Forest возьмем из библиотеки sklearn [10]. А правило цепочки из skmul- tilearn [11]. Результаты После применения классификаторов к полученным данным, получается картина, представленная в Таблице 2. На ней введены следующие обозначения Тип классификатора — по какому правилу был построен классификатор OVR — один против всех CHAIN — по правилу цепочки SINGLE — задача сведена к многоклассовой классификации Тип подготовки данных — как были подготовлены текстовые данные TFIDF — нормализованные частоты слов; Рис. 1. Распределение категорий “Young Scientist” . #22 (156) . June 2017 147 Computer Science • W2V — вектора слов полученные, с помощью word2vec, а для каждого документа суммируем все полученные вектора precision — точность. Определяет, сколько раз был найден релевантный документ среди всех найденных recall — полнота. Определяет, сколько раз был найден релевантный документ среди всех релевантных f1 — среднее гармоническое между двумя величинами. Как видно в Таблице 2, самые точные результаты получаются с помощью цепного правила и применением преобразованием текстов с помощью tfidf. При этом, CHAIN уступает OVR по полноте выдаваемых результатов, наиболее полные результаты получаются при сведении задачи к многоклас- совой классификации. Также видно, что представление слов в виде векторов не повышает точности классификации. Выводы По полученным результатам можно судить, что категории являются независимыми, поскольку точность классификации возрастает, при использовании более продвинутого подхода — цепного правила, однако полнота падает. Также можно сделать такой вывод, поскольку полнота, полученная при многоклассовой классификации, является значительно выше полноты из множественной классификации. Применение продутых технологий, вроде word2vec также не повышает точности, что может означать, что полученные вектора слов не отражают категории слов. Заключение По полученным данным, получается, что если требуется получить наиболее точные результаты классификации документов, то лучше всего справляется представление слов через tfidf и построение классификатора с помощью цепного правила. Если требуется получать как можно более разнообразные категории, то лучше всего с этой задачей справляется сведение задачи множественной классификации к многоклассовой. Литература: 1. Многоклассовая и множественная классификации на sklearn [Интерент ресурс http://scikit-learn.org/stable/ modules/multiclass.html (дата обращения 29.05.2017) 2. Document Clustering with Python [Интерент ресурс http://brandonrose.org/clustering (дата обращения 29.05.2017) 3. Сайт правительства РФ Интернет ресурс http://government.ru (дата обращения 29.05.2017) 4. Выгруженные данные си обувная word2vec модель Интернет ресурс https://yadi.sk/d/ dOGUKF9R3Hs9WT (дата обращения 29.05.2017) 5. Mikolov, T., Sutskever, I., Chen, K., Greg S. C., Dean, J. Distributed Representations of Words 6. Manning C.\: D., Raghavan P. and Schutze H. Introduction to Information Retrieval // Cambridge University Press 2008. 7. Radim R., Sojka P. Software Framework for Topic Modelling with Large Corpora // Proceedings of the LREC2010 Workshop on New Challenges for NLP Frameworks. Valletta, Malta: ELRA, 2010. С. 45–50. 8. TfidfVectorizer Интернет ресурс http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction. text.TfidfVectorizer.html#sklearn.feature_extraction.text.TfidfVectorizer (дата обращения 29.05.2017) 9. Read, J., Pfahringer, B., Holmes, G. et al. Mach Learn (2011) 85: 333. 10. Random Forest classifier [Интерент ресурс http://scikit-learn.org/stable/modules/generated/sklearn.ensemble. RandomForestClassifier.html (дата обращения 29.05.2017) 11. Szyma P., Kajdanowicz, T. A scikit-based Python environment for performing multi-label classification // ArXiv e-prints. Таблица Результаты классификации Тип классификатора Тип подготовки данных 0.40 0.53 CHAIN TFIDF 0.90 0.38 0.51 OVR W2V 0.83 0.22 0.33 CHAIN W2V 0.84 0.23 0.34 SINGLE TFIDF 0.61 0.61 0.60 SINGLE W2V 0.45 0.44 0.44 Молодой учёный» . № 22 (156) . Июнь 2017 г. 148 Педагогика П ЕДА ГО ГИКА bbВидовое многообразие педагогических инноваций в различных сферах деятельности ДОО Аристова Мария Павловна, магистрант Пермский государственный гуманитарно-педагогический университет С изменением статуса дошкольного образования в системе общего образования государство стало предъявлять к нему новые требования. Главное из них — это развитие. При этом сегодня само понятие развитие тесно сплетается идеей инновации. Инновация— это внедрённое новшество, обеспечивающее качественный рост эффективности процессов или продукции, востребованное рынком. Создание вектора инновации обусловливает разработку критериальной матрицы, включающей в себя такие критерии, которые позволили бы оценить эффективность той или иной инновации. Учитывая уже сложившуюся исследовательскую модель в области педагогики, представляется возможным обозначить следующий ряд критериев педагогических новаций новизна, оптимальность, высокая результативность, возможность творческого применения в массовом опыте. Наиболее релевантным критерием инновации является новизна, которая равно соотносится как с оценкой научно-педагогических студий, таки с последними достижениями педагогической рефлексии и праксиса. Именно исходя из этого, педагогу, имеющему желание встроить инновационный процесс в свою профессиональную практику, необычайно важно изучить конкретную сущность предлагаемой новации, определить, какой именно здесь уровень новизны. Однако, при такой критериальной матрице начинают играть определяющую роль именно личностные качества педагога кому-то это покажется действительно новым, другому оно таковым не покажется. Поэтому при включении педагогов в инновационную деятельность необходимо опираться наследующие принципы добровольность, учёт личностных, индивидуально-психологических характеристик. Инновации представляется возможным условно разделить на уровни абсолютные, локально-абсолютные, условные, субъективные, последние отличались бы уровнем известности и областью применения (МС. Бургин). Использование такого критерия как оптимальность и внедрение его в критериальную матрицу оценки эффективности педагогических инноваций позволит соотнести затраченные учителями и учащимися усилия и средства с достигнутыми ими результатами. Не секрет, что разные педагоги обладают разными характеристиками труда, и при всей разности начальных условий и личных усилий, а также усилий учащихся, они могут получать одинаково высокие результаты. Судить об оптимальности педагогических инноваций мы можем за счёт сопоставления прикладываемых усилий и достигаемых результатов — чем менее интенсивны в физическом, ментальном и временном плане первые и при этом выше вторые, тем большей оптимальностью обладает инновация. Следующий наиболее значимый критерий — результативность. Она предполагает устойчивый характер результатов педагогов. Результат при этом мыслится как обладающий принципиальной измеримостью, эмпирической наблюдаемостью, изначально подверженным фиксации, а также не допускающим множественную интерпретацию — то есть, однозначным. Именно поэтому результативность является важнейшим критерием при определении релевантности новых приемов и способов обучения и воспитания. Ещё одним критерием педагогической инновации является принципиальная массовость, возможная тиражи- руемость инновации (конечно же, с неизбежными творческими трансформациями. На самом деле, по нашему мнению, в случае, если новация остаётся ограниченной в своём использовании специфическими факторами, необходимостью использования сложных приборов, спецификой обучения, особенностями личной педагогической деятельности и т. д, тона наш взгляд, данная новация не является ценной педагогической инновацией и не может рассматриваться как возможность улучшить, оптимизировать образовательный процесс в целом. Напротив же, если новшество показывает свою состоятельность в практической деятельности педагогов и воспитателей, то, разумеется, после апробации и демонстрации эффективности, оно должно быть тиражируемо и рекомендовано к повсеместному использованию. Понимание указанной критериальной матрицы, а также умение применять её в личной педагогической деятельности для определения эффективности инновации открывает новые перспективы для педагогического твор- чества. Изучение источников, посвященных данной проблеме, а также практики внедрения инноваций демонстрирует слабый роста в некоторых случаях даже стагнацию в сфере использования педагогических инноваций деятельности педагога. Такой слабой применимости инноваций представляется возможным отыскать две причины. Во-первых, использование инноваций никак не отражается в чек-листах профессиональных проверок, а также зачастую не выступает критерием при внутренней оценке деятельности педагога. Во-вторых, оказалось, что до сих пор внедрение инноваций тормозится банальной технической неподготовленностью, а также неготовностью многих педагогов понять важность оптимизации образовательного процесса. Таким образом, эти две причины можно условно обозначить как вертикальную (организационную) и горизонтальную (личностную). Однако, именно понимание содержания новаций, владение методами оценки их эффективности, а также методиками их применения открывают перед отдельным педагогами всей организацией возможность грамотного управления и прогнозирования образовательного процесса, и, как следствие, оптимизации усилий для получения как можно более качественного результата, что не только отразится на формальных показателях учреждения, но и окажется неоценимым вкладом в образовательный багаж обучающихся. Именно подчёркнуто формальное отношение, упорна официальные постановления часто приводит к неэффективному использованию инноваций, которые потом очень скоро стираются из практики заведения. Поэтому важным этапом инновационного процесса сегодня представляется формирование так называемой инновационной среды в образовательных учреждениях. Под инновационной средой мы понимаем общий психологический климат, индивидуализирующую среду, которая обеспечивалась бы целой совокупностью мероприятий организационного, методического, психологического характера. Невозможность сиюминутного создания такого климата «инновационности» обусловливается неготовностью педагогов, отсутствием информации инновационного характера, представленностью педагогов в этом вопросе самим себе. Поэтому не менее важным оказывается создание инновационного климата внутри педагогического коллектива, предотвращающего стереотипи- зацию педагогического творческого мышления. Педагогические инновации стали очень важной частью функционирования любой дошкольной образовательной организации. Инновации реализуются посредством различных форм, одной из которых является инновационный образовательный проект. Инновационный образовательный проект — это система целевых установок и программ по их достижению, включающих научно-исследовательские, технологические, организационные, финансовые и иные мероприятия, обеспечивающие эффективное решение конкретной задачи (проблемы) в области образования и приводящие к инновации (новшеству). Инновационный проект может быть направленна изменения в следующих сферах в управлении ДОО, ее структуре в обучении и воспитании в подготовке кадров. Инновации в управлении разнообразны. Они могут касаться как самой модели управления дошкольной образовательной организации, таки ее структурных компо- нентов. Структура управления — система очень консервативная и малое количество управленцев готовы к ее изменению. В последние годы инновациями в данной сфере считается введение новых моделей управления. Появление советов ДОО, в которые входят представители родителей воспитанников детского сада и педагогов. В пол- номочия-таки советов входит принятие ООП ДОО; обсуждение и решение вопросов развития ДОО; обеспечение необходимой материально-технической базы учреждения для реализации образовательного процесса, обсуждение и принятие решения об использовании денежных средств и иной материальной собственности детского сада. Анализируя полномочия данного совета, мы можем сделать вывод о том, что он принимает непосредственное участие в управлении наряду с заведующим. Организация различных творческих групп по проблемам или советов педагогов это еще одна область инноваций в управлении ДОО. Творческая группа — это добровольное объединение педагогов, организованное для успешного решения образовательных, педагогических, развивающих и воспитательных задач, стоящих перед ДОО. Они организуются для разработки и реализации различных проектов и программ в условиях образовательного процесса в соответствии с задачами ФГОС. Инновации в обучении и воспитании очень разнообразны. Они охватывают различные аспекты. Они могут затрагивать структуру образовательного процесса (новые методы организации занятий или совместной и самостоятельной деятельности детей новые системы оценивания достижения дошкольниками результата деятельности и тд). Кроме того это могут быть совершенно новые методики развития ребенка, методики обучения детей счету и т. д. Для реализации инноваций в дошкольной образовательной организации требуются компетентные педагоги. Подготовка таких педагогов — это тоже инновация. К ним можно отнести тьюторство; программы переподготовки кадров, нацеленные на повышение компетентности педагогов дистанционное обучение на базе педагогических вузов новые технологии и методики обучения. Однако, не стоит забывать, что введение инноваций в образовательный процесс — не одностороннее явление, а комплексное, охватывающее как образовательные учреждения, таки саму семью — важнейшую среду воспитания. Таким образом, хоть официально мы и отделяем Молодой учёный» |