Анализ информативных признаков в базе kdd выполнили студенты 1го курса
Скачать 1.85 Mb.
|
Анализ информативных признаков в базе KDD Выполнили студенты 1-го курса Группы БС-21: Кирилин Алексей Хлобыстов Андрей Руднов Никита Рудаков Роман Баранов Владислав Переход из строковой формы в табличную1. Выделим основной столбец, на котором записаны все символы 2. Следом переходим во вкладку «Данные» и находим действие «Текст по столбцам» Разделение одного столбца на несколько 3. Далее высветиться окошко, в котором следует сделать несколько шагов: Выбрать вид разделения «с разделителями» Выбрать символ-разделитель: «знак табуляции» и «запятая» 4. Заменяем все точки на запятые Заходим во вкладку «Главная», находим действие «Найти и выделить» и выбираем пункт «заменить» В появившемся окне, вводим элементы, которые нужно найти и на которые нужно заменить Пример таблицы после выполнения всех действий Выбор типа атаки На данном этапе, вам следует выбрать один любой тип атаки и тип атаки «normal.» В нашем случае, мы рассмотрели тип атаки «nmap.» Фильтрация данныхДля того, чтобы выбрать именно тот тип атаки, который вам нужен, необходимо сделать фильтрацию тип атак и разновидностей сетевых подключений После фильтрации, в основной таблице всё так же будут все типы атак. Чтобы убрать их, нужно выделить всю табличку, нажать на действие «Найти и выделить» =>«Выделение группы ячеек…» Переход от качественных характеристик к количественным 1. Удаление дубликатов 2.Нумерация и распределение численных обозначений Этот анализ заключается в том, чтобы удалить ненужные (то есть имеющие только одну величину) столбцы, чтобы упростить поставленную задачу Нормализация данныхКорреляцияЕсли нету функции пакет анализовКорреляция
Внешний вид таблицы после Корреляции Регрессия Столбец со значениями типов атак (в нашем случая 42-ой столбец) Все остальные столбцы, с добавлением ещё одного столбца, где будут только единицы Расчет параметров уравнения Х Х Х Y Расчет теоретического значения Критерий Стьюдента Х Х Стандартные ошибки коэффициента регрессии Доверительные интервалы для коэффициента регрессии Спасибо за внимание |