Предобработка данных в текстовом редакторе и редакторе таблиц. Предобработка данных в текстовом редакторе и редакторе таблиц
Скачать 3.32 Mb.
|
Федеральное агентство связи Федеральное государственное бюджетное образовательное учреждение высшего образования «Поволжский государственный университет телекоммуникаций и информатики» Факультет информационных систем и технологий Кафедра Прикладной информатики «Основы сбора и обработки больших данных» Лабораторная работа №1 «Предобработка данных в текстовом редакторе и редакторе таблиц» Выполнил: Студент группы ПИ-91 Таликин Д.Ю Проверил: Козлов В.В Самара 2022г. Цель работы: получить базовые навыки предобработки данных в текстовом редакторе таблиц. Ход выполнения лабораторной работы: Открыл файл с данными в текстовом редакторе (Блокнот): При помощи глобальной замены (Ctrl+H) заменил символ-разделитель: Открыл изменённый файл в редакторе таблиц Excel и добавил названия столбцов: Я выбрал целевую переменную (столбец) – Рейтинг. Выполнил фильтрацию целевой переменной по двум значениям: Выполнил фильтрацию по одному значению двух независимых переменных: Добавил три столбца разными способами: Способ 1: Способ 2: Способ 3: Добавил новый столбец: Раскрасил ячейки получившегося нового целевого столбца исходя из их значений двумя способами: Способ 1: Способ 2: Построил три вида гистограмм: Выполнил умножение столбца на константу (const=2): Выполнил сложение двух столбцов: Нашёл максимальное, минимальное и среднее значения для определённого столбца: Сравнил значения двух столбцов и посчитал количество совпадений и не совпадений: Выполнил поиск дубликатов: Выполнил поиск выбросов в данных: Первый квартиль (Q1) определяется как среднее число между наименьшим числом (минимумом) и медианой набора данных. Он также известен как нижний или 25-й эмпирический квартиль, так как 25% данных находятся ниже этой точки. |