ИТ лабораторная №3 отчёт-2. Работа с электронными таблицами. Часть Анализ данных
Скачать 0.86 Mb.
|
МИНОБРНАУКИ РОССИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Ижевский государственный технический университет имени М. Т. Калашникова» Кафедра АСОИУ ОТЧЁТ по лабораторной работе № 3 по дисциплине «Информационные технологии» на тему «Работа с электронными таблицами. Часть 2. Анализ данных» Вариант 6 Выполнил студент гр. Б22-780-4 А. Д. Харламова Проверил к.т.н., доцент кафедры АСОИУ А. Н. Соловьева Ижевск, 2022 1. Задание На сайте https://trudvsem.ru/opendata/datasets загрузите файл с расширением csv по своему варианту вакансий Северо-Кавказского федерального округа. Создайте новую книгу и импортируйте в неё файл. При импорте укажите кодировку текста Юникод (UTF-8), а также, что в качестве разделителя используется символ | (вертикальная черта). Убедитесь, что данные таблицы загружаются корректно. Рисунок 1.1 - Скриншот табличного редактора с импортированным CSV-файлом вакансий Северо-Западного федерального округа. 2. Основные характеристики набора данных Количество строк данных в исходном файле – 25667. Количество строк после удаления неверно загруженных строк – 25423. Количество вакансий, размещенных с начала этого календарного года – 24910. Доля этих вакансий относительно общего количества предложений – 0,97986. Формула расчета количества вакансий, размещенных с начала этого календарного года: 1. Из столбца date_create выносим год в столбец Год_создания_вакансии по формуле =ГОД(@H:H) 2. Рассчитываем количество вакансий, размещённых с начала этого календарного года по формуле =СЧЁТЕСЛИ(vacancy_6[Год_создания_вакансии];2022) в ячейку AJ5. Формула расчета доли этих вакансий относительно общего количества предложений: 1. Делим количество вакансий, размещённых с начала 2022 года на общее количество вакансий по формуле =AJ5/СЧЁТ(vacancy_6[Год_создания_вакансии]), где AJ5 – количество вакансий, размещённых с начала 2022 года, а СЧЁТ(vacancy_6[Год_создания_вакансии]) – количество всех вакансий. Формула для преобразования значений столбца state_region_code в код субъекта РФ: =ЛЕВСИМВ(@W:W;2). На рисунке 2.1 представлены результаты расчета средних значений долготы и широты по каждому из субъектов РФ, представленных в наборе данных. Рисунок 2.1 - Результаты расчета средних значений долготы и широты по каждому из субъектов РФ. С помощью веб-сервиса https://www.bing.com/maps отметим на карте точки вычисленных значений координат, карта с точками представлена на рисунке 2.2. Рисунок 2.2 - Карта с отмеченными на ней точками из расчетов. Формула для заполнения столбцов salary_min: =(ЕСЛИ(ИЛИ([@[old_salary_min]] = 0; ЕПУСТО([@[old_salary_min]] )); [@[old_salary_max]]; [@[old_salary_min]])) Формула для заполнения столбцов salary_max: =(ЕСЛИ(ИЛИ([@[old_salary_max]] = 0; ЕПУСТО([@[old_salary_max]])); [@[old_salary_min]]; [@[old_salary_max]])) Минимальное значения заработной платы salary_min – 1528. Максимальное значения заработной платы salary_min – 300000. Среднее значение заработной платы – 21212,79. Медиана заработной платы – 16806. Мода заработной платы – 15279. Среднее значение заработной платы вычисляется по формуле: =СРЗНАЧ(vacancy_6[salary_min]), где столбец vacancy_6[salary_min] хранит в себе значения salary_min. Медиана заработной платы вычисляется по формуле: =МЕДИАНА(vacancy_6[salary_min]). Мода заработной платы вычисляется по формуле: =МОДА(vacancy_6[salary_min]). Результаты вычислений представлены на рисунке 2.3. Рисунок 2.3 – Результаты расчета среднего значения, медианы, моды заработной платы. Стандартное отклонение минимальной заработной платы – 10684,48. Стандартное отклонение максимальной заработной платы – 12719,24. Формула для расчета стандартного отклонения минимальной и макимальной заработной платы: =СТАНДОТКЛОН(vacancy_6[salary_min]) =СТАНДОТКЛОН(vacancy_6[salary_max]) Результаты вычислений представлены на рисунке 2.4. Рисунок 2.4 – Результаты расчета стандартного отклонения минимальной и максимальной заработной платы. 3. Распределение значений заработной платы Построение гистограммы распределения заработной платы по столбцу salary_min происходит с помощью подключаемой надстройки “Пакет анализа”. Гистограмма представлена на рисунке 3.1. Рисунок 3.1 – Гистограмма распределения заработной платы по столбцу salary_min. Построение гистограмму распределения логарифма заработной платы происходит с помощью подключаемой надстройки “Пакет анализа” и вычисления логарифма от значений столбца salary_min. Гистограмма представлена на рисунке 3.2. Рисунок 3.2 – Гистограмма распределения логарифма заработной платы. Расчёт диапазонов средней заработной платы, заработной платы ниже средней и выше средней: сначала вычисляем логарифм по формулам: =10^4,26 - 1(нижняя граница диапазона средней заработной платы), =10^4,47 - 1(верхняя граница диапазона средней заработной платы). Если вычисленный логарифм <= 18196, то выводится «Ниже средней». Если вычисленный логарифм находится в диапазоне от 18196 до 29511, то выводится «Средняя». Если вычисленное значение превышает 29511, то выводится «Выше средней». Формула для вычисления столбца “Величина заработной платы”: =ЕСЛИ([@[salary_min]]<$AK$8; "Ниже средней";ЕСЛИ(И([@[salary_min]] >= $AK$8; [@[salary_min]] <= $AK$9); "Средняя"; "Выше средней")) 4 Исследование характеристик вакансий 4.1 Количество вакансий по каждому уровню образования На рисунке 4.1 представлена столбчатая диаграмма количества предложений по каждому уровню образования. Предварительно данные были перенесены из основного листа, отсортированы и сделан промежуточный итог. Рисунок 4.1 - Столбчатая диаграмма количества предложений по каждому уровню образования. 4.2 Количество вакансий по типам предприятий На рисунке 4.2 представлена круговая диаграмма количества предложений по каждому типу предприятий. Рисунок 4.2 - Круговая диаграмма количества предложений по типу предприятий. 4.3 Количество вакансий с разным видом занятости На рисунке 4.3 представлена, круговая диаграмма количества предложений по каждому виду занятости. Рисунок 4.3 - Круговая диаграмма количества предложений по виду занятости. 4.4 Средняя заработная плата для вакансий с разным видом занятости На рисунке 4.4 представлена, столбчатая диаграмма значений средней заработной платы. Рисунок 4.4 - Столбчатая диаграмма значений средней заработной платы. |