Главная страница
Навигация по странице:

  • 1. Задание На сайте https://trudvsem.ru/opendata/datasets загрузите файл с расширением csv

  • Юникод ( UTF -8)

  • 2. Основные характеристики набора данных

  • 3. Распределение значений заработной платы

  • 4 Исследование характеристик вакансий

  • 4.2 Количество вакансий по типам предприятий

  • 4.3 Количество вакансий с разным видом занятости

  • ИТ лабораторная №3 отчёт-2. Работа с электронными таблицами. Часть Анализ данных


    Скачать 0.86 Mb.
    НазваниеРабота с электронными таблицами. Часть Анализ данных
    Дата15.05.2023
    Размер0.86 Mb.
    Формат файлаdocx
    Имя файлаИТ лабораторная №3 отчёт-2.docx
    ТипДокументы
    #1131451

    МИНОБРНАУКИ РОССИИ

    Федеральное государственное бюджетное образовательное учреждение

    высшего образования

    «Ижевский государственный технический университет имени М. Т. Калашникова»

    Кафедра АСОИУ

    ОТЧЁТ

    по лабораторной работе № 3

    по дисциплине «Информационные технологии»

    на тему «Работа с электронными таблицами. Часть 2. Анализ данных»

    Вариант 6
    Выполнил

    студент гр. Б22-780-4 А. Д. Харламова
    Проверил

    к.т.н., доцент кафедры АСОИУ А. Н. Соловьева

    Ижевск, 2022

    1. Задание
    На сайте https://trudvsem.ru/opendata/datasets загрузите файл с расширением csv по своему варианту вакансий Северо-Кавказского федерального округа. Создайте новую книгу и импортируйте в неё файл. При импорте укажите кодировку текста Юникод (UTF-8), а также, что в качестве разделителя используется символ | (вертикальная черта). Убедитесь, что данные таблицы загружаются корректно.


    Рисунок 1.1 - Скриншот табличного редактора с импортированным CSV-файлом вакансий Северо-Западного федерального округа.
    2. Основные характеристики набора данных
    Количество строк данных в исходном файле – 25667.

    Количество строк после удаления неверно загруженных строк – 25423.

    Количество вакансий, размещенных с начала этого календарного года – 24910.

    Доля этих вакансий относительно общего количества предложений – 0,97986.

    Формула расчета количества вакансий, размещенных с начала этого календарного года:

    1. Из столбца date_create выносим год в столбец Год_создания_вакансии по формуле =ГОД(@H:H)

    2. Рассчитываем количество вакансий, размещённых с начала этого календарного года по формуле =СЧЁТЕСЛИ(vacancy_6[Год_создания_вакансии];2022) в ячейку AJ5.

    Формула расчета доли этих вакансий относительно общего количества предложений:

    1. Делим количество вакансий, размещённых с начала 2022 года на общее количество вакансий по формуле =AJ5/СЧЁТ(vacancy_6[Год_создания_вакансии]), где AJ5 – количество вакансий, размещённых с начала 2022 года, а СЧЁТ(vacancy_6[Год_создания_вакансии]) – количество всех вакансий.

    Формула для преобразования значений столбца state_region_code в код субъекта РФ: =ЛЕВСИМВ(@W:W;2).

    На рисунке 2.1 представлены результаты расчета средних значений долготы и широты по каждому из субъектов РФ, представленных в наборе данных.



    Рисунок 2.1 - Результаты расчета средних значений долготы и широты по каждому из субъектов РФ.
    С помощью веб-сервиса https://www.bing.com/maps отметим на карте точки вычисленных значений координат, карта с точками представлена на рисунке 2.2.



    Рисунок 2.2 - Карта с отмеченными на ней точками из расчетов.
    Формула для заполнения столбцов salary_min:

    =(ЕСЛИ(ИЛИ([@[old_salary_min]] = 0; ЕПУСТО([@[old_salary_min]] )); [@[old_salary_max]]; [@[old_salary_min]]))

    Формула для заполнения столбцов salary_max:

    =(ЕСЛИ(ИЛИ([@[old_salary_max]] = 0; ЕПУСТО([@[old_salary_max]])); [@[old_salary_min]]; [@[old_salary_max]]))

    Минимальное значения заработной платы salary_min – 1528.

    Максимальное значения заработной платы salary_min – 300000.

    Среднее значение заработной платы – 21212,79.

    Медиана заработной платы – 16806.

    Мода заработной платы – 15279.

    Среднее значение заработной платы вычисляется по формуле: =СРЗНАЧ(vacancy_6[salary_min]), где столбец vacancy_6[salary_min] хранит в себе значения salary_min.

    Медиана заработной платы вычисляется по формуле: =МЕДИАНА(vacancy_6[salary_min]). Мода заработной платы вычисляется по формуле: =МОДА(vacancy_6[salary_min]). Результаты вычислений представлены на рисунке 2.3.


    Рисунок 2.3 – Результаты расчета среднего значения, медианы, моды заработной платы.
    Стандартное отклонение минимальной заработной платы – 10684,48.

    Стандартное отклонение максимальной заработной платы – 12719,24.

    Формула для расчета стандартного отклонения минимальной и макимальной заработной платы:

    =СТАНДОТКЛОН(vacancy_6[salary_min])

    =СТАНДОТКЛОН(vacancy_6[salary_max])

    Результаты вычислений представлены на рисунке 2.4.



    Рисунок 2.4 – Результаты расчета стандартного отклонения минимальной и максимальной заработной платы.
    3. Распределение значений заработной платы
    Построение гистограммы распределения заработной платы по столбцу salary_min происходит с помощью подключаемой надстройки “Пакет анализа”. Гистограмма представлена на рисунке 3.1.



    Рисунок 3.1 – Гистограмма распределения заработной платы по столбцу salary_min.

    Построение гистограмму распределения логарифма заработной платы происходит с помощью подключаемой надстройки “Пакет анализа” и вычисления логарифма от значений столбца salary_min. Гистограмма представлена на рисунке 3.2.



    Рисунок 3.2 – Гистограмма распределения логарифма заработной платы.

    Расчёт диапазонов средней заработной платы, заработной платы ниже средней и выше средней: сначала вычисляем логарифм по формулам: =10^4,26 - 1(нижняя граница диапазона средней заработной платы), =10^4,47 - 1(верхняя граница диапазона средней заработной платы). Если вычисленный логарифм <= 18196, то выводится «Ниже средней». Если вычисленный логарифм находится в диапазоне от 18196 до 29511, то выводится «Средняя». Если вычисленное значение превышает 29511, то выводится «Выше средней».

    Формула для вычисления столбца “Величина заработной платы”: =ЕСЛИ([@[salary_min]]<$AK$8; "Ниже средней";ЕСЛИ(И([@[salary_min]] >= $AK$8; [@[salary_min]] <= $AK$9); "Средняя"; "Выше средней"))
    4 Исследование характеристик вакансий

    4.1 Количество вакансий по каждому уровню образования

    На рисунке 4.1 представлена столбчатая диаграмма количества предложений по каждому уровню образования. Предварительно данные были перенесены из основного листа, отсортированы и сделан промежуточный итог.


    Рисунок 4.1 - Столбчатая диаграмма количества предложений по каждому уровню образования.
    4.2 Количество вакансий по типам предприятий
    На рисунке 4.2 представлена круговая диаграмма количества предложений по каждому типу предприятий.

    Рисунок 4.2 - Круговая диаграмма количества предложений по типу предприятий.
    4.3 Количество вакансий с разным видом занятости
    На рисунке 4.3 представлена, круговая диаграмма количества предложений по каждому виду занятости.
    Рисунок 4.3 - Круговая диаграмма количества предложений по виду занятости.

    4.4 Средняя заработная плата для вакансий с разным видом занятости
    На рисунке 4.4 представлена, столбчатая диаграмма значений средней заработной платы.
    Рисунок 4.4 - Столбчатая диаграмма значений средней заработной платы.


    написать администратору сайта